Browsing by Author "Sümer, Emre"
Now showing 1 - 14 of 14
- Results Per Page
- Sort Options
Item Akciğer grafiklerinde nodül gelişiminin izlenmesi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2015) Engin, Muharrem; Sümer, EmreBu çalışmada akciğer grafilerinden nodüllerin gelişimlerini otomatik olarak tespit eden bir sistem önerilmiştir. Akciğer nodülleri yaygın olarak görülen bir rahatsızlıktır. Nodüller, tomografi gibi nispeten daha riskli ya da MRI gibi daha pahalı yöntemlerle kesin sonuçlar alınarak izlenebilir. Ancak, röntgen ile görüntüleme yöntemi yaygın kullanılmasının yanı sıra düşük maliyetlidir. Nodüllerin gelişimlerinin kısa aralıklarla röntgen yöntemi ile takip edilmesi birçok açıdan fayda sağlamaktadır. Bir hastaya ait nodül gelişim değerlendirmesinin yapılabilmesi için iki farklı zamanda çekilen görüntüleri üst üste bindirmek gerekir. Üst üste bindirme yapabilmek için özellik eşleştirme yöntemleri kullanılarak homografi matrisi elde edilmiş ve sonrasında görüntü çakıştırma işlemi gerçekleştirilmiştir. Görüntü çakıştırmanın başarısını tespit edebilmek için elle işaretlenen, aynı olduğu bilinen noktaların uzaklık karşılaştırılması yapılmıştır. Ayrıca başarımın ölçümü için kapalı alan bilgisine dayanan bir yöntem önerilmiştir. Görüntü çakıştırıldıktan sonra konum bilgisine göre her iki resimdeki eşleşen nodüller tespit edilmiştir. İlk resimde eşleşmeyen nodüllerin kaybolduğu, daha sonra çekilen görüntüdeki nodüllerin yeni ortaya çıktığı değerlendirilmiştir. Nodüller, görüntü üzerinde piksel kümesinden oluşan kapalı alan olarak değerlendirilmiş olup eşleşmeden sonra kapalı alanların oluşturduğu alan bilgileri hesaplanarak büyüme ya da küçülme durumları sayısal olarak ortaya konulmuştur. Sonuç olarak, gerek görüntü çakıştırma gerekse nodül eşleştirme ve gelişim analizinde tatmin edici sonuçlar elde edilmiştir. In this study a system that automatically detects the prognosis of nodules from chest X-ray data is proposed. Lung nodules are commonly seen as an illness. Nodules can be precisely monitored with a more riskful to human health methods such as CT or more expensive methods such as MR. However, X-ray imaging is a low cost method as well as its widespread usage. Monitoring the nodules in short intervals by X-ray method, gives benefits in many aspects. X-ray data taken at two different times must be overlapped to perform the assessment. By using feature matching methods homography matrix is calculated and then image registration is performed. To assess the registration success, the distance between the identical points which are selected manually, are compared. In addition, a method based on closed contour information is proposed to measure the success. According to nodule position, matched nodules are determined after image registration. Unmatched nodules on the first image are evaluated as lost while those on the second image are evaluated as newly appeared. Nodules are considered as closed contours consisting of pixel set where closed contour area is calculated after nodule matching process. In this way growth and shrink states are determined numerically. As a result, satisfactory results are obtained, both for the image registration and the process of nodule matching and prognosis.Item Bilgisayarla görü tabanlı satranç oyunu izleme sistemi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2016) Koray, Can; Sümer, EmreBu çalışmada satranç müsabakalarındaki hakemlerin karar verme sürecine destek olabilecek, müsabaka boyunca yapılan hamleleri tespit edebilen ve tespit ettiği hamleleri yorumlayabilen gerçek-zamanlı bir bilgisayarla görü sistemi önerilmiştir. Önerilen sistem için oyun sırasında taşların hareketlerinin okunması amacıyla bir düzenek hazırlanmıştır. Kurulan düzenekte, satranç tahtası üzerinde konumlandırılmış bir RGB web kamerası ve bir dizüstü bilgisayar kullanılmıştır. Sistemin tüm işlem adımları, sayısal hesaplamaya olanak sağlayan MATLAB programlama ortamında gerçekleştirilmiştir. Uygulamada herhangi bir satranç motoru kullanılmamıştır. Bilgisayarla görü sistemi hamle algılama ve hamle yorumlama olmak üzere iki farklı bölümde ele alınıp incelenmiş ve test edilmiştir. Hamle algılama bölümünde kamera aracılığıyla elde edilen anlık görüntüler tek tek işlenerek hamle tespiti yapılmış ve satranç taşlarının konum ve renk bilgisi belirlenmiştir. Bu süreçte satranç tahtasının geometrik doğrultmasının yapılması ve elde edilen görüntülerin iyileştirilmesi gibi birtakım ön işlemler uygulanmıştır. Hamle yorumlama bölümünde ise, satranç tahtası üzerinde meydana gelen renk değişimlerinin oyuncunun yapmış olduğu bir hamle olup olmadığı belirlenmiştir. Eğer oyuncu tarafından bir hamle yapılmışsa, yapılan hamlenin geçerli bir hamle olup olmadığı değerlendirilip gerekli uyarı mesajları kullanıcıya iletilmiştir. Satranç oyunundan elde edilen verilerin yeniden yapılandırılıp 2-B olarak görselleştirilmesi ve hamle kayıtları önerilen sistemin sunduğu çıktılardır. Farklı ışık koşulları altında yapılan testlerde önerilen sistemin hem hamle algılama hem de hamle yorumlama açısından başarılı sonuçlar elde ettiği görülmüştür. In this study, a real time computer vision system that can detect and analyse moves in a chess game to support referees' decision making processes is proposed. A setup is established for suggested system to detect moves during a chess game. In this setup, there is laptop computer and a RGB web camera, which is positioned over the chess board. All of the steps in the process are programmed in MATLAB computing environment. The proposed computer vision system is not using any third party chess engine, and it is handled and tested in two parts; (i) move detection and (ii) move interpretation. In move detection part, snapshots taken by web camera are processed one by one. For each snapshot, color and position of each chess piece are computed. In the preprocessing stage, outside border of chess board is calculated and the image is geometrically adjusted and enhanced. In move interpretation part, color changes over the chess board are analyzed and the system decides whether these changes are interpreted as a move by player or not. If it is a move by a player, this move is validated whether it is a legal move or not. Results are obtained and user is notified accordingly. Besides, the results are visualized in a 2D environment and logged by the proposed system. Tests show that the system is evaluated to be successful in both move detection and interpretation under different illimunation conditions.Item Bir örnekle öğrenme yaklaşımı kullanılarak çatı tipi sınıflandırması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2023) Olcer, Naim; Sümer, EmreSon zamanlarda, Evrişimsel Sinir Ağları tabanlı metotlar uzaydan çekilmiş görüntüler üzerinde çatı tipi sınıflandırması yapmak için sıkça kullanılmaktadır. Bu metotlar ile yapılan sınıflandırma işlemlerinde en önemli sorun ilgili metotların çok fazla sayıda eğitim verisine ihtiyaç duymasıdır. İnsanların bir nesneyi tanıması için genelde bir veya birkaç örnek yeterlidir. Bir örnekle öğrenme yaklaşımı da aynı insan beyni gibi yalnızca bir veya birkaç eğitim örneğinden nesne kategorileri hakkında bilgi edinmeyi amaçlamaktadır. Bu metot, çok büyük miktarda veri kullanmak yerine her bir sınıf için yalnızca birkaç adet örnek kullanılarak öğrenme sağlayan bir yaklaşımdır. Bu çalışmada, Siyam Sinir Ağları modelini temel alan bir örnekle öğrenme yaklaşımı kullanılarak eğitim için az sayıda örnek ile çatı tipi sınıflandırması yapılmıştır. Eğitim için kullanılan resimler çatı verisi bulma zorluğu nedeniyle yapay olarak üretilmiştir. Test için de gerçek çatı resimlerinden oluşan iki farklı veri kümesi kullanılmıştır. Test ve eğitim veri kümeleri Teras (Flat), Beşik (Gable) ve Kırma (Hip) olmak üzere 3 farklı çatı tipinden oluşmaktadır. Yapay olarak üretilen resimlerle eğitilen Siyam Sinir Ağı modelinin ilk veri kümesine ait çatı resimleri ile test edilmesi sonucunda ortalama %66’lık bir sınıflandırma başarımı sağlanırken ikinci veri kümesi ile bu oran %85 olarak hesaplanmıştır. Aynı veriler Evrişimsel Sinir Ağları ve Destek Vektör Makineleri ile de test edilmiş, en yüksek başarımın Siyam Sinir Ağı modeli ile elde edildiği görülmüştür. Recently, Convolutional Neural Network-based methods have been used frequently for roof-type classification on images taken from space. The most important problem with classification processes using these methods is that they require a large amount of training data. Usually, one or a few samples are enough for a human to recognise an object. Like the human brain, the One-Shot Learning approach aims to learn object categories with just one or a few training examples per class, rather than using huge amounts of data. In this study, roof-type classification was carried out with a few training examples using the one-time learning approach and the so-called Siamese Neural Network method. The images used for training were artificially produced due to the difficulty of finding roof data. Two different data sets consisting of real roof pictures were used for the test. The test and training data set consisted of three different roof types: Flat, Gable and Hip. Finally, the Siamese Neural Network model, which was trained with artificially produced pictures, achieved an average classification performance of 66% as a result of testing with real roof pictures. With the other data set prepared, a classification success of 85% was achieved. The same data were also tested with Convolutional Neural Networks and Support Vector Machines, and it was found that the highest success was achieved with the Siamese Neural Network model.Item Derin öğrenme teknikleri kullanılarak kemik kırığı tespiti ve sınıflandırması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2021) Açıcı, Koray; Sümer, EmreProksimal femur kırıklarının özellikle yaşlı nüfusu etkileyen ciddi bir sağlık sorunu olduğu bilinmektedir. Önümüzdeki yıllarda artan nüfusla birlikte vaka sayısının ikiye katlanacağı tahmin edilmektedir. Femoral kırıkların teşhisi için düz frontal pelvik radyografiler (PXR'ler) düşük maliyetleri nedeniyle yaygın olarak kullanılmaktadır. Ne yazık ki, tüm kalça kırıklarının %2'sinin PXR ile teşhis edilemediği belirtilmektedir. Bu durum yanlış tanıya yol açmakta, iyileşme sürecini engellemekte, tedavi maliyetlerini artırmakta ve hastaların yaşam kalitelerini düşürmektedir. Bu nedenle, kanonik makine öğrenimi algoritmalarının ve derin öğrenme mimarilerinin kırık tespiti ve sınıflandırmasında kullanımı, doğru teşhis ve tedaviye yardımcı olmak için artmaktadır. Buradan yola çıkılarak, tez çalışması kapsamında femur boyun kırığı tespiti ve femur kırığı sınıflandırması çalışmaları gerçekleştirilmiştir. Femur boyun kırığı tespiti çalışmasında sıfırdan bir CNN mimarisi önerilerek tasarlanmış ve dengeli ve dengesiz iki veri kümesi üzerinde deneyler yapılmıştır. GA ve PSO üst-sezgisel optimizasyon algoritmaları kullanılarak, önerilen CNN mimarisinin evrişimsel katmanlarındaki filtre boyutları ve bu katmanlarda üretilen öznitelik haritası sayıları optimize edilmeye çalışılmış ve başarım ölçütleri üzerinden performans artışı sağlandığı ortaya konmuştur. Femur kırığı sınıflandırması çalışmasında ise hazır CNN mimarileri transfer öğrenme yöntemiyle mevcut probleme uyarlanarak deneyler yürütülmüş ve performansları karşılaştırılmıştır. Hazır CNN mimarilerinin evrişimsel katmalarında otomatik olarak üretilen öznitelikler kanonik makine öğrenme sınıflandırıcılarını beslemek için kullanılmıştır. Tespit ve sınıflandırma çalışmalarında elde edilen performanslara göre derin öğrenme mimarilerinin kanonik sınıflandırıcılara üstün geldiği gözlemlenmiştir. It is known that proximal femur fractures are a serious health problem affecting especially the elderly population. It is estimated that the number of cases will double in the next three decades with the increasing population. To diagnose femoral fractures plain frontal pelvic radiographs (PXRs) are widely used due to their low cost. Unfortunately, it was stated that 2% of all hip fractures could not be diagnosed by a PXR. This situation leads to misdiagnosis, hinders the recovery process, increases the treatment costs, and decreases the life quality of the patients. Therefore, the utilization of canonical machine learning algorithms and deep learning architectures in fracture detection and classification has increased to aid in accurate diagnosis and treatment. Starting from this point of view, within the scope of the thesis, femoral neck fracture detection and femur fracture classification studies were carried out. The femoral neck fracture detection study was designed by proposing a CNN architecture from scratch and the experiments were conducted on the balanced and the imbalanced data sets. Using the meta-heuristic optimization algorithms, the filter sizes in the convolutional layers of the proposed CNN architecture and the number of feature maps generated in these layers have been tried to be optimized and it has been revealed that performance increases are achieved through performance criteria. In the femur fracture classification study, the experiments were carried out by adapting the pretrained CNN architectures to the existing problem with the transfer learning method. Automatically generated features of the pretrained CNN architectures were used to feed canonical machine learning classifiers. According to the performances obtained in the detection and classification studies, it has been observed that deep learning architectures are superior to canonical classifiers.Item Eğitim çağında çocuklar için el hareketi tanıma tabanlı geometri öğrenme uygulaması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Uysal, Evren Kemal; Sümer, EmreEl hareketi tanıma, insan-bilgisayar etkileşimi arayüzleri geliştirilmesinde ve bu etkileşimin klavye ya da fare gibi araçlar gerektirmeden yapılabilmesinde büyük rol oynayabilecek, çok popüler bir araştırma konusudur. El hareketi tanıma, günlük bilgi ve haber elde etme, medya oynatıcısı yönetimi, sunum kontrol sistemleri, işitme engelliler için iletişim sistemleri, işaret dilleri ile insan–bilgisayar etkileşimi sağlayan uygulamalar, eğitim - matematik öğrenimi, yabancı dil ve kültür eğitimi, geometri öğrenimi - gibi alanlar üzerinde kullanılmaktadır. Bu tez çalışmasında, eğitim çağındaki çocuklar için el hareketi tanıma ile kullanılabilen bir geometri öğrenme uygulaması önerilmiştir. Bu uygulamada, standart bir ağ kamerası yardımıyla görüntü alınmakta, daha önceden sisteme tanıtılmış belirli el hareketleri ile eşleştirilerek, bu harekete karşılık gelen bir grafik aksiyonu çıktı olarak sunulmaktadır. Önerilen sistem iki ana aşamadan meydana gelmektedir. İlk olarak görüntünün elde edilmesi ve anlamlandırılması sağlanmaktadır. Bunun için OxfordNet’in VGG16 mimarisi, Evrişimsel Sinir Ağı (CNN) olarak seçilmiş ve gerekli değişiklikler yapılarak bu tez çalışmasına uyarlanmıştır. Modeli eğitmek için kullanılan veri seti bu tez çalışması kapsamında 6 farklı kişinin her el hareketi için fotoğraflarının çekilmesi suretiyle oluşturulmuştur. Önerilen sistemin ikinci adımında ise, algılanan el hareketleri ile geometrik şekillerin grafiksel gösterimleri ve çeşitli etkileşimler ilişkilendirilmiştir. Bu grafik aksiyonları önceki ve sonraki şekli çizmek, mevcut şekli büyütmek / küçültmek / döndürmek ve mevcut şekil için çevre, alan ve hacim formüllerini göstermek gibi işlemlerden oluşmaktadır. Sistemin kullanımı ve testleri hem yetişkinler hem de eğitim çağındaki çocuklar tarafından gerçekleştirilmiş ve tatmin edici sonuçlar elde edilmiştir. Hand gesture recognition is a popular research topic which is a great way for implementing Human Computer Interaction interfaces for communicating with a computer without a need for having a mouse or a keyboard. Hand Gesture Recognition has been used on several areas such as daily information retrieval, media player controllers, presentation controllers, communication systems for the hearing impaired, mathematics education, language and culture education and geometry education. In this thesis a geometry learning application for school aged children using HGR is proposed. In this application a video stream is captured from a standart webcam and the received hand gestures are matched with previously defined hand gestures and the respective graphical action for the received hand gesture is given as an output. The system has two main stages. Firstly, the acquisition and interpretation of the image is employed. OxfordNet's VGG-16 architecture was selected as the CNN architecture and was modified in order to fit this study. The data set used to train the model was created by taking photos of 6 different people for each hand gesture. In the second step of the proposed system, the recognized hand gestures are mapped with graphical representations and various interactions. These graphical actions consist of drawing the next and previous shape, enlarging / shrinking / rotating the current shape and showing the perimeter, area and volume formulas for the current shape. The system was tested by adults and school aged children and satisfactory results were obtained.Item Engelli bireyler için göz kırpma tabanlı iletişim sistemi (GÖKTİS)(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Ayabakan, Tuğçe Ezgi; Sümer, EmreBu çalışma kapsamında önerilen göz kırpma tabanlı iletişim sistemi, bilgisayar destekli bir sistem olup çeşitli engellilik halleri bulunan insanlar için tasarlanmıştır. Engellilik hali sinir sisteminde meydana gelen hasardan dolayı uzuvlarının hareket kabiliyetini kaybeden, yalnızca göz kaslarını hareket ettirebilen kişileri kapsamaktadır. Oluşturulan sistem, kullanıcıların yaşam kalitesini artırarak dış dünya ile daha kolay iletişim kurabilmeleri için tasarlanmıştır. Sistem yapısı göz kırpma hareketinin analizi ve özgün alfabe tasarımından oluşmaktadır. Analiz aşamasında göz kırpma hareketinin sıklığı ve süre parametrelerine bağlı bir girdi oluşturulması sağlanır. Bu girdi ile kullanıcı arayüzü içerisindeki özgün alfabede istenilen yöne hareket edilmesi ve seçim yapılabilmesi sağlanmaktadır. GÖKTİS için kullanıcı ihtiyaçlarına bağlı olarak tasarlanan özgün alfabede Türkçe karakterler, hazır metin seslendirme için kısa yol tuşları (Acıktım, Susadım vb.) yer almaktadır. Böylelikle kullanıcı göz kırpma hareketi ile hem istediği mesajı yazabilmekte hem de temel kısa yol işlemlerine erişim sağlayabilmektedir. Sistem dahili veya harici kamera ile dizüstü veya kişisel bilgisayarlarda, kullanıcının yüzü kameradan gözükecek şekilde konumlandırılarak çalışabilmektedir. Sistem farklı ışık koşulları, istemli ya da istemsiz göz kırpma hareketleri gibi durumlar için test edilmiş olup elde edilen sonuçların tatmin edici düzeyde olduğu gözlemlenmiştir. The proposed eye blink-based communication system, which is a computer-aided system, is designed for people with various disabilities. Disability includes persons who can only move the muscles of the eye, who lost their mobility due to damage to the nervous system. The purpose of the system is to improve the quality of life of the users and to communicate with the outside world more easily. The system structure consists of the analysis of the blinking gesture and the design of a novel alphabet. In the analysis phase, an input is generated based on the frequency of the blinking gesture and the time parameter. With this input, it is ensured that movements in the desired direction and selection can be made on the alphabet through the user interface. The alphabet designed for EBCS is based on the user needs and includes Turkish characters and ready voice readout shortcut operations such as “I’m hungry”, “I’m thirsty” etc. Thus, the user can write a desired message via the blinking gesture and gain access to the basic shortcut operations. The system can be operated with a laptop camera, or an external camera, mounted on a personal computer providing that the user's face is visible from the camera. The system has been tested for different light conditions and voluntary or involuntary blinking gestures. According to the tests performed, the results obtained have been observed to be satisfactory.Item Gender recognition and age estimation based on human gait(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2019) Berksan, Murat; Sümer, EmreIn this study, the feasibility of Convolutional Neural Networks (CNN) for gait based gender recognition and age estimation problems were investigated. For this purpose, different networks were evaluated and a basis was selected. Further adjustments were made on the basis network by experimenting on architectural options and hyperparameters. Two distinct yet similar architectures were proposed for each problem. The experiments were conducted by using gait silhouette average which is a feature descriptor as input. The overall accuracy was computed to be 97.45% using the proposed CNN architecture for gender recognition and 5.74 years mean absolute error for age estimation. Using CNN with gait silhouette average as an input is an understudied subject in the literature for these problem domains. While there is one study that uses this approach for gait based gender recognition, there are no studies evaluating CNN for gait based age estimation. The results show successful performance comparable to existing studies. Besides, the experimental results provide insight on how network structure and hyperparameters affect performance. Considering this, obtained outcome allows to gain insight about the problem domain of using gait feature descriptor for gender recognition and age estimation, and provides guidance about deciding on a CNN network in these problem domains. Bu çalışmada, Evrişimsel Sinir Ağları’nın (ESA) yürüyüş biçimi tabanlı cinsiyet ve yaş tespiti alanlarında uygulanabilirliği incelenmiştir. Bu amaçla farklı ağlar değerlendirilmiş olup, kaynak bir ağ seçilmiştir. Baz alınan bu ağ üzerinde farklı mimari seçenekler ve üst değişkenler ile ilgili deneyler yapılarak değişiklikler yapılmıştır. Her bir problem için benzer yapılı ancak farklı iki mimari önerilmiştir. Deneyler yürüyüş biçimi silueti ortalamasını girdi olarak alıp gerçekleştirilmiştir. Cinsiyet tespitinde sonuç olarak %97.45 doğruluk elde edilmiş olup, yaş tespitinde 5.74 yıl ortalama mutlak hata sonucu alınmıştır. Bir özellik tanımlayıcı olan yürüyüş biçimi silueti ortalamasını girdi alarak ESA kullanımı literatürde az çalışılmış bir konudur. Bu yaklaşımı yürüyüş biçimi tabanlı cinsiyet tespiti alanında kullanan tek bir çalışma bulunmakla birlikte, yürüyüş biçimi tabanlı yaş tespiti problemini çözen bir yaklaşıma literatürde rastlanmamıştır. Sonuçlar literatürde var olan çalışmalarla karşılaştırıldığında önerilen mimarilerin başarılı bir performans sergilediği görülmektedir. Ayrıca, deneyler sırasında alınan sonuçlar mimari yapı ile üst parametrelerin performansı nasıl etkilediğine dair anlayış sağlamaktadır. Bütün bunlar göz önünde bulundurulduğunda, alınan sonuçlar yürüyüş özellik tanımlayıcısının bu problem alanlarında kullanımı hakkında anlayış sağlamakla birlikte, ESA’nın bu problem alanlarında kullanımı için yol göstermektedir.Item Görüntü mozaikleme ile panoramik görüntü üretimi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Varol, Ahmet Hamdi; Sümer, EmreGörüntü mozaiği aynı sahneye ait sıralı görüntülerin birleştirilmesiyle oluşturulan bir panoramik görüntüdür. Bu yöntem esas olarak haritalama uygulamaları, insansız hava araçlarından alınan görüntülerin değerlendirilmesi ve çeşitli bilgisayarla görme uygulamalarında kullanılmaktadır. Bu çalışmada, profesyonel olmayan dijital bir kamera ile çekilen fotoğraflardan otomatik ve kesintisiz bir panoramik görüntü için yeni bir harmanlama yöntemi önerilmiştir. Önerilen yönteme göre, mozaikleme sırasında oluşan izleri düzeltmek için, çakışan bölgeler etrafında oluşan renk farklılıkları ölçülür. Bu amaçla, ilk olarak, 1 piksel genişliğindeki bir bölgede üst üste binen bölge sınırları içindeki ve dışındaki görüntü piksel yoğunluk değerleri tespit edilmiştir. İkinci olarak, yoğunluk değerlerinin ortalaması alınmış ve son olarak, renk farklılıklarının ortalama değerleri üst üste binen bölgelere uygulanmıştır. Bunun yanı sıra, oluşan izleri azaltmak amacıyla ilgili sınır bölgelerine hareket bulanıklığı filtresi uygulanmıştır. Önerilen yöntemin doğruluğunu test etmek amacıyla sübjektif bir değerlendirme metriği kullanılmıştır. Çalışmanın sonuçlarına göre, kesintisiz bir mozaik görüntü 0 (en kötü) – 1 (en iyi) arasında değişen başarı skalasına göre 0.66’lık öznel bir doğruluk ile elde edilmiştir. Önerilen yöntem literatürde yer alan ‘Feathering’ tekniğine göre 0.20 puan daha başarılı çıkmıştır. Çalışmanın sonuçları, mozaikleme sonrası oluşan izlerin önemli ölçüde azaltıldığını veya tamamen ortadan kaldırıldığını göstermektedir. Ayrıca, aydınlatma farklılıklarının da en aza indirilebileceğini görülmüştür. An image mosaic is a panoramic image generated by assembling sequential images belong to the same scene. This method is mainly used in mapping applications, the evaluation of the images acquired from unmanned aerial vehicles, and various computer vision applications. In this study, a novel blending method is proposed for automatic and seamless mosaicing of photos taken by an unprofessional digital camera. For the correction of consistent seams occurred during the mosaicing, the color differences around the overlapping regions are measured. For this purpose, first, the intensity values of image pixels inside and outside the overlapping region boundary in a 1 pixel wide zone are determined. Secondly, the intensity values are averaged and finally, the average values of color differences are applied to overlapping regions. Besides, motion blur filtering is performed for the corresponding boundary regions in order to reduce the seams. In order to test the accuracy of the proposed method a subjective evaluation metric is used. According to the results obtained, the seamless image mosaics are generated with a subjective accuracy of 0.66 in average where the full scale is between 0 (the worst) and 1 (the best). The proposed method is appeared to be more successful (by 0.20 points) than the ‘Feathering’ method found in the literature. The results of study indicate that the seams, which occurs after mosaicing, can be substantially reduced or completely eliminated. Besides, it is observed that the illumination differences are minimized.Item İçerik tabanlı görüntü erişiminde öznitelik füzyonu(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2016) Soysal, Ömürhan Avni; Sümer, EmreBu çalışmada, içerik tabanlı görüntü erişim problemlerinin çözümünde tercih edilen tanımlayıcılardan en yaygın olarak kullanılan SIFT (Scale Invariant Feature Transform), SURF (Speeded-Up Robust Features) ve ORB'nin (Oriented FAST and Rotated BRIEF) performansları değerlendirilmiş ve probleme özgü tanımlayıcı tercih etmek yerine jenerik bir çözüm olarak “Ağırlıklandırılmış Öznitelik Füzyonu” gerçekleştirilmiştir. Inria'nın 2 temel veri kümesi üzerinde testler yapılmış ve geri getirim sonuçlarının hassasiyetinin yükseltilmesi hedeflenmiştir. Önerilen yaklaşımın, tanımlayıcıların tek başlarına uygulandığı durumlarda; ORB'nin tek başına uygulandığı duruma göre %10-30, SIFT'in tek başına uygulandığı duruma göre %9-22, SURF'un tek başına uygulandığı duruma göre %12-29 daha az Yanlış Pozitif ürettiği gözlenmiştir. The feature descriptors such as SIFT (Scale Invariant Feature Transform), SURF (Speeded-up Robust Features) and ORB (Oriented FAST and Rotated BRIEF) are known as the most commonly used solutions for the content-based image retrieval problems. In this paper, a generic approach called "Weighted Feature Fusion" is implemented as a generic solution instead of applying problem-specific descriptors alone. Experiments were performed on two basic data sets of the Inria in order to improve the precision of retrieval results. It was found that in cases where the descriptors were used alone the proposed approach yielded 10-30% more accurate results than the ORB alone. Besides, it yielded 9-22% and 12-29% less False Positives compared to the SIFT alone and SURF alone, respectively.Item iOs platformu İçin tıbbi etkinlik ve kongre uygulaması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Hayta, Gökçe; Sümer, EmreHer gün bir yenisinin eklendiği mobil uygulamalar günümüzün en popüler teknolojisi olarak görülmekte ve giderek yaygınlaşmaktadır. Bu nedenle teknolojik çözümlerin mobil cihazlar için geliştirilmesi bir zorunluluk halini almıştır. Bu çalışmada, ulusal ve uluslararası tıp kongreleri ve etkinlikleri için katılımcıların etkinlik öncesi, sonrası ve sırasında kullanabilecekleri iOS tabanlı bir mobil uygulama geliştirilmiştir. Böylece tıp kongrelerinde katılımcılara, kongre deneyimlerini arttıracak mobil çözümler üretilmesi hedeflenmektedir. Kongre esnasında katılımcıların ihtiyaçları ve gereksinimleri ile piyasada var olan örnek uygulamalar incelenmiş, kullanıcılara yeni çözümler ve hizmetler üretmeye yönelik çalışmalar yapılmıştır. Uygulama iOS tabanlı (iPhone ve iPad) cihazlar için geliştirilmiş olup uygulama yazılımı XCode kullanılarak gerçekleştirilmiştir. Uygulama içerikleri için JSON web servisi kullanılmıştır. Uygulama ana menü üzerinden ulaşılabilecek birçok sayfadan meydana gelmektedir. Sonuç olarak, geliştirilen bu uygulama ile eğitim amaçlı düzenlenen kongrelerde verilere erişim hızı ve eğitim kalitesi önemli ölçüde arttırılmıştır. Mobile applications, in which a new one emerged each day, appear to be the most popular technology and have become increasingly common. Therefore, development of the technological solutions for mobile devices becomes an obligatory. In this work, an iOS based mobile application was developed, which can be used by participants for national and international medical congresses before, after and during the activity. It was aimed to produce an mobile solution that will raise the congress experiences of the participants. To do that, the needs and requirements of the participants were examined during the congress. Besides, the model applications that are available in the market were also investigated. Further, preliminary studies were conducted on producing new solutions and services to users. The application was developed for devices running on iOS (iPhone and iPad) platform. The software of the application was implemented by using Xcode development environment. For the context of the application, JSON web service was used. The application is composed of several pages that can be reached over main menu. Consequently, the access speed to data was increased and the education quality during the congresses was improved.Item Recognizing visual places from landscapes with zero shot learning(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2021) Savaşçı, Erdem; Sümer, EmreImage processing and deep learning methods are being developed day by day and the need of recognizing objects and extracting information from visual-based digital multimedia data like pictures and videos is increasing. Therefore, the algorithms are also changing rapidly to meet the requirements of the tasks in everyday life. Zero-shot learning is a new topic and it encourages having small datasets. It still accomplishes the recognition task efficiently. As the name implies, Zero-shot learning is the process of making predictions for the unseen or untrained categories of data based on some amount of data that is learned by the training process earlier. In this study, visual recognition which is based on detecting the city, country, and continent is investigated. There is no or enough similar work on this problem up to now. The unseen places are recognized by training on similar places by categorizing the cities, countries, and continents. Labels and some auxiliary features like a 3D color histogram and GIST features are used to increase the detection accuracy. A new dataset is created for this study and with this work, the importance of the amount of data in the dataset is discussed and various metrics like performance and duration are demonstrated. Also, the comparison with the regular training problem setup is discussed. After all the results are examined, it is seen that ZSL performs better when search space is constrained with only unseen classes at test time. Also, the original generalized ZSL method performs better than the other generalized ZSL method and also inductive ZSL. Compared to traditional learning, various ZSL methods can give sufficient results too. Resimler üzerinden tanıma gerçekleştirme halen üzerinde sıkça çalışılan bir konu olmakla beraber gün geçtikçe ihtiyacın da arttığı bir alandır. Örneksiz Öğrenme yöntemi ile daha az veri üzerinde çalışılmakta olduğu için ve gerçek hayat senaryolarına yakın olması itibariyle önceden görülmemiş ve lokasyonu bilinmeyen görsel yerler üzerinden tanıma işleminde kullanılmasının yararlı olacağı düşünülmüştür. Literatürde Örneksiz Öğrenme yöntemi yaklaşımı ile şehir, ülke ve kıta bazında bir tanıma işleminin gerçekleştirilmesi konusunda örnek olabilecek bir çalışmaya rastlanmamıştır. Tanıma işleminin güçlendirilmesi için uzaklık metotları, üç boyutlu histogram ve GIST (resim içerisindeki karakteristik özelliklerin kodlanmış hali) veri seti üzerinden çıkartılarak yer tahmini işleminde kullanılmıştır. Bu çalışmada farklı şehirlerin yer aldığı yeni bir veri seti oluşturulmuş olup, görülmemiş bir yer resmi üzerinden tahminin ancak önceden benzer yerler üzerinden gerçekleşen öğrenme işlemi sayesinde yapılabileceği için çalışmada alınmış olan bazı kararlar da anlatılmıştır. Çalışma kapsamında normal öğrenme tekniği ile kıyaslama yapılıp Örneksiz Öğrenme yönteminin avantajları anlatılmıştır. Tüm sonuçlar incelendikten sonra standart Örneksiz Öğrenme metodunun genelleştirilmiş ve test zamanında sadece test kümesi üzerinde çalışan versiyonundan daha iyi çalıştığı görülmüştür. Ek olarak genelleştirilmiş ve test zamanında eğitim ve test kümesi üzerinde çalışan versiyonun en iyi sonuçlar verdiği ve normal öğrenme tekniği ile kıyaslanabilir olduğu görülmüştür.Item Sentetik açıklıklı radar görüntülerinin derin evrişimli ağlarla tanınmasına yönelik veri artırımı yaklaşımlarının incelenmesi(Başkent Üniversitesi Fen Bilimler Enstitüsü, 2024) Sinan, Bilge; Sümer, EmreSentetik Açıklıklı Radar (SAR) görüntülerinden hedef tespiti, kara veya hava kuvvetleri gibi kuruluşların gözetleme ve keşif ihtiyaçları göz önüne alındığında büyük önem taşımaktadır. Makine öğrenimi ve Evrişimli Sinir Ağları'nın (CNN'ler) yükselişi ile SAR görüntü setlerinde tahmin yapma yeteneği, askeri unsurları tanımlamak için güçlü bir araç haline getirmiştir. Ancak, kamuya açık SAR verilerinin sınırlı ölçüde olması nedeniyle, doğru sınıflandırma için yeterli miktarda veri bulma konusunda zorluklar yaşanmaktadır. Mevcut veri eksikliği, geleneksel CNN'leri kullanarak güvenilir ve doğru sınıflandırma elde etmede, aşırı uyum gibi önemli sorunlara neden olmaktadır. Bu çalışmada, Hareketli ve Sabit Hedef Tespit ve Tanıma (MSTAR) veri kümesinde güncel nesne tespit uygulamaları olan YOLOv5 ve YOLOv8'in yanı sıra, MSTAR veri kümesi üzerinde eğitilmiş Üretken Çekişmeli Ağların (GAN'lar) kullanımı da incelenmiştir. Sentetik oluşturulan örnek bir veri kümesi, MSTAR eğitim kümesine veri takviyesi sağlamak amacıyla kullanılmış ve güncel nesne tespit uygulamalarıyla değerlendirilmiştir. GAN ve gürültü ile SAR görüntülerinin öğrenme yeteneğini değerlendirmek için eğitim kümesinin genişletilmesi ve farklı radar açılarından alınan bu görüntülerle veri artırmanın nesne tespitindeki etkileri gözlemlenmiştir. Target detection from Synthetic Aperture Radar (SAR) images is of great importance considering the surveillance and reconnaissance needs of organizations such as the army or air force. The rise of machine learning and Convolutional Neural Networks (CNNs) and the ability to classify and predict on SAR image sets make these networks a powerful tool for identifying military elements. However, due to the limited availability of publicly available SAR data, there are difficulties in finding sufficient amounts of data for accurate classification. The lack of available data causes significant problems, such as overfitting, in achieving reliable and accurate classification using traditional CNNs. This study examines the current object detection applications YOLOv5 and YOLOv8 on the Moving and Stationary Target Detection and Recognition (MSTAR) dataset, as well as the use of Generative Adversarial Networks (GANs) trained on the MSTAR dataset. A synthetically created sample data set was used to supplement the MSTAR training set and was evaluated with current object detection applications. To evaluate the learning ability of SAR images with GAN and noise, the training set was expanded and the effects of data augmentation on object detection were observed with these images taken from different radar angles.Item Uydu görüntülerinden evrişimsel sinir ağları ile bina bölge tespiti ve çatı tipi sınıflandırması(Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Öztürk, Erdal; Sümer, EmreCoğrafi Bilgi Sistemleri (CBS); verimlilik, planlama, hasar tespiti ve daha fazlası dahil olmak üzere bir bina modelinin birçok yönünü analiz eder. CBS uygulamalarının ihtiyaç duyduğu temel bileşenlerden biri, bir binanın çatı tipi ve geometrisidir. Bu nedenle, çatıların tanımlanması ve sınıflandırılması CBS'de araştırılan önemli bir konudur. Gelişen teknoloji sayesinde geniş alanların yüksek çözünürlüklü uydu görüntülerini elde etmek kolay ve ucuz bir hale gelmiştir. Uydu görüntüleri üzerinde yapılabilecek sınıflandırma yöntemi ile geniş alanlar hızlı bir şekilde analiz edilebilmektedir. Bu sayede zaman, maliyet ve işçilik konusunda önemli derecede kazanç sağlanabilmektedir. Bazı nesne algılama yöntemleri, günümüzde uydu görüntülerinde bina çatılarının konumlarını belirleyebilmektedir. Derin öğrenme, nesne tespiti için kullanılan bu yöntemlerden biridir. Klasik makine öğrenme metodu bu sorunu çözmede başarılı sonuçlar elde etmiş olsa da, derin öğrenme üzerine yapılan son araştırmalar doğruluk oranlarındaki başarının daha yüksek seviyelere çıkabileceğini göstermiştir. Bu çalışmada, derin öğrenme yöntemleri kullanılarak bina bölgelerine ait çatı konumlarının.alansal olarak belirlenmesinin yanı sıra ilgili çatı tipleri de sınıflandırılmıştır. Bunu başarmak için, CNN yönteminin performansı, orta seviye çözünürlüklü görüntüler kullanılarak test edilmiştir. Farklı bölgelere ait elde edilen uydu görüntülerinin test sonuçları incelendiğinde, AlexNet'in %92,30, GoogleNet'in ise %87,18 doğrulukla çatı bölgelerini tespit ettiği görülmektedir. Ayrıca, incelenen üç mimariden bina çatı tiplerinin sınıflandırılması için en uygun modelin AlexNet olduğu sonucuna varılmıştır. Geographic Information Systems (GIS) analyzes many aspects of a building model, including efficiency, planning, damage assessment and more. One of the key components required by GIS applications is the roof type and geometry of a building. Therefore, the identification and classification of roofs is an important topic explored in GIS. With developing technology, obtaining high-resolution satellite images of large areas can be easy and inexpensive. Large areas can be analyzed quickly with the classification method that can be done on satellite images. In this way, significant savings in time, cost and labor can be achieved. Some object detection methods can now determine the positions of building roofs in satellite images. Deep learning is one ofbthese methods usedbfor object detection. Although the classical machine learningbmethod has achieved successful results inbsolving thisbproblem,brecent research on deepblearning has shownbthat the success in accuracy ratesbcan reach higherblevels.bIn thisbstudy, besides the regionalbdetermination of thebroof locations of the building regions by usingbdeep learningbmethods, the related roofbtypes are alsobclassified. To achieve this, thebperformance of thebCNN method is testedbusing medium resolutionbimages.bWhen thebtest results of the satellitebimages obtainedbfrom different regionsbare examined,bit is seen thatbAlexNet produced successful results in region detection with 92.30% accuracy and GoogleNet produced 87.18% accuracy. In addition, it was concludedbthat AlexNet was thebmost suitablebmodel for the classification of buildingbroof types among the threebarchitectures examined.Item Uzaklık ve cinsiyet tabanlı akıllı reklam görüntüleme sistemi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2018) Kabasakal, Burak; Sümer, EmreSon yirmi yılda artan teknolojik gelişmelere paralel olarak örüntü tanıma ve bilgisayarlı görme alanlarını kullanan ve gündelik hayata entegre olan birçok çalışma ve araştırma bulunmaktadır. Bu tezde, gerçek zamanlı olarak kamera kaynağından alınan yayın üzerinde tespit edilen yüz görüntülerinden elde edilen cinsiyet bilgisine ve kameraya uzaklığına bağlı olarak çalışan akıllı reklam görüntüleme sistemi geliştirilmiştir. Sistem temelde iki ayrı kısımdan oluşmaktadır. İlk kısımda kamera kaynağından alınan veriler, canlı yayındaki çerçeveler işlendikten sonra algılanan yüzlerden cinsiyet tespiti ve uzaklık kestirimi yapılarak canlı yayına eklenmektedir. Sistemin ikinci kısmında ise algılanan yüze ait resim, cinsiyet etiketi ve kameraya uzaklık bilgisi reklam bilgisinin gösterileceği uygulamaya web servis yolu ile iletilip, veritabanına kaydedilmektedir. Sistem için önceden tanımlanmış süre içerisinde veritabanında bulunan yüz ve uzaklık bilgileri analiz edilerek farklı detay seviyelerinde reklam gösterimi yapılmaktadır. Analiz işleminde, sistem için tanımlanmış süre zarfında veritabanından elde edilen veriler doğrultusunda cinsiyet ve uzaklığa bağlı olarak farklı ilgi seviyelerinde reklam gösterimi gerçekleştirilmektedir. Sistemin verimli çalışması için cinsiyet tespitinin doğru yapılması oldukça önem arz etmektedir. Çalışmada, geliştirilen yüz algılama sınıflandırıcısıyla beraber cinsiyet tespit işlemi için Fisher Yüz Algoritması (Fisherfaces), Destek Vektör Makineleri (SVM) ve Evrişimsel Sinir Ağları (CNN) sınıflandırıcıları kullanılmıştır. SVM sınıflandırıcısındaki doğruluk yüzdesini arttırmak için Yerel İkili Örüntü (LBP) ve Yönlü Gradyanlar Histogramı (HOG) öznitelik çıkarım yöntemleri kullanılmıştır.Derin öğrenme yöntemlerinin en popülerlerinden biri olan CNN ağ çeşidi GoogleNet mimarisi ile eğitilmiştir. Sınıflandırıcılar için günlük hayat akışına uygun olarak belirlenmiş LFW, IMDB ve WIKI veri kümeleri eğitim için, FaceScrub veri kümesi ise test veri kümesi olarak kullanılmıştır. Cinsiyet tespiti için geliştirilen SVM ve CNN sınıflandırıcıları üzerinde gerekli optimizasyon çalışmaları yapılmıştır. Fisher Yüz algoritması ile %61.30, SVM sınıflandırıcısının LBP ve HOG öznitelik çıkarım yöntemleri ile sırasıyla %75.32 ve %80.58, CNN sınıflandırıcısı ile %94.76’lık başarı elde edilmiştir. The vast number of researchers have been focused on pattern recognition and computer vision fields in parallel with recent technological developments over the last two decades. Studies on these subjects have become widespread in recent years. In this thesis, a smart advertisement display system has been developed which feeds real time data from the camera source to get gender information and calculate distance from the camera source. The developed system has two main stages. Firstly, live broadcast stream, which gets data from the camera source, is handled frame by frame. Then, the face detection part is employed for predicting the gender and distance information. Secondly, detected face images along with the gender labels and distance values are sent to the advertisement display application via the web service and saved into the database. The advertisement system is run in a time counter and analyses the records from the database. The analysis process is based on statistical information such as gender label and distance value to determine advertisements having different levels of detail. Determination of gender information is very important for proper system operation. For this study, face detection and gender recognition classifiers were implemented. Fisherfaces, Support Vector Machines (SVM) and Convolutional Neural Networks (CNN) classifiers for gender recognition were trained. The SVM classifier with Local Binary Pattern (LBP) and Histogram of Oriented Gradients (HOG) features were used at different times. Besides, various optimization works were performed by changing the parameters. One of the most popular deep learning methods, the CNN network type, was trained with GoogleNet architecture and the optimization was performed depending on the parameters. The LFW, IMDB and WIKI were used as training data sets and the FaceScrub was used as the test data set. Fisherfacesalgorithm yielded an accuracy of 61.30%. When LBP feature extraction method is combined with SVM classifier, the accuracy rate of 75.32% was reached. The HOG feature extraction method with SVM was found to be more successful than LBP and reached an accuracy of 80.58%. Finally, CNN was determined to be the best classifier among all having an accuracy rate of 94.76%.