Fen Bilimleri Enstitüsü / Science Institute

Permanent URI for this collectionhttps://hdl.handle.net/11727/1392

Browse

Search Results

Now showing 1 - 4 of 4
  • Thumbnail Image
    Item
    Uzaklık ve cinsiyet tabanlı akıllı reklam görüntüleme sistemi
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2018) Kabasakal, Burak; Sümer, Emre
    Son yirmi yılda artan teknolojik gelişmelere paralel olarak örüntü tanıma ve bilgisayarlı görme alanlarını kullanan ve gündelik hayata entegre olan birçok çalışma ve araştırma bulunmaktadır. Bu tezde, gerçek zamanlı olarak kamera kaynağından alınan yayın üzerinde tespit edilen yüz görüntülerinden elde edilen cinsiyet bilgisine ve kameraya uzaklığına bağlı olarak çalışan akıllı reklam görüntüleme sistemi geliştirilmiştir. Sistem temelde iki ayrı kısımdan oluşmaktadır. İlk kısımda kamera kaynağından alınan veriler, canlı yayındaki çerçeveler işlendikten sonra algılanan yüzlerden cinsiyet tespiti ve uzaklık kestirimi yapılarak canlı yayına eklenmektedir. Sistemin ikinci kısmında ise algılanan yüze ait resim, cinsiyet etiketi ve kameraya uzaklık bilgisi reklam bilgisinin gösterileceği uygulamaya web servis yolu ile iletilip, veritabanına kaydedilmektedir. Sistem için önceden tanımlanmış süre içerisinde veritabanında bulunan yüz ve uzaklık bilgileri analiz edilerek farklı detay seviyelerinde reklam gösterimi yapılmaktadır. Analiz işleminde, sistem için tanımlanmış süre zarfında veritabanından elde edilen veriler doğrultusunda cinsiyet ve uzaklığa bağlı olarak farklı ilgi seviyelerinde reklam gösterimi gerçekleştirilmektedir. Sistemin verimli çalışması için cinsiyet tespitinin doğru yapılması oldukça önem arz etmektedir. Çalışmada, geliştirilen yüz algılama sınıflandırıcısıyla beraber cinsiyet tespit işlemi için Fisher Yüz Algoritması (Fisherfaces), Destek Vektör Makineleri (SVM) ve Evrişimsel Sinir Ağları (CNN) sınıflandırıcıları kullanılmıştır. SVM sınıflandırıcısındaki doğruluk yüzdesini arttırmak için Yerel İkili Örüntü (LBP) ve Yönlü Gradyanlar Histogramı (HOG) öznitelik çıkarım yöntemleri kullanılmıştır.Derin öğrenme yöntemlerinin en popülerlerinden biri olan CNN ağ çeşidi GoogleNet mimarisi ile eğitilmiştir. Sınıflandırıcılar için günlük hayat akışına uygun olarak belirlenmiş LFW, IMDB ve WIKI veri kümeleri eğitim için, FaceScrub veri kümesi ise test veri kümesi olarak kullanılmıştır. Cinsiyet tespiti için geliştirilen SVM ve CNN sınıflandırıcıları üzerinde gerekli optimizasyon çalışmaları yapılmıştır. Fisher Yüz algoritması ile %61.30, SVM sınıflandırıcısının LBP ve HOG öznitelik çıkarım yöntemleri ile sırasıyla %75.32 ve %80.58, CNN sınıflandırıcısı ile %94.76’lık başarı elde edilmiştir. The vast number of researchers have been focused on pattern recognition and computer vision fields in parallel with recent technological developments over the last two decades. Studies on these subjects have become widespread in recent years. In this thesis, a smart advertisement display system has been developed which feeds real time data from the camera source to get gender information and calculate distance from the camera source. The developed system has two main stages. Firstly, live broadcast stream, which gets data from the camera source, is handled frame by frame. Then, the face detection part is employed for predicting the gender and distance information. Secondly, detected face images along with the gender labels and distance values are sent to the advertisement display application via the web service and saved into the database. The advertisement system is run in a time counter and analyses the records from the database. The analysis process is based on statistical information such as gender label and distance value to determine advertisements having different levels of detail. Determination of gender information is very important for proper system operation. For this study, face detection and gender recognition classifiers were implemented. Fisherfaces, Support Vector Machines (SVM) and Convolutional Neural Networks (CNN) classifiers for gender recognition were trained. The SVM classifier with Local Binary Pattern (LBP) and Histogram of Oriented Gradients (HOG) features were used at different times. Besides, various optimization works were performed by changing the parameters. One of the most popular deep learning methods, the CNN network type, was trained with GoogleNet architecture and the optimization was performed depending on the parameters. The LFW, IMDB and WIKI were used as training data sets and the FaceScrub was used as the test data set. Fisherfacesalgorithm yielded an accuracy of 61.30%. When LBP feature extraction method is combined with SVM classifier, the accuracy rate of 75.32% was reached. The HOG feature extraction method with SVM was found to be more successful than LBP and reached an accuracy of 80.58%. Finally, CNN was determined to be the best classifier among all having an accuracy rate of 94.76%.
  • Thumbnail Image
    Item
    Adli uygulamalar için ses içerik analizi
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2018) Sarman, Sercan; Sert, Mustafa
    Günümüzde artan şiddet olayları, adli incelemelerin de önemini artırmıştır. Şiddet olaylarının ardından gerçekleştirilecek olan adli incelemeler esnasında, erişilebilir durumda olan bütün işitsel ve görsel veriler oldukça kıymetlidir. Olayın gerçekleştiği konumun tespit edilmesi, şiddetin türünün belirlenmesi ve benzeri süreçler, adli ses analizi kapsamında yer almaktadır. Günümüzde çevrimiçi içeriğe erişimin akıllı cihazlar aracılığıyla konum bağımsız olarak gerçekleştirilebiliyor olması ve sunulan içeriğin miktarının hızlı bir şekilde artmasıyla; içeriğin otomatik olarak sınıflandırılmasının önemini artırmıştır. Özellikle çocuk ve gençleri olumsuz olarak etkileyebilecek içeriğin otomatik olarak tespit edilmesi, içerik miktarının hızlı artışıyla birlikte önem kazanmıştır. Buna karşılık, sinyal işleme alanında, özellikle de adli ses analizi kapsamında gerçekleştirilen çalışmaların başarımı, diğer alanlarda kullanılan makine öğrenmesi yöntemlerinin şiddet sahnesi sınıflandırması alanına uygulanabileceğini göstermiştir. Bu tez çalışması kapsamında, silah seslerinin ve video verilerinin şiddet içeren sahnelerinin ses tabanlı sınıflandırılması problemleri ele alınmıştır. Bu amaçla, makine öğrenmesi metotlarının ve topluluk öğrenmesi yaklaşımları probleme uygulanmıştır. Yöntemler, performans veri kümeleri üzerinde karşılaştırmalı olarak incelenmiş ve silah sesleri sınıflandırılması alanında %66, şiddet sahnesi sınıflandırması alanında %62'ye varan sınıflandırma başarımları elde edilmiştir. Nowadays, the increase in violent events has enhanced the importance of forensic investigations. All accessible auditory and visual data are highly valuable during the examination to be performed after violent events. Audio forensics analysis contains determination of location in which violent incident occur and determination of type of violence. Recently, the location-free and easier access to online content via smart devices and the increase of content have enhanced the importance of automatical classification of content. With the rapid growth in the amount of content, it has become crucial to automatically determine the content that can adversely affect children and youth. On the other hand, the success of the studies carried out in the field of signal processing, especially in the context of audio forensic analysis, shows that the methods of machine learning used in other areas can be applied to the field of violent scene classification. In this study, we study the problem of gunshot sounds and violent scene classification. For this purpose, machine learning and ensemble learning approaches applied to this problem. We examine classification rates of various machine learning and ensemble learning approaches comperatively and we achieve classification accuracies of 66% and 62% in audio gunshot classification and violent scene classification, respectively.
  • Thumbnail Image
    Item
    Uyku esnasında çıkan seslerın sınıflandırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2017) Kılıç, Erkan; Erdamar, Aykut
    Uyku esnasında istemsiz olarak horlama, öksürme, hapşırma, ıslık gibi farklı akustik özelliklerde sesler ortaya çıkabilmektedir. Bu sesler, insanın uyku kalitesini doğrudan etkileyebileceği gibi, aynı ortamda bulunan diğer insanların da uyku kalitesini olumsuz yönde etkileyebilmektedir. İnsanın uyku kalitesinin arttırılması amacıyla bu seslerin kaydedilmesi, alınan ses kayıtlarının uzman doktor tarafından değerlendirilmesi ve değerlendirme sonucuna göre uygun tedavi yönteminin belirlenmesi gerekmektedir. Ancak, normal bir uyku süresinin altı ile sekiz saat aralığında olmasından dolayı, uzman doktor tarafından tüm ses kaydının dinlenmesi oldukça uzun ve yorucu bir süreç gerektirmektedir. Bu nedenle, uyku sırasında kaydedilen sesleri otomatik olarak analiz ederek, uzman doktora teşhis koymada yardımcı olacak ve önemli ölçüde zaman kazandıracak bir algoritmaya ihtiyaç duyulduğu belirlenmiştir. Daha önce yapılan literatür taramasında, bu konu üzerinde yapılan çalışma sayısının çok az olduğu ve mevcut çalışmaların büyük çoğunluğunun, ses kayıtları üzerinden sadece horlama sesini algıladığı ancak, uzman doktora teşhis koymada yardımcı olacak algoritmalar içermediği görülmüştür. Bu çalışmada, literatürden farklı olarak, ses kayıtlarının tamamını hızlı ve efektif bir şekilde analiz edecek, uyku esnasında çıkan sesleri otomatik olarak ve yüksek doğrulukta sınıflandırabilecek, doktora tanı koymada yardımcı olabilecek bilgisayar destekli tanı algoritmasının geliştirilmesi amaçlanmıştır. Bu amaç doğrultusunda, ilk olarak uyku ses kayıtları araştırılmış ve internet taraması yapılarak açık erişimli sitelerden farklı tipte ses kayıtları elde edilmiştir. Tüm kayıtlar tek tek dinlenerek gruplandırılmıştır. Çalışmanın ikinci aşamasında, literatürde geçen yöntemler doğrulanmıştır. Bu süreçte, tüm ses kayıtları üzerinde enerji, varyans, sıfır kesme oranı, özilinti fonksiyonu, Fourier dönüşümü yöntemleri uygulanmış ve ses kayıtları hakkında genel bilgi verecek öznitelikler elde edilmiştir. Çalışmanın üçüncü aşamasında, literatürden farklı olarak adaptif bölütleme algoritması geliştirilmiş, ses kaydı her bir bölütte tek çeşit ses olacak şekilde otomatik olarak parçalanmıştır. Her bir parçaya literatürdeki analiz yöntemleri uygulanarak, analiz edilen sese ait akustik öznitelikler elde edilmiştir. Bu yöntemlere ilaveten, tüm parçalara sürekli dalgacık dönüşümü yöntemi uygulanarak zaman, frekans ve genlik düzleminde olmak üzere görsel ve matematiksel öznitelikler çıkarılmıştır. Çalışmanın son aşamasında, sınıflandırıcı olarak destek vektör makineleri kullanılmış ve elde edilen öznitelikler sınıflandırıcı eğitilmiştir. Eğitim için 390 bölüt, test için 449 bölüt kullanılmıştır. Çalışma sonucunda, geliştirilen algoritma, nefes verme, basit horlama, yüksek frekans dubleks horlama, düşük frekans dubleks horlama, tripleks horlama ve öksürmeyi içeren altı farklı parametreyi %96.44 doğruluk oranıyla sınıflandırmıştır. Sounds like snoring, coughing, sneezing, whistling, which have different acoustic properties, can emerge involuntarily during the sleep. These sounds may affect negatively the sleep quality of the other people in the same environment, just as it may affect directly the sleep quality of the person. To increase the sleep quality of the person, these sounds should be recorded and these records should be evaluated by a sleep expert. The appropriate treatment method should be determined according to the evaluation result. However, since the duration of a normal sleep is in the range of six hours to eight hours, it’s a time consuming process for the sleep expert to listening all records. Therefore, it has been determined that a timesaver algorithm which analyzes automatically the sounds recorded during the sleep, is needed to help diagnose of the sleep expert .In the previous literature review, it has been observed that the number of studies on this topic is very few. Majority of existing studies detects only the snoring sounds, but these works do not involve the algorithms which help the sleep expert to diagnose. In this study, differently from the literature, it has been aimed that developing a computer aided diagnosing algorithm which will classify the sounds emerging during the sleep automatically with high accuracy by analyzing the all records in a fast and effective way to help the sleep expert to diagnose. In accordance with this purpose, at the first stage, sleep sounds were researched and different types of sound recordings obtained from open access sites thereby internet browsing. All records have been listened one by one and have been grouped. In the second stage of the study, the methods mentioned in the literature have been validated. Within this period, energy, variance, zero cross rate, autocorrelation function, Fourier transform methods have been applied on the all records and the features which will provide general information about records, have been obtained. In the third stage of the study, an adaptive segmentation algorithm has been developed and records has been segmented automatically as every segment has one kind of sound. The acoustic features belonging to analyzed sound have been obtained by applying analytical methods to each segment. In addition, the visual and mathematical features have been obtained in frequency, time and amplitude domains by applying “Continuous Wavelet Transform” for the every segment. At the last stage, support vector machine used as a classifier and it has been trained with the obtained features. The success of the algorithm has been tested by using different records. 390 and 449 segments were used for training and testing respectively. As a result of the study, developed algorithm has classified six different parameters which are exhalation, simple snoring, high frequency duplex snoring, low frequency duplex snoring, triplex snoring and coughing, with 96.44% accuracy rate.
  • Thumbnail Image
    Item
    Uyku bozukluklarına ait eeg verilerindeki geçici eeg dalga formlarının analizi
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2017) Kantar, Tuğçe; Erdamar, Aykut
    Uykuda anlık olarak ortaya çıkan, kendine özgü yapısal özellikleri, genlik ve frekansları olan, elektroensefalografi (EEG)’nin arka planından ayırt edilmesi zor geçici dalga formları(k-kompleksler, uyku iğcikleri, arousal vb.) EEG’nin mikro yapısı olarak adlandırılır. Bu dalga formlarının analizi beyin araştırmaları, uyku çalışmaları, uyku evre skorlamaları, uyku bozukluklarının değerlendirilmesi açısından önemlidir. Literatürde bulunan mevcut çalışmalar, geçici dalga formlarının belirlenen öznitelikleri kullanılarak yapılan tespit ve sınıflandırma çalışmaları şeklindedir. Bu tez çalışmasında, literatürdeki çalışmalardan farklı olarak, tek bir geçici EEG dalga formu için değil, üç farklı dalga formu için yüksek doğruluk oranında tespit yapacak yöntemler geliştirilmesi amaçlanmıştır. Çalışmada, National Sleep Research Resource, DREAMS veri tabanları ve Ankara Gülhane Askeri Tıp Akademisi Ruh Sağlığı ve Hastalıkları Anabilim Dalı uyku laboratuvarında yapılan uyku skorlandırma çalışmaları sırasında kaydedilen gerçek hastalara ait polisomnografi kayıtları kullanılmıştır. Çalışmanın ilk aşamasında, sinyal işleme yöntemleri kullanılarak veri tabanı ve hasta kayıtlarındaki EEG sinyallerinin analizleri gerçekleştirilmiştir. Spektral analizlerde, ayrık Fourier dönüşümü, güç spektrumu yöntemleri, zaman-frekans analizinde kısa zamanlı Fourier dönüşümü yöntemi, dalgacık analizlerinde ayrık dalgacık dönüşümü ve sürekli dalgacık dönüşümü yöntemleri kullanılmıştır. Dalga formu analizlerinde ise, EEG’nin etkin enerji değeri, alt bant enerji analizi, çapraz ilinti fonksiyonu, sıfır kesme oranı, ortalama ve varyans gibi sinyal parametreleri incelenmiştir. Uygulanan analizler sonucu uykudaki geçici dalga formlarından k-kompleks için normalize çapraz ilinti fonksiyonu, alt bant enerji analiz değerleri ve sıfır kesme oranı; uyku iğcikleri için sürekli dalgacık dönüşümü sonucu uyku iğciğinin sahip olduğu karakteristik frekans aralığındaki dalgacık dönüşümükatsayılarının toplamı; arousal için ise sürekli dalgacık dönüşümü sonucu elde edilen aralıkta sinyalin ortalama ve varyans değerleri öznitelik olarak belirlenmiştir. Çalışmanın ikinci aşamasında, doğrusal ayırtaç analizi, destek vektör makineleri ve yapay sinir ağları kullanılarak belirlenen öznitelikler ile geçici dalga formu “var” ya da “yok” şeklinde sınıflandırma yapılmıştır. Çalışma sonucunda, literatürden daha iyi veya literatürle eş seviyede sonuçlar veren ve başarılı olarak tespit yapabilen bir karar destek sistem algoritması geliştirilmiştir. Transient waveforms (k-complexes, sleep spindles, arousal, etc.) happens instantaneously in sleep, have distinctive structural features, amplitudes and frequencies, and are difficult to distinguish from the background of electroencephalography (EEG) which are called the microstructure of the EEG. The analysis of these waveforms is important for brain research, sleep studies, sleep stage scorings and assessment of sleep disorders. In literature, related works are used the specified feature extraction of the transient waveforms and classification studies. In this study, different from the literature, it is aimed to develop several methods to detect high accuracy three different waveforms with high accuracy, unlike single transient EEG waveform. In this study, the EEG recordings were obtained from the National Sleep Research Resource, DREAMS databases and Ankara Gulhane Military Medical Academy, Psychiatry Department the Sleep Laboratory. In the first part of the study, signal processing methods were used to analyze patients’ EEG signal records. Discrete Fourier transform, power spectrum methods in spectral analysis; short - time Fourier transform in time-frequency analysis; discrete and continuous wavelet transform in the wavelet analysis were used. In wave form analyzes, signal parameters such as effective value of EEG energy, sub-band energy analysis, cross correlation function, zero cross rate, mean and variance were investigated. According to results, cross correlation function, sub-band energy analysis and zero cross rate for k-complex; the sum of the continuous wavelet transform coefficients in the frequency range for sleep spindles; and the mean and variance of the continuous wavelet transform coefficients for arousal were determined as features. In the second part of the study, with determined features, transient waveforms were classified as "existence" or "absence" using linear discriminant analysis, support vector machines and artificial neural networks. As a result of the study, a decision support system algorithm, can detect transient waveforms successfully, was developed that can yield results better than or as equivalent as the literature.