Enstitüler / Institutes

Permanent URI for this communityhttps://hdl.handle.net/11727/1390

Browse

Search Results

Now showing 1 - 4 of 4
  • Item
    FMCW radar verilerinin makine öğrenmesi yöntemleri ile sınıflandırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2024) Emre Can, Ertekin; Selda, Güney
    Günümüzde objeleri niteliklerine göre sınıflandırmanın birçok uygulama alanı bulunmaktadır. Örneğin, savunma sanayi, gözetleme, robotik vb. Bu durum, geleneksel yöntem ile çözülemeyen problemlere yönelik birçok yenilikçi uygulamanın ortaya çıkmasına olanak sağlar. Örneğin, radar verileri üzerinden nesnelerin sınıflandırılmasında hız, Radar Kesit Alanı (RKA), faz değişimi gibi birçok değer göz önünde bulundurulur. Ancak, bu yöntem ile birbirine yakın boyut ve hızlarda olan nesneler yüksek doğruluk ile ayırt edilememektedir. Bu duruma örnek olarak kuş ve droneların radar verileri üzerinden ayırt edilmeye çalışılmasını örnek verebiliriz. Kuşlar ve droneların RKA ölçümleri ve hızları bazı durumlarda aynı olmaktadır ve bu sebep ile geleneksel eşik uygulama gibi yöntemler etkin olmamaktadır. Günümüzde meydana gelen simetrik ve asimetrik çatışma ve savaşlar göz önüne alındığında, drone kullanımının arttığını ve savaş alanında etkin bir şekilde kullanılabileceğini gözlemlemek mümkündür. Droneların kolay elde edilebilir ve kolay imal edilebilir olması bu duruma neden olabilmektedir. Bu nedenle farklı sensörler ve farklı yöntemler kullanılarak bu droneların ayırt edilmesi önem arz etmektedir. Bu tez çalışmasında, bu ayrımın yüksek performansla gerçekleştirilebilmesi için gerçek radar sensör ölçümlerinden elde edilen eş evreli dördün evreli (In-Phase Quadrature, IQ) verilerinin spektogramları ile Evrişimsel Sinir Ağı(ESA) algoritmasının performansı üzerine bir çalışma yapılmıştır. Bu çalışmada, Frekans Modülasyonlu Sürekli Dalga (Frequency Modulated Continuous Wave, FMCW) radardan elde edilmiş olan IQ verilerinin mikrodoppler izlerini kullanarak, klasik makine öğrenmesi yöntemlerini ve farklı derin öğrenme mimarilerini kullanarak hem farklı drone türlerinin sınıflandırılmasını hem de droneların kuşlardan ayırt edilmesi gerçekleştirilmiştir. Bu çalışmada kullanılmış olan veriseti içerisinde 6 adet drone sınıfı, 2 adet insan hareketine bağlı ölçümlerden oluşan insan sınıfı, 6 ayrı kuş türüne ait ölçümlerin olduğu kuş sınıfı ve Üçgen Reflektör ölçümlerinden oluşan üçgen reflektör sınıfı bulunmaktadır. Bu çalışma sonucunda uçtan uca oluşturulmuş ESA mimarileri ve önceden eğitilmiş ESA mimarilerinde ile yüksek başarım oranları elde edilmiştir. Bu çalışmada önerilen ESA mimarisi ile özniteliklerin çıkartılarak Destek Vektör Makinası ile sınıflandırıldığında en yüksek doğruluk değeri %98.04 olarak elde edilmiştir. Nowadays, object classification has many applications field, such as defense, surveillance, robotics etc. This situation brings so many solutions for problems in traditional classification methods. For example, many values such as speed, Radar Cross Section (RCA), and phase change are taken into account when classifying objects from radar data. However, with usage of this method has bad accuracy in case of similar RCS and speed targets. For example, in case of birds and drones their size and speeds are similar in many cases. Because of this, classification of bird and drone has poor accuracy when using traditional classification methods (Thresholding etc.). In case of drone-bird classification, those algorithms have lack of accuracy. Since, size of a drone and birds are nearly same, RCS classifications cannot work properly. Considering the symmetrical and asymmetrical conflicts and wars taking place today, it is possible to observe that the use of drones is increasing and can be used effectively in these areas. The fact that drones can be easily obtained and easily manufactured can cause this situation. The importance of classifying and distinguishing between drones and birds is important both on the battlefield and in protecting high-value sites and infrastructure from terrorist attacks. For example, airports, military bases, military convoys, government buildings, nuclear power plants, power stations, dams, etc. For this reason, it is important to distinguish these drones using different sensors and different methods. In order to realize this discrimination with high performance, this study is used a real radar sensor measured In-Phase Quadrature (IQ) data spectrograms to observing performance of Convolutional Neural Network (CNN) algorithms. In this thesis study, using micro-Doppler traces of IQ data obtained from FMCW radar, classical machine learning methods and different deep learning architectures have been used to classify different drone types and to distinguish drones from birds. To conduct this study, two datasets is used, first dataset consist of 6 drone classes, 2 human classes with different movements, 6 different bird classes and 1 corner reflector class were used. In second dataset, only drones and bird measurements were used. As a result of this study, high accuracy rates were obtained with end-to-end CNN architectures and Pre-trained CNN architectures. With the CNN architecture proposed in this study, the highest accuracy value 98.04 % was obtained when features were extracted and classified with Support Vector Machine (SVM) with the usage of nine class dataset. With the usage of second dataset which is include only two class (Birds and drones) the accuracy is 99.4 % with the same CNN feature extraction and SVM method use.
  • Item
    Türkçe E-Ticaret ürün yorumlarının sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Toprak, Burcu Melis; Güney, Selda
    Günümüzde e-ticaret ürün incelemeleri, çevrim içi alışverişte oldukça önemli bir rol oynamaktadır. Teknolojinin hayatımızdaki önemi ve çevrim içi alışverişe olan yoğun ilgi nedeniyle ürün yorumları ürünü satın alma aşamasında oldukça önemlidir. Ürüne verilen puanlar ve yazılan yorumlar arasında zaman zaman uyumsuzluk yaşanmaktadır. Bu nedenle yazılan yorumların metin sınıflandırma kullanılarak gruplandırılması ile ürün hakkında daha objektif değerlendirilme sağlanacağı düşünülmektedir. Metin sınıflandırmada oldukça kullanışlı ve etkili olan denetimli ve denetimsiz makine öğrenimi algoritmalarının yanı sıra derin öğrenme algoritmaları da oldukça popülerdir ve başarı oranları yüksektir. Bu tez çalışmasının amacı, Türkçe metin sınıflandırması için farklı makine öğrenmesi yöntemlerinin başarılarını incelemektir. Kullanılan veri setinde, çevrim içi alışveriş sitelerinde bir ürün altına yapılan yorumlar toplanmış ve yorumların olumlu, olumsuz ya da nötr olmasına göre sınıf etiketleri verilerek veri seti oluşturulmuştur. Toplam 15170 yorumun yer aldığı veri setinde 6799 olumlu, 6978 olumsuz ve 1393 tarafsız yorum bulunmaktadır. Sınıflandırma aşamasında, bu tez çalışmasında sınıflandırıcı olarak Evrişimsel Sinir Ağı (ESA) önerilmiştir. Ayrıca önerilen yöntem, Karar Ağaçları, Lineer Diskriminant Analiz, Uzun Kısa Süreli Bellek, İkinci Dereceden Diskriminant Analiz, Çift Yönlü Uzun Kısa Süreli Bellek, Verimli Lineer Destek Vektör Makineleri, Geçitli Tekrarlayan Birim, Verimli Logistik Regresyon, Naif Bayes, K-En Yakın Komşu, Birleşik Modeller, Yapay Sinir Ağları, Kernel ve Destek Vektör Makineleri ile karşılaştırılmıştır. En yüksek başarı Evrişimsel Sinir Ağları kullanıldığında %90,77 doğruluk ile elde edilmiştir.Nowadays, e-commerce product reviews play a very important role in online shopping. With the importance of technology in our lives and the intense interest in online shopping, the classification of these comments with text classification quite important. In addition to supervised and unsupervised machine learning algorithms, which are very useful and effective in text classification, deep learning algorithms are also very popular and have high success rates. The aim of the study is to provide a brief overview of machine learning methods for text classification. In the data set used, the comments under a product on online shopping sites were collected and a dataset was created by giving class labels according to whether the comments were positive, negative or neutral. There are 6799 positive, 6978 negative and 1393 neutral comments in the data set, which includes a total of 15170 comments. In the classification phase, Convolutional Neural Network (CNN) is proposed as a classifier. Also the proposed method is compared with Decision Trees, Linear Discriminant Analysis, Long Short Term Memory, Quadric Discriminant Analysis, Bidirectional Long Short Term Memory, Efficient Linear Support Vector Machines, Gated Recurrent Unit, Efficient Logistic Regression, Naive Bayes, K-Nearest Neighbor , Ensemble Models, Artificial Neural Networks, Kernel and Support Vector Machines. The highest success was obtained with 90.77% accuracy when using Convolutional Neural Networks.
  • Thumbnail Image
    Item
    Alerjen proteinlerin otomatik sınıflandırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2008) Eren, Öykü; Oğul, Hasan
    Alerjen proteinlerin tanınması ve sınıflandırılması, özellikle son yıllarda sıkça kullanılan genetik değisikliğe uğramıs gıdaların denetlenmesi ve biyo-ilaçların tasarımı açısından büyük önem kazanmıstır. Dünya Sağlık Örgütü ve Gıda ve Tarım Örgütü kurumları bu amaçla alerjen proteinlerin tespiti için bazı rehberler hazırlamıstır. Ancak, bu rehberlerde önerilen yöntemler çoğunlukla yarı-otomatik gerçeklestirilen ve tahmin yeterliliği düsük olan yöntemlerdir. Son birkaç yılda bazı otomatik yöntemler önerilse de bunlar ya istenilen yeterlilik seviyesine ulasamamıs ya da islem zamanı ve bellek gereksinimi açısından avantajsız olmuslardır. Bu çalısmada, alerjen proteinlerin sadece dizilim verisi kullanılarak, farklı makine öğrenme yöntemleri bilinen bazı dizilim gösterim yaklasımları ile denenmistir. Farklı dizilim gösterim yöntemleri için K-En Yakın Komsu, Bulanık K-En Yakın Komsu ve Destek Vektör Makineleri (DVM) kullanılmıs ve sonuçlar karsılastırmalı olarak verilmistir. The prediction and classification of the allergen proteins have received great importance on the inspection of genetically modified food, which are used especially in the recent years, and the design of bio-pharmaceuticals. World Health Organization (WHO) and Food and Agriculture Organization (FAO) prepared guidelines for the prediction of allergen proteins. However, the methods proposed in these guidelines are mostly semi-automatic and have low prediction accuracy. Although some automated methods have been proposed in the last few years, either they could not reach the required sufficiency level or they were insufficient as for the processing time and memory usage. In this study, various machine learning methods were tried with some known sequence representation approaches by using only the sequence data of the allergen proteins. For various sequence representation approaches, K-Nearest Neighbour, Fuzzy K-Nearest Neighbour and Support Vector Machines (SVM) were used and the results were given with comparison.
  • Thumbnail Image
    Item
    Protein homoloji tespitinde bir üst sınıflandırma yaklaşımı
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2007) Polatkan, Aydın Can; Sever, Hayri
    Hesaplamalı biyoloji alanında sınıflandırma problemleri için makine öğrenme teknikleri sıkça ve geniş şekilde kullanılmaktadır. Bu teknikler, girdi olarak sabit uzunluklu nitelik vektörleri istemektedir. Bilindiği üzere proteinler farklı uzunluklara sahip olduklarından dolayı, tüm protein dizilimlerini sabit sayıda nitelik ile göstermek gerekir. Bu amaçla geliştirilen etkili yöntemlerden biri protein dizilimlerinin n-peptit birleşimleridir. Yöntem n uzunluktaki her alt dizginin dizilim içerisindeki görülme yüzdesini ifade eder. Alan karmaşıklığını azaltmak amacıyla, n’nin artan değerleri için, kullanılan aminoasit alfabesi, sonuç vektörün günümüz bellek kaynaklarıyla uyumlu olmasını sağlayacak şekilde düzenli olarak küçültülmüştür. Kullanılan bu çözümde birleşime ait bütün özellik girdileri sadece bir sınıflandırıcıya toplu olarak verilmekteydi. Bu tezde, bu özellik girdileri n-peptit birleşimlere ve küçültülen amino asit alfabelerine göre farklı gruplara ayrılıp, farklı sınıflandırıcılara verilmiştir böylece soyutlanarak daraltılan arama uzayında, gezinen birden fazla tekniğe, bir üst sınıflandırma yaklaşımı denenmiştir. Amaç doğru şekilde yakınsanan ve bizi birbirinden farklı çözüm bölgelerine ulaştıran tekniklere üstsel sınıflandırma yaklaşımı ile daha iyi sonuçlar alabilmektir. Bu yaklaşımda farklı sınıflandırıcıların çıktı değerlerini değerlendirmek üzere ortalama alma, ağırlıklı ortalama alma ve öğrenme kümesinde en başarılı olanı seçme gibi değişik durumlar karşılaştırılmıştır. Her bir yöntem hesaplamalı biyolojinin önemli ve güncel problemlerinden biri olan uzak homoloji tespiti üzerinde test edilmiş ve sonuçlar karşılaştırmalı olarak sunulmuştur. Sonuçlara bakıldığında eğitim kümesinde en başarılı olan sınıflandırıcının sonucunun doğru kabul edildiği durumun diğerlerine göre daha etkili olduğu gözlenmiştir. Sonuçlar arasındaki istatistiksel anlamlılığı dikkatlice incelemek için tüm yöntemler arasında öğrenci T-testleri yapılmış ve testlerin sonuçları yorumlanmıştır. Denenen bütün üst sınıflandırma yaklaşımları yalnız bir sınıflandırıcı kullanılan duruma göre daha etkili bellek kullanımına sahiptir. Destek vektör makineleriyle test edilen bu üst sınıflandırma yaklaşımının sadece uzak homoloji tespitinde değil diğer sınıflandırma problemlerinde de başarılı olacağı düşünülmektedir.