Fen Bilimleri Enstitüsü / Science Institute

Permanent URI for this collectionhttps://hdl.handle.net/11727/1392

Browse

Search Results

Now showing 1 - 4 of 4
  • Item
    The Turkish lip reading using deep learning method
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2023) Berkol, Ali
    Automated lip reading is a research problem that has developed considerably in recent years. Lip reading is evaluated both visually and audibly in some cases. Detecting an unwanted word from a security camera is an example of a visual lip-reading problem. Audio-visual datasets are not applicable where such image-only data is involved. Therefore, we may not have audio input in all cases. In certain cases, it is not feasible to obtain the audio input of the spoken word. In this study, we have gathered a novel Turkish dataset consisting solely of images. The dataset was generated using YouTube videos, which constitute an uncontrolled environment. Consequently, the images present challenging parameters with respect to environmental factors such as lighting conditions, angles, colors, and individual facial characteristics. Despite the variations in facial attributes like mustaches, beards, and makeup, the visual speech recognition problem was addressed using Convolutional Neural Networks (CNN) without making any modifications to the data. The problem was formulated with 10 classes, comprising single words and two-word phrases. While developing the study, comparisons were made with LSTM, BGRU, and Dilated CNN. The proposed study using only-visual data obtained a model which is automated visual speech recognition with a deep learning approach. In addition, since this study uses only-visual data, the computational cost and resource usage is less than in multi-modal studies. Also, we introduce introduced a novel approach called Concatenated Frame Images, which involved combining image frames into a single large frame. It is also the first known study to address the lip reading problem with a deep learning algorithm using a new dataset belonging to the Ural-Altaic languages. Otomatik dudak okuma, son yıllarda önemli ölçüde gelişen bir araştırma problemidir. Dudak okuma bazen görsel olarak, bazen de işitsel olarak değerlendirilmektedir. Güvenlik kamerasından istenmeyen bir kelimenin tespiti, görsel dudak okuma problemine bir örnektir. İlgili birimler sadece görüntü verilerinin olduğu durumlarda işitme-görsel veri setlerinden yararlanamazlar. Bu nedenle, tüm durumlarda ses girdisine sahip olmak mümkün değildir. Telaffuz edilen kelimenin ses girişini her zaman elde etmek mümkün değildir. Bu çalışmada yalnızca görüntü kullanılarak yeni bir Türkçe veri seti toplandı. Yeni veri seti, kontrolsüz bir ortam olan Youtube videoları kullanılarak oluşturulmuştur. Bu nedenle, görüntüler ışık, açı, renk ve yüzün kişisel özellikleri gibi çevresel faktörler açısından zor parametrelere sahiptir. Bıyık, sakal ve makyaj gibi farklı yüz özelliklerine rağmen, görsel konuşma tanıma problemi, veri üzerinde herhangi bir müdahale olmadan Konvolüsyonel Sinir Ağları (CNN) kullanılarak tek kelime ve iki kelime öbeklerini içeren 100 sınıfta geliştirilmiştir. Öte yandan çalışma geliştirilirken LSTM, BGRU ve Dilated CNN ile karşılaştırmalar yapılmıştır. Yalnızca görsel veri kullanılarak yapılan önerilen çalışma, derin öğrenme yaklaşımıyla otomatik görsel konuşma tanıma modeli elde etmiştir. Ayrıca, bu çalışma yalnızca görsel veri kullandığından çoklu modalite çalışmalarına göre hesaplama maliyeti ve kaynak kullanımı daha azdır. Ayrıca, Birleşik İmajlar Yönetimiyle, görüntü çerçevelerini tek bir büyük çerçeveye birleştirme işlemine dayandırarak klasik kesik yöntemle karşılaştırma yaptık. Ayrıca, bu çalışma, Ural-Altay dillerine ait yeni bir veri seti kullanarak derin öğrenme algoritmasıyla dudak okuma problemine yönelik yapılan ilk bilinen çalışmadır.
  • Item
    Ataletsel navigasyon sistemlerinde kestirim için farklı yöntemlerin performanslarının karşılaştırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Gögüş, Bekir; Üçüncü, Murat
    Navigasyon sistemleri, belirli bir referans noktası yardımıyla bir nesnenin konum, hız ve yönelim bilgisini bulan sistemlerdir. Bu sistemlerden en önde gelenlerden birisi de Ataletsel Navigasyon Sistemidir. Bu sistem, dış uyaranlardan bağımsız kendi dahili sistemiyle çalıştığından dolayı tercih edilme oranı gittikçe artmaktadır. Ataletsel Navigasyon Sistemi, bünyesinde barındırdığı ivmeölçer ve dönüölçer sensörlerinden gelen verileri kullanarak bir aracın, konum, yönelim veya hız bilgileri kestirim algoritmaları ile tahmin edilebilir. Bu çalışmada veri seti, bir otomobilin hızlanma verilerinden oluşmaktadır. Bu veriler, şehirler arası bir yolda 30,4 km mesafede değişken hızlar altında oluşturulmuştur. Ölçümler, bir akıllı telefonda MATLAB uygulaması çalıştırılarak elde edilmiştir. Bu zamana kadar yapılan çalışmalarda kestirim için ağırlıklı olarak Kalman Filtre algoritmaları kullanılmıştır. Bu tez çalışmasında ise kestirim algoritmaları olarak geleneksel kestirim yöntemi olan Kalman Filtresinin yanı sıra kendini ispat etmiş derin öğrenme algoritmalarından Uzun Kısa Süreli Bellek (Long Short-Term Memory, LSTM), Çift Yönlü Uzun Kısa Süreli Bellek (Bidirectional Long Short-Term Memory, BLSTM) ve Geçitli Tekrarlayan Birimler (Gated Recurrent Unit, GRU) kullanılmıştır. Bu derin öğrenme algoritmaları farklı optimize edicilerle eğitilerek optimize edicilerin kestirim sonuçlarına etkileri de incelenmiştir. Tez kapsamında detayları verilen benzetim çalışmalarında elde edilen bulgular dikkate alındığında; en başarılı sonuç 2,5414 RMSE değeri ile GRU derin öğrenme ağına aittir. LSTM ve BLSTM derin öğrenme ağlarında ise sırasıyla 2,5547 ve 2,7592 RMSE değerleri elde edilmiştir. Kalman Filtresi ile yapılan çalışmalarda ise RMSE 2,9322 bulunmuştur. Navigation systems are systems that find the position, velocity and orientation information of an object with the help of a specific reference point. One of the most prominent of these systems is the Inertial Navigation System. Since this system works with its own internal system independent of external stimuli, its preference rate is increasing. Inertial Navigation System can estimate the position, orientation or velocity information of a vehicle with estimation algorithms by using data from accelerometer and rotometer sensors. In this study, the dataset consists of acceleration data of an automobile. These data were generated under variable speeds at a distance of 30.4 km on an intercity road. The measurements were obtained by running a MATLAB application on a smartphone. In previous studies, Kalman Filter algorithms have been predominantly used for estimation. In this thesis, in addition to the traditional Kalman Filter, the proven deep learning algorithms Long Short Term Memory (LSTM), Bidirectional Long Short Term Memory (BLSTM) and Gated Recurrent Units (GRU) are used as prediction algorithms. These deep learning algorithms were trained with different optimizers and the effects of the optimizers on the prediction results were also examined. Considering the findings obtained in the simulation studies detailed in the thesis, the most successful result belongs to the GRU deep learning network with an RMSE value of 2.5414. In LSTM and BLSTM deep learning networks, RMSE values of 2.5547 and 2.7592 were obtained respectively. In the studies conducted with the Kalman Filter, the RMSE was found to be 2.9322.
  • Item
    CAN Bus Sistemi için FPGA Tabanlı Saldırı Tespit Sisteminin Geliştirilmesi
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Arpacı, Orhan; Erdem, Hamit
    Günümüz araç sistemleri teknolojik açıdan hızla gelişmektedir. Gelişen araç sistemlerindeki elektronik ünitelerin sayısı da git gide artmaktadır. Araç içi elektronik birimlerin farklı iletişim ağları ile dış dünya iletişimime açılması ile bu birimlerin veri iletişiminin güvenliği araştırma konusu olmuştur. Günümüz araçlarda araç içi iletişimde CAN veri yolu kullanılmaktadır. CAN veri yolu bit hatası açısından güvenilir bir veri yolu olsa da birçok güvenlik açığını da barındırmaktadır. CAN veri yolunun güvenlik açıklarını kapatmak için birçok saldırı tespit sistemi geliştirilmektedir. Saldırı tespit sistemleri ile CAN veri yoluna yapılabilecek saldırıların tespiti ve karşı önlemlerin alınması hedeflenmektedir. Bu tez kapsamında araç içerisindeki CAN veri yoluna fiziksel olarak yapılacak bir saldırıyı tespit edebilen bir saldırı tespit sistemi gerçeklenmiştir. Bu gerçeklemede elektronik birimlerin veri transferi sırasında, CAN veri yolunda oluşturdukları sinyaller incelenmiştir. İncelenen CAN sinyallerinden, sinyallerin parmak izlerinin çıkarılabileceği kanıtlanmıştır. Sinyallerin parmak izlerinin çıkarılması için FPGA üzerinde bir CAN IP çekirdeği geliştirilmiştir. Çıkarılan sinyal özellikleri MLP ve LSTM olmak üzere iki farklı tür yapay sinir ağlarının eğitiminde kullanılmıştır. Eğitilen yapay sinir ağları ile CAN veri yoluna fiziksel olarak saldırı gerçekleştiren bir elektronik cihazın bıraktığı sinyalin parmak izlerinden saldırı tespiti yapılmıştır. Today’s vehicle systems have been developing rapidly. The number of electrical units in the vehicle systems are increasing. With the opening of the in-vehicle electronic units to the outside world with different communication networks, the security of the data communication of these units has been the subject of research. In vehicle systems CAN bus is used to communicate between electrical control units (ECU). CAN bus is a very reliable communication network according to bit error rate. However, CAN bus has numerous vulnerabilities in terms of security. In order to seal these security vulnerabilities many intrusion detection systems (IDS) have been developed. With intrusion detection systems, it is aimed to detect attacks on the CAN bus and take countermeasures. In this thesis, an intrusion detection system which can detect attacks in the physical layer of the CAN bus. For his purpose, CAN signals, which are produced by ECUs, were analyzed. It is proven that ECU footprints can be extracted from CAN signals. In this thesis, to extract footprint of signals, a CAN IP core was implemented on FPGA. Extracted footprints were used to train different neural network architectures which are MLP and LSTM. Trained neural networks were used to detect intrusions by using signal footprints of intruder ECUs.
  • Thumbnail Image
    Item
    Deep learning for biological sequences
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2019) Paker, Ahmet; Bostancı, Gazi Erkan
    Nowadays, with the increase in biological knowledge, the use of deep learning in bioinformatics and computational biology has increased. Newly, deep learning is widely used to classify and analyze biological sequences. In recent years, deep neural network architectures such as Convolutional and Recurrent Neural Networks have been developed in order to achieve more successful results when compared to classical machine learning algorithms. In this thesis, the discussed problem is a bioinformatics problem. Therefore, it is discussed whether the given microRNA molecule binds to the mRNA molecule. MicroRNAs (miRNAs) are non-coding and small RNA molecules of ~23 base length that play an important role in gene expression cycle. After transcription, they bind to target mRNAs and cause mRNA cleavage or translation inhibition. Rapid and efficient determination of the binding sites of miRNAs is a major problem in molecular biology. In this thesis study, Long Short Term Memory (LSTM) network which is based on deep learning, has been developed with the help of an existing duplex sequence model. The study provides a comparative approach based on different data sets and configurations. In addition, a web tool has been developed to effectively and quickly identify human microRNA target sites and provide a visual interface to the end-user. Compared to the six classical machine learning methods, the proposed LSTM model gives better results in terms of some evaluation criteria. Günümüzde, biyolojik bilgideki artışla birlikte, biyoenformatik ve hesaplamalı biyolojide derin öğrenme kullanımı artmıştır. Derin öğrenme biyolojik dizileri sınıflandırmak ve analiz etmek için yaygın olarak kullanılmaktadır. Son yıllarda klasik makine öğrenme algoritmalarına kıyasla daha başarılı sonuçlar elde etmek için Konvolüsyonel ve Tekrarlayan Sinir Ağları gibi derin sinir ağ mimarileri geliştirilmiştir. Bu tezde tartışılan problem bir biyoenformatik problemidir. Bu sebeple, verilen mikro RNA molekülünün mRNA molekülüne bağlanıp bağlanmadığı tartışılmaktadır. MikroRNA'lar (miRNA'lar) gen ekspresyonunda önemli bir rol oynayan ~ 21-23 baz uzunluğundaki kodlayıcı olmayan RNA molekülleridir. Transkripsiyondan sonra, mRNA'ları hedef alırlar ve mRNA yıkımına veya translasyon inhibisyonuna neden olurlar. miRNA'ların bağlanma bölgelerinin hızlı ve etkili bir şekilde belirlenmesi moleküler biyolojide büyük bir sorundur. Bu tezde, mevcut bir dubleks sekans modeli yardımıyla Uzun Kısa Süreli Belleğe (LSTM) dayanan derin bir öğrenme yaklaşımı geliştirilmiştir. Çalışma, farklı veri kümeleri ve yapılandırmalarına dayanan karşılaştırmalı bir yaklaşım sunmaktadır. Ek olarak, insan miRNA hedef bölgelerini etkili ve hızlı bir şekilde tanımlamak ve son kullanıcıya görsel bir arayüz sağlamak için bir web arayüzü geliştirilmiştir. Altı klasik makine öğrenme yöntemiyle karşılaştırıldığında, önerilen LSTM modeli bazı değerlendirme kriterleri açısından daha iyi sonuçlar verir.