Enstitüler / Institutes

Permanent URI for this communityhttps://hdl.handle.net/11727/1390

Browse

Search Results

Now showing 1 - 10 of 18
  • Item
    Derin sinir ağlarını kullanarak uzun ve kısa videolarda zamansal eylem tanıma
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Şahin, Yağmur; Sert, Mustafa
    Günümüzde videoların büyük bir veri kaynağı oluşturması, anlamsal bilgi çıkarımı ve eylem tanıma gibi konularda derin öğrenmenin önemini artırmıştır. Videoların karmaşık ve dinamik yapısı nedeniyle gelişmiş modelleme teknikleri ve algoritmaların kullanılması gerekliliği ortaya çıkmıştır. Bu çalışmada, sayısal teknolojilerle artan video içeriklerinden anlamsal bilgi çıkarımı amacıyla, videolarda eylem tanıma problemi araştırılmıştır. Mevcut çalışmaların birçoğu, kısa videoların sınıflandırılmasına odaklanmaktadır. Tez kapsamında, kısa videoların yanısıra, uzun videoların sınıflandırması için üç boyutlu evrişimsel sinir ağları ve dikkat mekanizmasına dayalı özgün bir model önerilmektedir. Bu entegrasyon hem kısa hem de uzun videolardaki öğrenme sürecini iyileştirmekte ve aktivitelerin doğru tanımlanabilmesine olanak sunmaktadır. Önerilen model, uzun videoların sınıflandırması için öncelikle bölge öneri ağı adı verilen bir sinir ağı ile uzun videoların olası olay sınırlarını tespit etmekte, daha sonra önerilen video sınırları için sınıflandırma yapmaktadır. HMDB, UCF ve ActivityNet gibi veri kümeleri üzerinde gerçekleştirilen deneysel çalışmalarda, dikkat mekanizmalarının model performansını önemli ölçüde artırdığı görülmüştür. Önerilen model, 3D evrişimsel sinir ağları ve dikkat mekanizmalarının entegrasyonuyla, videolardan öznitelik çıkarımı ve aktivite tespiti yeteneklerini geliştirmiştir. Kısa video klipleri için HMDB ve UCF veri kümeleri, uzun videolar içinse ActivityNet veri kümesi kullanılarak modelin farklı aktivite tipleri ve video yapılarındaki tanıma yeteneği ölçülmüştür. Özellikle UCF ve HMDB veri kümelerinde, Öz Dikkat mekanizması kullanılan model yüksek doğruluk oranlarına ulaşırken, ActivityNet’te Çok Başlıklı Dikkat mekanizması uzun videolardaki karmaşık etkileşimleri daha etkili bir şekilde tanıma yeteneği sergilemiştir. Bu bulgular, dikkat mekanizmalarının videolardan anlamsal bilgi çıkarımında önemli bir rol oynadığını ve derin öğrenme yöntemlerinin bu alandaki potansiyelini ortaya koymaktadır. Elde edilen sonuçlar, önerilen derin öğrenme modelinin farklı video yapılarına uyum sağlama yeteneğini ve etkili bilgi çıkarımı gerçekleştirme kapasitesini açıkça ortaya koymaktadır. In today’s world, the vast amount of video data has increased the importance of deep learning in areas such as semantic information extraction and action recognition. Due to the complex and dynamic nature of videos, there is a need for advanced modeling techniques and algorithms. This study investigates the problem of action recognition in videos with the aim of extracting semantic information from the increasing video contents with digital technologies. Many of the existing studies focus on the classification of short videos. Within the scope of the thesis, an original model based on three-dimensional convolutional neural networks and attention mechanism is proposed for the classification of not only short videos but also long videos. This integration enhances the learning process in both short and long videos, enabling accurate action detection. The proposed model focuses on classifying long videos by first identifying potential event boundaries within these videos using a neural network known as region proposal network, and subsequently performing classification on the proposed video segments. Experimental studies carried out on datasets like HMDB, UCF, and ActivityNet have shown that attention mechanisms significantly improve model performance. The proposed model, integrating 3D convolutional neural networks and attention mechanisms, has improved feature extraction and activity detection capabilities from videos. The model’s ability to recognize various activity types and video structures was evaluated using the HMDB and UCF datasets for short video clips and the ActivityNet dataset for longer videos. Specifically, in the UCF and HMDB datasets, the model using the Self Attention mechanism achieved high accuracy rates, while in ActivityNet, the Multi-Head Attention mechanism displayed better ability to recognize complex interactions in longer videos. These findings highlight the crucial role of attention mechanisms in extracting semantic information from videos and reveal the potential of deep learning methods in this area. The obtained results clearly indicate the proposed deep learning model’s adaptability to different video structures and its capacity for effective information extraction.
  • Item
    X-Ray görüntülerinden köpeklerde uzun kemik kırıklarının meydana gelme zamanına göre sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Tezcan, Berkan; Güney, Selda
    Biyomedikal alanda önemli bir rol oynayan derin öğrenme algoritmaları, son yılların en popüler konularından biridir. Bu algoritmalar, görüntüleme yöntemleri kullanılarak hastalık ve kırık tespiti, biyolojik veri kestirimi, doku ve organ bölütlemesi, eksik veri tamamlanması gibi birçok uygulama için başarılı sonuçlar sağlamaktadır. Kemiklerdeki kırık tespiti, özellikle bu alanda en çok araştırılan konulardan biridir. Ancak, bu uygulamaların büyük çoğunluğu insan tıbbında kullanılırken, veteriner tıp uygulamaları daha az araştırılmıştır. Bu alandaki eksiklik, tez konusunun en büyük motivasyon kaynağı olmuştur. Bu tez çalışması kapsamında, köpeklere ait X-ray görüntülerini içeren veri seti ile uzun kemiklerdeki kırığın varlığının saptanması ve var olması durumunda da kırığın zamanına göre sınıflandırılması hedeflenmiştir. Biyomedikal görüntü işleme alandaki pek çok çalışma gibi, bu çalışmada da farklı derin öğrenme mimari karşılaştırılarak sonuçlar en iyileştirilmeye çalışılmıştır. Deep learning algorithms, which play an important role in the biomedical field, are one of the most popular topics in recent years. These algorithms provide successful results for many applications such as disease and fracture detection, biological data prediction, tissue and organ segmentation, and missing data completion using imaging methods. Fracture detection in bones is particularly one of the most researched topics in this field. However, while the majority of these applications are used in human medicine, veterinary medicine applications have been less studied. The lack of research in this field has been the main motivation for the thesis topic. Within the scope of this thesis study, the aim is to detect the presence of a fracture in the long bones in dogs using a dataset containing X-ray images of dogs, and to classify the fracture according to its time of occurrence if it exists. Like many studies in the field of the biomedical image processing, different deep learning architectures are compared, and the results are tried to be optimized.
  • Item
    Derin öğrenme ve makine öğrenme teknikleri kullanılarak göz hastalıklarının tespiti
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Arslan, Gözde; Erdaş, Çağatay Berke
    Göz hastalıkları insan yaşamını ciddi derecede etkileyen sağlık sorunlarından biridir. Göz hastalıkları arasında bulunan katarakt, diyabetik-retinopati, glokom gibi hastalıklar görme bozukluğuna ve geri dönüşü olmayan göz kusurlarına neden olur. İnsan yaşamında genetik, yaş ve çevresel faktörler göz sağlığını önemli ölçüde etkiler. Hastalık tespitin yapılması ve dolayısıyla hastanın yaşam kalitesinin yükseltilebilmesi için hastalığın doğru bir şekilde tespiti kritik bir rol oynamaktadır. Gelişen teknoloji ile yapay zeka göz kusurlarını ve dolayısıyla ilgili gözde bir hastalık olup olmadığını tespit edebilmektedir. Bu tez çalışması, önemli sağlık sorunlarından göz hastalıklarının derin öğrenme modelleri ve makine öğrenmesi algoritmaları kullanılarak tespit edilmesine yönelik çözümler geliştirmeyi amaçlamaktadır. Bu çalışmada derin öğrenme türlerinden biri olan Konvolüsyonel Sinir Ağları modelleri ve makine öğrenme algoritmaları kullanılmıştır. Hastalık başarısının tahmini ve sınıflandırılmasında geleneksel makine öğrenmesi algoritmalarından Destek Vektörü Makinesi, Naive Bayes Sınıflandırıcısı, K-En Yakın Komşu, Rastgele Orman kullanılmıştır. CNN modelinden DenseNet, EfficientNet, VGG, ResNet ve Xception mimarileri kullanılmıştır. Çoklu sınıflandırma probleminde, hastalık tespiti için kullanılan veri setinde 1074 normal, 1007 glokom, 1098 diyabetik-retinopati, 1038 katarakt verileri olmak üzere toplamda 4217 Retinal Fundus görüntüsü içermektedir. İkili sınıflandırma probleminde, hastalık tespiti için kullanılan veri setinde 1374 normal ve 1374 hastalıklı veriler olmak üzere toplamda 2748 Retinal Fundus görüntüsü içermektedir. Retinal Fundus göz hastalığı sınıflandırması çalışmasında ise hazır CNN mimarileri ve makine öğrenme ile mevcut probleme uyarlanarak deneyler yürütülmüş ve performansları karşılaştırılmıştır. CNN mimarilerinin konvolüsyonel katmalarında otomatik olarak üretilen öznitelikler makine öğrenme sınıflandırıcılarını beslemek için kullanılmıştır. Tespit ve sınıflandırma çalışmalarında elde edilen performanslara göre derin öğrenme mimarilerinin makine öğrenmesi algoritmalarından üstün geldiği gözlemlenmiştir. Eye diseases are one of the health problems that seriously affect human life. Diseases such as cataract, diabetic-retinopathy, glaucoma, which are among the eye diseases, cause visual impairment and irreversible eye defects. Genetic, age and environmental factors significantly affect eye health in human life. Accurate detection of the disease plays a critical role in detecting the disease and thus improving the quality of life of the patient. With the developing technology, artificial intelligence can detect eye defects and therefore whether there is a disease in the related eye. This thesis study aims to develop solutions for the detection of eye diseases, which are important health problems, by using deep learning models and machine learning algorithms. In this study, Convolutional Neural Network models, which is one of the deep learning types, and machine learning algorithms were used. In the prediction and classification of disease success, Support Vector Machine, Naive Bayes Classifier, K-Nearest Neighbor, Random Forest, which are traditional machine learning algorithms, were used. DenseNet, EfficientNet, VGG, ResNet and Xception architectures from the CNN model were used. In the multi-classification problem, the data set used for disease detection includes a total of 4217 Retinal Fundus images, 1074 normal, 1007 glaucoma, 1098 diabetic-retinopathy, 1038 cataract data. In the binary classification problem, the data set used for disease detection includes a total of 2748 Retinal Fundus images, 1374 normal and 1374 diseased data. In the retinal fundus eye disease classification study, experiments were carried out by adapting them to the existing problem with ready-made CNN architectures and machine learning, and their performances were compared. Automatically generated features in convolutional layers of ready-made CNN architectures are used to feed machine learning classifiers. According to the performances obtained in detection and classification studies, it has been observed that deep learning architectures are superior to machine learning algorithms.
  • Item
    Derin öğrenme yöntemleriyle trafik işaretlerinin gerçek zamanlı sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2024) Usanmaz, Kemal; Güney, Selda
    Günümüzde trafik güvenliği ve sürüş deneyimi, gelişmiş sürücü destek sistemlerini (Advanced Driver Assistance System, ADAS) önemli ölçüde etkilenmektedir. Sürücüler için önemli bilgiler taşıyan, uyarıcı niteliğinde olan ve trafiğin düzenli akışını sağlayan trafik işaretleri çoğu zaman sürücüler tarafından fark edilemez veya trafik işaretine bakma esnasında sürücünün dikkatini dağıtabilir, bunun sonucunda da çeşitli kazalar meydana gelir. Bu sebeple ADAS’ın içinde yer alan trafik işaretlerini algılayan ve sınıflandıran sistemler mevcuttur. Derin öğrenme teknikleri, özellikle de konvolüsyonel sinir ağı (Convolutional Neural Network, CNN) mimarileri üzerinden yapılan çalışmalar, bu alanda önemli ilerlemelere yol açmıştır. Bu tez çalışmasında derin öğrenme yöntemlerinden CNN kullanılarak sınıflandırma işlemleri gerçekleşmiş ve seçilen algoritmalardan hangisinin gerçek zamanlı bir sistemde en iyi performansı gösterdiği tespit edilmiştir. Bu çalışmada veri seti olarak, 43 sınıftan oluşan ve 39209 trafik işareti görüntüsü içeren Alman Trafik İşaretleri Bulma Veri Seti (German Traffic Sign Recognition Benchmark, GTSRB) kullanılmıştır. Veri setinin CNN algoritmalarına etkisini belirleyebilmek için veri arttırma teknikleri kullanılarak yeni veri kümeleri GTSRB’den türetilmiştir. Literatür araştırması sonucu seçilen SqueezeNet, GoogleNet, ResNet50 ve AlexNet algoritmaları için en iyi performansı verecek hiper parametreler sistematik bir yöntemle belirlenmiş, Matlab yazılımıyla oluşturulan kullanıcı arayüzüyle gerçek zamanlı sınıflandırma testleri yapılmıştır. Gerçek zamanlı testlerin sonucunda ResNet50 algoritmasının, %93,49 sınıflandırma doğruluk oranı ile gerçek zamanlı bir sistemde çalışabileceği gösterilmiştir. Nowadays, traffic safety and driving experience are significantly affected by advanced driver assistance systems (ADAS). Traffic signs, which carry important information for drivers, serve as a warning and ensure the orderly flow of traffic, often cannot be noticed by drivers, or may distract the driver while looking at the traffic sign, resulting in various accidents. For this reason, there are systems that detect and classify traffic signs within ADAS. Studies on deep learning techniques, especially convolutional neural network (CNN) architectures, have led to significant advances in this field. In this study, classification processes were carried out using CNN, one of the deep learning methods, and it was determined which of the selected algorithms showed the best performance in a real-time system. In this study, the German Traffic Sign Recognition Benchmark (GTSRB), which consists of 43 classes and contains 39209 traffic sign images, was used as the data set. In order to determine the effect of the dataset on CNN algorithms, new datasets were derived from GTSRB using data augmentation techniques. The hyper parameters that will give the best performance for the SqueezeNet, GoogleNet, ResNet50 and AlexNet algorithms selected as a result of literature research were determined with a systematic method, and real-time classification tests were carried out with the user interface created with Matlab software. As a result of real-time tests, it has been shown that the ResNet50 algorithm can work in a real-time system with a classification accuracy rate of 93.49%.
  • Item
    Derin öğrenmeye dayalı bir yaklaşım kullanarak kitap öneri videolarından başlık çıkarma
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2024) Sarımehmetoğlu, Bartu; Erdem, Hamit
    Resimlerden ve videolardan metin çıkarmak; video arama, video düzenleme ve çeviri dahil olmak üzere çok çeşitli uygulamalarla ortaya çıkan bir araştırma alanıdır. Günümüzde farklı dillerde kitap tanıtım videoları sosyal medyada ve özellikle YouTube'da paylaşılmaktadır. Bu çalışmada, kitap tanıtım videoları aracılığıyla kitap başlıklarının alınması önerilmektedir. Geliştirilen sistem girdi olarak video çeker ve kitapların adlarını ayırır. İzleyici, tespit edilen kitap başlıklarına tıklayarak istediği kitabı seçebilir ve videonun ilgili bölümünü izleyebilir. Bu uygulama, izleyici tarafından zaman tasarrufu sağlar. Bu uygulamaya ulaşmak için kitapların adlarını videolardan almak için derin öğrenmeye dayalı bir sistem geliştirilmiştir. Çalışmada YOLO bazlı yöntem kullanılmıştır. Çalışmada farklı YOLO algoritmaları kullanılmış ve YOLOv5'in daha başarılı olduğu bulunmuştur. Bu çalışma, kitap tanıtım videolarından kitap başlıklarını çıkarmak için derin öğrenmeye dayalı bir yaklaşım geliştirerek metin çıkarma ve video analizi alanına katkıda bulunmaktadır. Extracting text from images and videos is an emerging field of research with a wide range of applications, including video search, video editing, and translation. Nowadays, book promotion videos in different languages are shared on social media and especially on YouTube. In this study; It is recommended to take book titles through book promotion videos. The developed system takes video as input and separates the names of the books. The viewer can select the desired book by clicking on the detected book titles and watch the relevant part of the video. This application result in time saving by the viewer. In order to achive this application, a deep learning-based system was developed to retrieve the names of books from videos. YOLO-based method was used in the study. Different YOLO algorithms were used in the study, and YOLOv5 was found to be more successful. This study contributes to the field of text extraction and video analysis by developing a deep learning-based approach to extract book titles from book promotion videos.
  • Item
    Kağıt bardak makinesinin otomasyonu ve gerçek zamanlı görüntü işlemeye dayalı ürün tespit yöntemi
    (2022) Aydın, Alaaddin; Güney, Selda
    Ülkemizde kâğıt bardak üretimi yapan firma sayısı her geçen gün giderek artmaktadır. Karton bardak basımı yapan makineler Çin, Kore vb. ülkelerde üretilmektedir. Türkiye’de de yerli olarak üretilen makineler vardır. Bu makinelerde bardaklar 4, 7, 8, 12 oz diye tabir edilen ölçülerde basılmaktadır. Servo motor, asenkron motor gibi motorlar ile makineler kontrol edilmektedir. Makine üstüne takılan sensörler ve ısıtıcı rezistanslar yardımıyla kaliteli ve fire kaybı az olan bardaklar basılmaktadır. Bu çalışmada daha önce üretimi yapılmış olan bardak basma makinesini servo motor, asenkron motor ve PLC ile kontrol ederek, görüntü işleme tabanlı hata tespiti yapan ve hatalı ürünü ayıklayan bir sistem tasarlanmıştır. Hata tespiti için gerçek zamanlı bir kamera aracılığıyla derin öğrenme yöntemlerinden Yolo ve Haarcascade algoritmaları kullanılarak sınıflandırma, OpenCv kütüphanesi kullanılarak da gerçek zamanlı nesne tespiti gerçekleştirilmiştir. Tespit edilen hatalı bardak bir piston ile üretim bandından alınıp bir kutuya atılmaktadır. Sensörler, servo motor enkoderi ve kullanıcı tarafından gelen komutlarla servo motor sürücüsüne komutlar verilmektedir. Asenkron sürücü parametreleri sürücü üzerinden ayarlanmaktadır. Bütün komutlar kullanıcı tarafından bir ekran üzerinden girilebilmekte ve üretilen ürünlerin sayısı yine ekran üzerinde kurulan sistem üzerinden izlenebilmektedir. Çalışmanın yapay zeka kısmında hatalı bardakların tespiti için önceden kendi oluşturduğumuz veri setinden alınan veriler Python dilinde ve Google Colab ortamında, YOLO algoritmasının modelleri ile sınıflandırılmıştır. Modeller eğitildikten sonra Jupyter Lab (tümleşik geliştirme ortamı) üzerinde OpenCv kütüphaneleri kullanılarak gerçek zamanlı olarak kameradan gelen veriler tespit edilmiştir. Haarcascade algoritması kullanılarak eğitilen modeller, gerçek zamanlı olarak PyCharm üzerinde OpenCv kütüphanesi kullanılarak tespit edilmiştir. Farklı derin öğrenme yöntemlerinin gerçek zamanlı sistemde performans üzerine etkisi incelenmiş ve başarılı sonuçlar elde edilmiştir. En başarılı sonuç Yolov5x mimarisi kullanılarak gerçekleştirilen gerçek zamanlı uygulamada % 90,8 doğruluk oranı ile elde edilmiştir. The number of companies producing paper cups in our country is increasing day by day. Paper cup printing machines are produced in countries such as China, Korea, etc. There are also domestically produced machines in Turkey. These machines can print paper cups in sizes called 4, 7, 8, 12 oz. Machines are controlled by motors such as servo motors and asynchronous motors. With the help of sensors and heating resistances mounted on the machine, high quality cups with less waste loss are printed. In this study, a system that controls the previously produced cup press machine with servo motor, asynchronous motor and PLC, makes image processing based error detection and removes the faulty product is designed. For error detection, classification using the deep learning methods Yolo and Haarcascade algorithms through a real-time camera, and real-time object detection using the OpenCv library. The detected faulty cup is taken from the production line with a piston and thrown into a box. Commands are given to the servo motor driver with the commands from the sensors, the servo motor encoder and the user. Asynchronous drive parameters are set on the drive. All commands can be entered by the user on a screen and the number of products produced can be monitored over the system installed on the screen. In the artificial intelligence part of the study, the data obtained from the dataset we created beforehand for the detection of faulty cups were classified with the models of the YOLO algorithm in the Python language and Google Colab environment. After the models were trained, data from the camera were detected in real time using OpenCv libraries on Jupyter Lab (integrated development environment). The data trained using the Haarcascade algorithm were detected in real time using the OpenCv library on PyCharm. The effect of different deep learning methods on performance in the real-time system has been examined and successful results have been obtained. The most successful result was obtained with 90.8% accuracy in real-time application using Yolov5x architecture.
  • Item
    İnsan hareketlerinin kinect sensör kullanılarak sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Açış, Büşra; Güney, Selda
    Son yıllarda sağlık ve güvenlik gibi birçok alanda insan hareketlerini sınıflandırmaya yönelik çalışmalar yapılmaktadır. Son yıllarda kullanım alanı daha çok gelişen görüntü işleme ve sınıflandırma algoritmaları bu alanda da kullanılmaya başlanmıştır. Bu sınıflandırma algoritmalarının öncül yöntemleri makine öğrenmesi ve derin öğrenmedir. Bu çalışmada, Kinect sensör kullanılarak elde edilen veri seti üzerinde insan hareketlerinin sınıflandırılması yapılmıştır. Kullanılan veri seti içerisinde gerçek zamanlı insan duruş bilgilerinin ve görüntülerinin bulunduğu literatürde hazır halde bulunan CAD60 veri setidir. Bu veri setinde, farklı insanların farklı hareketlerini/duruşlarını içeren veriler bulunmaktadır. Bu çalışma kapsamında, MATLAB uygulaması kullanılarak derin öğrenme tabanlı ve makine öğrenme tabanlı yöntemlerle insan hareketlerini sınıflandırma yapılmıştır. Ham veri seti üzerinde, geriye doğru öznitelik seçme (BFS) ile elde edilen verilerle ve Uzun Kısa Süreli Bellek (Long Short Term Memory – LSTM) ile öznitelik çıkarma ile elde edilen verilere makine öğrenmesi tabanlı metotlar uygulanarak sınıflandırma çalışmaları yapılmıştır. Bunu yanı sıra LSTM, Evrişimsel Sinir Ağları (Convolutional Neural Network, CNN) ile sıfırdan öğrenme (learn from scratch) ve öğrenme aktarımı (transfer learning) yöntemi ile insan hareketleri sınıflandırılmıştır. Bu altı yöntemin sonunda elde edilen başarı değerleri birbirleri ile kıyaslanmıştır ve maksimum başarı değeri LSTM ile öznitelik çıkarma yönteminde elde edilmiştir. In recent years, studies have been carried out to classify human movements in many areas such as health and safety. Image processing and classification algorithms, which have been used more in recent years, have started to be used in this field as well. The predecessor methods of these classification algorithms are machine learning and deep learning. In this study, the classification of human movements was made on the data set obtained using the Kinect sensor. It is the CAD60 dataset, which is available in the literature, which contains real-time human posture information and images in the data set used. In this dataset, there are data containing different movements/stances of different people. Within the scope of this study, human movements were classified using deep learning-based and machine learning-based methods using MATLAB application. Classification studies were carried out by applying machine learning-based methods to the data obtained by backward feature selection (BFS) and feature extraction with Long Short Term Memory (LSTM) on the raw data set. In addition, human movements are classified with LSTM, Convolutional Neural Networks (CNN), learn from scratch and transfer learning method. The success values obtained at the end of these six methods were compared with each other and the maximum success value was obtained in the feature extraction method with LSTM.
  • Item
    Kalite kontrol sistemi için derin öğrenme tabanlı bir model önerisi
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Çelik, Yaren
    Ahşap hammaddeler günümüzde birçok endüstride yaygın olarak kullanılmaktadır. Ahşap hammadde üzerinde olan ve gözden kaçan istenmeyen görüntüler elde edilen ürünü görsel ve dayanıklılık açısından negatif etkilemekte, satışını engellemektedir. Bu nedenle bu tür hammaddelerin üretim sürecine girmeden belirlenmesi veya üretim hattına kurulacak bir otomasyon sistemi ile hatalı hammaddelerin belirlenerek üretim dışında bırakılması istenir. Kusurlu hammaddenin elle ve gözle kontrolü zor ve yanıltıcıdır. Sürekli gelişen dijital teknoloji ve sistemler sayesinde bu tür kontroller için otomasyon sistemleri geliştirilmektedir. Son yıllarda araştırmacılar görüntü işleme tabanlı denetim sistemlerini kullanarak kalite kontrol uygulamaları geliştirmektedirler. Bu teknolojiler sayesinde hammadde üzerinde olan kusurlar üretimin erken aşamalarında fark edilerek oluşacak son ürünün kusurlu veya hatalı olması engellenebilir. Böylece işgücü ve malzeme kayıpları nedeniyle oluşacak maliyetler ve harcanan zaman azaltılabilmektedir. Bu çalışmada, üretim hattı üzerinde kurulacak özel bir kamera sistemi ile elde edilen görüntüler üzerindeki kusurları belirleyecek model derin öğrenme yöntemleri ile elde edilmiş ve kusurlu kusursuz ayrımı yapan sistem önerisi geliştirilmiştir. Kusurların tespiti için görüntü işlemede ayrım tabanlı bir yöntem olan Evrişimsel Sinir Ağı (ESA), en uygun yöntemlerden biri olması nedeniyle tercih edilmiştir. Ayrıca ShuffleNet, AlexNet, GoogleNet gibi farklı ESA mimarileri ve parametreleri denenerek probleme en uygun olan mimari belirlenmeye çalışılmıştır. Ahşap ürünlerinde kusurlu ve kusursuz ayrımı yapan kalite kontrol sistemleri için çalışmada dikkate alınan ESA yönteminde, MobileNet, DenseNet ve Inception mimarileri umut verici sonuçlar vermektedir. Ayrıca ESA yöntemi denemelerine görüntü çoğaltma ve görüntü iyileştirme yöntemleri hem ayrı ayrı hem de bir arada eklenerek bu yöntemlerin performans metriklerini nasıl etkilediği incelenmiştir. Yapılan her denemede parametreler değiştirilmiş performans metrikleri üzerindeki etkileri incelenmiştir. Böylece en iyi performansı veren parametre seti ile ESA mimarisine karar verilmiştir. Wood as a raw material is currently used in many industries. Unsightly texture and other defects on the wood make it less visually appealing and impact its durability as a material. Blemishes on the wood reduce its value, and defective material should be identified and removed from production. Since it’s difficult to spot defects through visual or manual inspection, an automated system integrated into the production system is a viable option. With the help of advanced digital technology, automated systems for such controls are being developed. In recent years, researchers have been developing quality control applications using image processing-based inspection systems. By means of these technologies, defects in the raw material can be spotted in the early stages of production. Early identification of defects will prevent the production of faulty end products and will reduce labor and material losses in production. In this study, an integrated system is proposed to identify defective material. The proposed system acquires images of the raw material through a special camera installed on the production line. Digital images will be analyzed by deploying deep learning methods, and defective materials will be set apart. Convolutional Neural Network (CNN), a distinction-based method in image processing for detecting defects, was preferred because of its suitability. In addition, different CNN architectures such as ShuffleNet, AlexNet, GoogleNet, and parameters associated with these architectures were tested to identify the most suitable architecture for this problem. In the CNN method, considered in the study for quality control systems to separate out defective wood products, MobileNet, DenseNet, and Inception architectures gave promising results. In addition, image augmentation and image enhancement methods were added to the CNN method experiments, both separately and together, and their effect on performance metrics was examined. In each trial, parameters were modified, and the impact of parameters on the performance metrics was examined.Consequently, CNN architecture was selected with the parameter set giving the best performance.
  • Item
    Ataletsel navigasyon sistemlerinde kestirim için farklı yöntemlerin performanslarının karşılaştırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Gögüş, Bekir; Üçüncü, Murat
    Navigasyon sistemleri, belirli bir referans noktası yardımıyla bir nesnenin konum, hız ve yönelim bilgisini bulan sistemlerdir. Bu sistemlerden en önde gelenlerden birisi de Ataletsel Navigasyon Sistemidir. Bu sistem, dış uyaranlardan bağımsız kendi dahili sistemiyle çalıştığından dolayı tercih edilme oranı gittikçe artmaktadır. Ataletsel Navigasyon Sistemi, bünyesinde barındırdığı ivmeölçer ve dönüölçer sensörlerinden gelen verileri kullanarak bir aracın, konum, yönelim veya hız bilgileri kestirim algoritmaları ile tahmin edilebilir. Bu çalışmada veri seti, bir otomobilin hızlanma verilerinden oluşmaktadır. Bu veriler, şehirler arası bir yolda 30,4 km mesafede değişken hızlar altında oluşturulmuştur. Ölçümler, bir akıllı telefonda MATLAB uygulaması çalıştırılarak elde edilmiştir. Bu zamana kadar yapılan çalışmalarda kestirim için ağırlıklı olarak Kalman Filtre algoritmaları kullanılmıştır. Bu tez çalışmasında ise kestirim algoritmaları olarak geleneksel kestirim yöntemi olan Kalman Filtresinin yanı sıra kendini ispat etmiş derin öğrenme algoritmalarından Uzun Kısa Süreli Bellek (Long Short-Term Memory, LSTM), Çift Yönlü Uzun Kısa Süreli Bellek (Bidirectional Long Short-Term Memory, BLSTM) ve Geçitli Tekrarlayan Birimler (Gated Recurrent Unit, GRU) kullanılmıştır. Bu derin öğrenme algoritmaları farklı optimize edicilerle eğitilerek optimize edicilerin kestirim sonuçlarına etkileri de incelenmiştir. Tez kapsamında detayları verilen benzetim çalışmalarında elde edilen bulgular dikkate alındığında; en başarılı sonuç 2,5414 RMSE değeri ile GRU derin öğrenme ağına aittir. LSTM ve BLSTM derin öğrenme ağlarında ise sırasıyla 2,5547 ve 2,7592 RMSE değerleri elde edilmiştir. Kalman Filtresi ile yapılan çalışmalarda ise RMSE 2,9322 bulunmuştur. Navigation systems are systems that find the position, velocity and orientation information of an object with the help of a specific reference point. One of the most prominent of these systems is the Inertial Navigation System. Since this system works with its own internal system independent of external stimuli, its preference rate is increasing. Inertial Navigation System can estimate the position, orientation or velocity information of a vehicle with estimation algorithms by using data from accelerometer and rotometer sensors. In this study, the dataset consists of acceleration data of an automobile. These data were generated under variable speeds at a distance of 30.4 km on an intercity road. The measurements were obtained by running a MATLAB application on a smartphone. In previous studies, Kalman Filter algorithms have been predominantly used for estimation. In this thesis, in addition to the traditional Kalman Filter, the proven deep learning algorithms Long Short Term Memory (LSTM), Bidirectional Long Short Term Memory (BLSTM) and Gated Recurrent Units (GRU) are used as prediction algorithms. These deep learning algorithms were trained with different optimizers and the effects of the optimizers on the prediction results were also examined. Considering the findings obtained in the simulation studies detailed in the thesis, the most successful result belongs to the GRU deep learning network with an RMSE value of 2.5414. In LSTM and BLSTM deep learning networks, RMSE values of 2.5547 and 2.7592 were obtained respectively. In the studies conducted with the Kalman Filter, the RMSE was found to be 2.9322.
  • Item
    Beyaz kan hücrelerinin evrişimli sinir ağları ile sınıflandırılması ve bölütlenmesi
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2022) Özcan, Şeyma Nur; Uyar, Tansel
    Son yıllarda beyaz kan hücrelerinin kan yayma görüntülerinden derin öğrenme yöntemleri kullanılarak tespiti, sınıflandırılması ve bölütlenmesi oldukça yaygınlaşmıştır. Beyaz kan hücrelerinin sınıflandırılması ve bölütlemesi lösemi, anemi ve çeşitli enfeksiyonlar gibi hastalıkların teşhisinde önemli rol oynamaktadır. Son yıllarda kan yayma görüntülerinin mikroskop altında incelenmesi gibi manuel yöntemlerin ve geleneksel algoritmaların yetersizliği sebebiyle işlem gücünün de artmasıyla bu tür problemlerin çözümünde derin öğrenme yaklaşımları sıklıkla kullanılmaya başlanmıştır. Sunulan tez çalışmasında beyaz kan hücrelerinin sınıflandırılması ve bölütlenmesi için iki ayrı yapay sinir ağı modeli oluşturulmuştur. Sınıflandırmada beyaz kan hücreleri bazofil, nötrofil, eozinofil, monosit ve lenfosit olmak üzere 5 sınıfa ayrılmıştır. Bölütlemede ise bazofil hariç 4 sınıfa (nötrofil, eozinofil, lenfosit ve monosit) ayrılmıştır. Bazofil hücre tipi, çekirdek ve sitoplazmasının neredeyse aynı büyüklükte olması nedeniyle bölütlemede kullanılmamıştır. Beyaz kan hücrelerinin bölütlemesi için semantik bölütleme yöntemi kullanılmıştır. Bölütleme için arka plan, çekirdek ve sitoplazma olmak üzere üç piksel sınıf etiketi belirlenmiştir. Yapılan çalışmaların performansını değerlendirmek için çeşitli performans değerlendirme metrikleri kullanılmıştır. Sınıflandırma için doğruluk, kesinlik, duyarlılık ve F1 Skoru değerleri; bölütleme için doğruluk, BF skoru ve IoU değerleri hesaplanmıştır. Sunulan tez çalışmasında, önerilen yöntemin literatürde yer alan diğer çalışmalarla karşılaştırıldığında sınıflandırmada daha iyi performansa sahip olduğu tespit edilmiştir. Ayrıca önerilen bir diğer yöntem olan bölütleme algoritmasıyla birlikte elde edilen başarılı sonuçlar ile klinik alanda hastalıkların teşhisinde kullanılabilecek bir tanı aracı da gelecek perspektifini oluşturmaktadır. Bu sunulan çalışmada, beyaz kan hücrelerinin hızlı ve doğru şekilde sınıflandırılması ile bölütlenmesi sağlandığı için hastalıkların erken teşhisinde önemli bir rol oynayabileceği çalışmanın önemini arz etmektdir. Ayrıca oluşturulan sistemin eğitilerek büyük mikroskop gçrüntülerinden beyaz kan hücrelerinin olduğu kısımlar tespit edilerek bu hücreleri tanıyabilen bir sistem oluşturmak amaçlanmıştır. In recent years, detection, classification and segmentation of white blood cells from blood smear images using deep learning methods have become quite common. Classification and segmentation of white blood cells plays an important role in the diagnosis of diseases such as leukemia, anemia and various infections. In recent years, due to the inadequacy of manual methods and traditional algorithms such as examining blood smear images under a microscope, deep learning approaches have been frequently used in solving such problems with the increase in processing power. In the presented thesis, two different artificial neural network models were created for the classification and segmentation of white blood cells. In classification, white blood cells are divided into 5 classes: basophil, neutrophil, eosinophil, monocytes and lymphocytes. In segmentation, it is divided into 4 classes (neutrophil, eosinophil, lymphocyte and monocytes) except basophils. The basophil cell type was not used for segmentation because its nucleus and cytoplasm were almost the same size. Semantic segmentation method was used for segmentation of white blood cells. Three pixel class labels were determined for segmentation: background, nucleus, and cytoplasm. Various performance evaluation metrics were used to evaluate the performance of the studies. Accuracy, precision, sensitivity and F1 Score values for classification; For segmentation, accuracy, Boundary F1 (BF) score and Intersection over Union (IoU) values were calculated. In the presented thesis study, it has been determined that the proposed method has better performance in classification when compared to other studies in the literature. In addition, with the successful results obtained with the segmentation algorithm, which is another proposed method, a diagnostic tool that can be used in the diagnosis of diseases in the clinical field creates a future perspective. In this presented study, it is important to study that it can play an important role in the early diagnosis of diseases, as it provides rapid and accurate classification and segmentation of white blood cells. In addition, by training the created system, it is aimed to create a system that can recognize these cells by detecting the parts with white blood cells from large microscope images.