Fen Bilimleri Enstitüsü / Science Institute

Permanent URI for this collectionhttps://hdl.handle.net/11727/1392

Browse

Search Results

Now showing 1 - 10 of 21
  • Item
    Derin öğrenme yöntemleri ile akciğer grafilerinde patoloji sınıflandırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2025) Oltu, Burcu
    Akciğerler, solunum sisteminin temel organları olup yapısal bozukluklar, enfeksiyonlar veya çevresel etkenler nedeniyle işlev kaybına uğrayabilmektedir. COVID-19, tüberküloz, pnömoni, pulmoner fibröz, atelektazi, kardiyomegali ve pnömotoraks gibi akciğer hastalıkları erken evrede teşhis edilmediğinde ölümcül sonuçlara yol açabilmektedir. Bu nedenle akciğer hastalıklarının erken ve doğru şekilde teşhis edilmesi büyük önem taşımaktadır. Akciğer grafileri, düşük maliyet ve hızlı uygulanabilirlik gibi avantajlarıyla bu amaçla yaygın olarak kullanılmaktadır. Ancak örtüşen anatomik yapılar, sınırlı uzman sayısı ve yüksek görüntü hacmi gibi etkenler, bu görüntülerin yorumlanmasını zorlaştırmakta, günlük yaklaşık %3-5 oranında hata yapılmasına yol açmaktadır. Bu doğrultuda akciğer grafilerinin yorumlanabilmesi için radyologlara yardımcı olacak otomatik ve güvenilir teşhis sistemlerine duyulan ihtiyaç gün geçtikçe artmaktadır. Bu tez çalışmasında akciğer grafilerinin yüksek performansla sınıflandırılması amacıyla uçtan uca bir derin öğrenme modeli geliştirilmiş ve bu modelin başarısını artıracak özgün kayıp fonksiyonlarını önerilmiştir. Modelin omurgası olarak önceden eğitilmiş DenseNet201 mimarisi kullanılmıştır. DenseNet201’den çıkarılan öznitelik haritalarından daha zengin uzamsal bilgiler elde etmek amacıyla evrişimsel uzun kısa süreli bellek (Convolutional Long Short-Term Memory (ConvLSTM)) katmanı, kanal bazında özniteliklerin vurgulanması için sıkma-bırakma bloğu (Squeeze and Excitation (SE)) ve uzun menzilli bağımlılıkları yakalayan görü dönüştürücüler (Vision Transformer (ViT)) modele entegre edilmiştir. Ayrıca, küresel ortalama havuzlama (Global Average Pooling (GAP)) katmanı ile sınıflandırma için önemli uzamsal bilgilerin korunması sağlanmıştır. Bu bileşenlerin kombinasyonu ile önerilen model, yüksek sınıflandırma performansı sunmuştur. Çalışmada ayrıca, sınıflandırma başarısında önemli etkisi olan kayıp fonksiyonları derinlemesine incelenmiştir. Standart fonksiyonlara ek olarak hibrit ve dinamik yapılarda fonksiyonlar tasarlanmış, sınıflandırma eğilimlerine karşı ceza terimi içeren özgün bir fonksiyon önerilmiştir. Önerilen kayıp fonksiyonlarının avantajlarını bir araya getirerek sınıflandırma performansını artıracak farklı topluluk yaklaşımları uygulanmıştır. Bu fonksiyonların performansları sistematik olarak analiz edilmiş ve farklı modellerle de test edilerek modelden bağımsız başarı sağladığı gösterilmiştir. Başkent Üniversitesi Ankara Hastanesi Radyoloji Bölümü'nden elde edilen klinik veriler ile açık erişimli veri kümeleri birleştirilerek 7, 8, 9, 10, 12, 14 ve 15 sınıflı alt veri kümeleri oluşturulmuş ve her bir alt kümede önerilen model ve kayıp fonksiyonları detaylı şekilde test edilmiştir. Böylece hem veri kümesinden hem de sınıf sayısından bağımsız olarak modelin ve kayıp fonksiyonunun başarısı ortaya konmuştur. Elde edilen deneysel sonuçlar, önerilen yöntemin literatürdeki yaklaşımların çoğunu geride bıraktığını ve doğruluk, F1-skoru, AUC gibi performans metriklerinde yüksek başarı sergilediğini ortaya koymaktadır. Ayrıca modelin farklı senaryolarda tutarlı ve yüksek performans sergilemesi, güçlü bir genelleme yeteneğine sahip olduğunu kanıtlamaktadır. Sonuç olarak, bu tez kapsamında, akciğer grafilerinin otomatik olarak sınıflandırılmasını sağlayan yüksek performanslı ve tekrarlanabilir sonuçlar üreten yenilikçi bir model ve özgün kayıp fonksiyonları geliştirilmiştir. The lungs are the primary organs of the respiratory system and can lose functionality due to structural disorders, infections, or environmental factors. Lung diseases such as COVID-19, tuberculosis, pneumonia, pulmonary fibrosis, atelectasis, cardiomegaly, and pneumothorax may lead to fatal outcomes if not diagnosed at an early stage. Therefore, early and accurate diagnosis of lung diseases is crucial. Chest radiographs (CXRs) are widely used for this purpose due to their advantages, such as low cost, quick applicability, and low radiation dose. However, factors like overlapping anatomical structures, limited specialists, and high image volume make interpreting CXRs challenging, resulting in a daily error rate of 3–5%. Thus, the demand for automated and reliable diagnostic systems to assist radiologists in interpreting CXRs is increasing. In this thesis, an end-to-end deep learning model was developed for high-performance classification of CXRs, and novel loss functions were proposed to enhance the model’s performance. The pre-trained DenseNet201 architecture was used as the backbone. A Convolutional Long Short-Term Memory (ConvLSTM) layer to obtain richer spatial and temporal information from the feature maps obtained from DenseNet201, a Squeeze and Excitation (SE) block to emphasize channel-wise features, and Vision Transformers (ViT) to capture long-range dependencies were integrated into the model. In addition, a Global Average Pooling (GAP) layer was used to preserve important spatial information for classification. The combination of these components enabled high classification performance. The study also examined the often-overlooked role of loss functions in classification performance. Beyond standard functions, hybrid and dynamic structures were designed. A custom function with a penalty term was proposed to improve sensitivity to misclassification. Ensemble approaches combining the strengths of proposed loss functions were implemented. These loss functions were systematically analyzed and tested with various models, demonstrating architecture-independent success. To evaluate the performance and generalization ability of the proposed model and loss functions, a comprehensive dataset was created by combining clinical images from Başkent University Ankara Hospital with open-access datasets. This dataset was divided into subsets containing 7, 8, 9, 10, 12, 14, and 15 classes, and extensive testing was conducted on each subset. Results showed that the proposed method outperforms many existing approaches in the literature, achieving superior accuracy, F1-score, and AUC. The model’s consistent performance in various scenarios demonstrated strong generalization. In conclusion, this thesis presents a novel deep learning model and original loss functions that produce high-performance and reproducible results for the automatic classification of CXRs
  • Item
    Makine öğrenimi teknikleri ile mekanik parçaların 3 boyutlu tasarımlarının sınıflandırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2024) Atasoy, Işıl
    Makine öğrenmesi teknikleri kullanılarak geliştirilen veri işleme uygulamaları son yıllarda oldukça büyük bir hız ile gelişme kat etmekte ve farklı alanlarda birçok probleme çözümler sunmaktadır. Yazılım destekli çözümleri kullanan tüm sektörlerden alınan veriler incelendiğinde sonuç olarak verimliliklerin arttığı, insan kaynaklı hataların ve gecikmelerin önüne geçildiği gözlemlenmiştir. Bu çalışmada üretim ve tasarım endüstrisinde kullanılan standart mekanik parçaların derin öğrenme algoritmaları kullanılarak sınıflandırılması amaçlanmaktadır. Buna ek olarak, çalışmada kullanılan modellerin performansları karşılaştırılacaktır. Çalışma kapsamında iki aşamalı bir deney kurulmuştur. Deneyin aşamaları birbirinden bağımsız olup, sonuçları da bağımsız olarak değerlendirilmiştir. İlk aşamada cıvata, pim, somun, rondela mekanik parçalarının dijital tasarımlarından oluşan hazır bir veri seti kullanılmıştır. Bu veri seti her parçadan eşit sayıda 224x224x3 boyutlarında görseller içerecek şekilde toplamda 7616 adet örneklemden oluşmaktadır. İkinci aşamada ise aynı tasarım görsellerine ek olarak mekanik parçaların gerçek fotoğrafları da eklenip toplamda 1600 adet örnekten oluşan yeni bir veri seti oluşturulmuştur. Daha sonra deneyin her iki adımında da parçaların tanınma problemine çözüm bulmak için AlexNet, VGG, DenseNet, ResNet ve Xception sınıflandırma modelleri tercih edilerek, sonuçlar kaydedilmiştir. İlk adımda modeller sırasıyla ortalama 0.25, 0.25, 0.60, 0.69 ve 0.75 doğruluk oranları sunmuştur. İkinci adımda ise sırasıyla ortalama 0.27, 0.25, 0.65, 0.85 ve 0.96 doğrulukla başarı elde etmişlerdir. Çalışmanın sonuçlarında modellerin performans karşılaştırmaları belirtilmiştir. Machine learning techniques and data processing applications have been developing rapidly in recent years and offer solutions to many problems in different fields. Efficiency has increased in all sectors using software-supported solutions, and human errors and delays have been prevented. This study aims to classify standard mechanical parts used in the production and design industry using deep learning algorithms. In addition, the performances of the models used in the study will be compared. A two-stage experiment was established within the scope of the study. The stages of the experiment were independent from each other and the results were evaluated independently. In the first stage, a ready-made data set consisting of digital designs of mechanical parts of bolts, pins, nuts and washers was used. This data set consists of 7616 samples in total, including an equal number of 224x224x3 images from each piece. In the second stage, in addition to the same design visuals, real photographs of mechanical parts were added and a new data set consisting of 1600 samples in total was created. Then, in both steps of the experiment, AlexNet, VGG, EfficientNet, ResNet and Xception classification models were preferred to find a solution to the problem of recognition of parts, and the results were recorded. Then, in both steps, AlexNet, VGG, EfficientNet, ResNet and Xception models were preferred to list the broken ones and the results were generated. Initial replacement models offered average accuracy rates of 0.25, 0.25, 0.60, 0.69 and 0.75, respectively. Secondary renewal was successful with an average accuracy of 0.27, 0.25, 0.65, 0.85 and 0.96, respectively. The results of the study are stated in the comparison performances of the models.
  • Item
    FPGA tabanlı derin öğrenme algoritması ile baskılı devre kusurlarının tespiti
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2025) Öner, Enes Emre
    Endüstrinin gelişmesiyle birlikte hayatımızın her noktasında bulunan elektronik donanımların temel altyapısı olan elektronik kartların ve devre yollarının küçülmesi, baskılı devre üretimini karmaşıklaştırarak, son üründe kusurların meydana gelmesine sebep olabilmektedir. Baskılı devrede oluşabilecek kusurlar elektronik kartların küçük olması sebebiyle dikkatlice, büyüteç gibi ekipmanlar kullanılarak kontrol edilmelidir. Bu yöntem, zamansal olarak uzundur ve hatalara açıktır. Kusurların tespit edilememesi cihazın kısa sürede arıza vermesine ve performansının düşük seviyelerde seyretmesine sebep olarak kullanıcıyı mağdur edecek ve ürün/marka taleplerinde düşüşe sebep olacaktır. Bu soruna çözüm olarak, nesne tespit alanında kullanılan derin öğrenme modelleri ile çalışan sistemlerin üretim veya üretim sonrası süreçlere dahil edilmesi önerilebilir. Bu sistemler, baskılı devreler üzerinde oluşan kusurları, yüksek doğrulukta ve yüksek hızda tespit edilebilecek kabiliyete sahip olmalıdır. FPGA’lar (Field Programmable Gate Array), paralel işlem yeteneği, tasarımda esneklik ve yeniden programlanabilme kabiliyetleri sayesinde bu tip gerçek zamanlı çalışması gereken sistemler için genelde kullanılan CPU (Central Processing Unit), GPU (Graphical Processing Unit) ve hibrit yapılara (SoC- System on Chip) göre daha uygun bir ortam sağlamaktadır. Bu tez çalışmasında, baskılı devre üretimi sonrasında oluşan kusurların derin öğrenme modeli yardımı ile tespitini gerçekleştiren FPGA tabanlı yöntem önerilmektedir. Çalışmada kullanılan açık kaynaklı veri seti, 9666 adet görüntü ve 7 farklı kusura ait sınıf içermektedir. Yapılan çalışmada, derin öğrenme modeli olarak bu alanda FPGA ile kullanılan en son versiyon YOLOv8 modelinin daha üst versiyonlarından birisi olan YOLOv11 versiyonu kullanılmıştır. Performans farklarının anlaşılması adına YOLOv8 ve YOLOv11 modelleri aynı koşullar altında eğitilmiş ve performansları karşılaştırılmıştır. Parametre-performans ilişkisinde nihai eğitimde %98,4 mAP50 (IoU - Intersection over Union - eşiğinde ortalama hassasiyet 0,50) performansıyla üstün gelerek gömülü sistemlerde daha az yer kaplayan YOLOv11n modelinin diğer çalışmalardan farklı olarak GPU veya CPU desteği olmaksızın sadece RTL (Register Transfer Language) tabanlı FPGA mimarisi oluşturularak sonuçların performansı incelenmiştir. İncelemeler doğrultusunda genel mAP50 değerinin %97,86 seviyesinde korunduğu, çıkarım hızının ise 34,9386306ms olduğu gözlemlenmiştir. Tespit yeteneğinin çok az miktarda kayıpla korunabilmesi, YOLOv11n modelinin RTL temelli gerçeklemesinin mümkün olduğunu göstermiştir. Bu tez çalışmasında alınan sonuçlar, gerçek zamanlı sistemlerde CPU, GPU ve hibrit yapılar yerine işlem gücü olarak sadece FPGA bulunduran sistemler kullanılabileceğine dair ışık tutmuştur. With the developing industry, the miniaturization of electronic boards and circuit paths, which are the basis of electronics in our lives, complicates PCB (Printed Circuit Board) production and can cause defects on the final product. Defects occurring on the PCB should be checked carefully using equipment such as a magnifying glass due to the size of the electronic cards. This method is time-consuming and prone to mistakes. Failure of detection of defects may cause the device to fail in a short time and its performance to remain at low levels, which will cause a decrease in product/brand demand by victimizing the user. As a solution, including systems working with deep learning models, used in object detection, in production or post-production stages can be suggested. These systems must detect defects on PCBs with high accuracy and speed. FPGAs (Field Programmable Gate Array) provide a more suitable environment for real-time systems, with their parallel processing capability, flexibility in design and re-programmability, compared to CPU (Central Processing Unit), GPU (Graphical Processing Unit) and hybrid structures (SoC - System on Chip) which are generally used in these systems. In this thesis, an FPGA-based architecture is proposed that detects defects, which occur after PCB production, with the help of a deep learning model. The open-source dataset used in this study contains 9666 images and 7 different defect classes. In the thesis, one of the upper versions of the YOLOv8 model, the YOLOv11 version, is used as the deep learning model, which is the latest version used in this with FPGA field so far. To understand the performance differences, YOLOv8 and YOLOv11 models are trained under the same conditions and their performances are compared. In the parameter-performance relationship, the YOLOv11n model, which occupies less space in embedded systems and achieving 98,4% mAP50 (mean average precision for IoU - Intersection over Union – at threshold 0,50) performance in the final training, is examined by creating only RTL (Register Transfer Language) based FPGA architecture without GPU or CPU support. Within the observations in examinations, the overall mAP50 value is preserved at 97,86% with the inference speed is 34,9386306ms. The fact of the preservation of detection capability with a very small amount of loss proves the RTL implementation of YOLOv11n model is possible. The results in this thesis shed light on the systems contains FPGA as processing power can be used instead of CPU, GPU and hybrid structures in real-time systems
  • Item
    Derin öğrenme modelleri ile parkinson hastalığının teşhisinde transfer öğrenme tekniğinin etkinliğinin araştırılması
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2024) Ecem, Zora; Mehmet, Dikmen
    Parkinson hastalığı, hareketlerin kontrolünde ve koordinasyonunda rol oynayan dopamini üreten beyin hücrelerinin kaybı nedeniyle ortaya çıkan nörodejeneratif bir hastalıktır. Parkinson Hastalığının nedeni tam olarak bilinmediğinden bu hastalığın tanısına yönelik spesifik bir test de bulunmamaktadır. Ancak kas kontrolü kaybının neden olduğu, daha fazla izlenebilen ve analiz edilebilen semptomlar vardır. Ne yazık ki, bu tür analizlere yönelik prosedürlerin çoğu pahalıdır, verimsizdir ve zayıf doğruluk sağlarken gelişmiş ekipman gerektirir. Makine öğreniminin devreye girdiği yer burasıdır. Büyük verileri analiz etme ve insan gözlemcilerin göremeyeceği ince kalıpları tespit etme yeteneği, onu daha doğru Parkinson Hastalığı tanımlaması sağlayabilecek daha hızlı bir alternatif haline getiriyor. Bu çalışmada, Parkinson hastalığının en erken belirtilerinden biri olan el ve parmaklardaki titremelerin sapmalara neden olduğu el yazısı görüntüleri kullanılarak Parkinson Hastalığı tespiti yapılmaktadır. Bu amaçla transfer öğrenme uygulanarak derin öğrenme modelinden yararlanılmıştır. Deneyler için 37 Parkinson hastası ve 38 kontrol bireyine ait 8 farklı el yazısı örneğini içeren PaHaW veri seti kullanılmıştır. Derin öğrenme modellerinin yüksek veri gereksinimi nedeniyle, orijinal veri kümesine hem döndürme, çevirme ve konturlar gibi geleneksel veri artırma yöntemleri hem de Aşamalı Büyüyen Üretici Çekişmeli Ağ (PGAN) ile yeni veriler üretilmiştir. Üretilen bu verilerle yeni veri kombinleri oluşturulmuş ve bu sayede derin öğrenme modellerinin performansı önemli ölçüde artırılmıştır. ImageNet ve MNIST veri setleri ile önceden eğitilen probleme AlexNet, EfficientNet-B0, GoogleNet ve ResNet50 modellerinin uyarlanması ve transfer öğrenmenin uygulanmasıyla hem PaHaW verileri hem geleneksel yöntemlerle üretilen veriler hem de PGAN ile üretilen verilerin kombini kullanılarak %98,97 doğrulukla en iyi sonuç elde edilmiştir. Parkinson's disease is a neurodegenerative disease that occurs due to the loss of brain cells that produce dopamine, which plays a role in the control and coordination of movements. Since the cause of Parkinson's Disease is not fully known, there is no specific test for the diagnosis of this disease. However, there are symptoms caused by loss of muscle control that can be further monitored and analyzed. Unfortunately, most procedures for such analysis are expensive, inefficient, and require advanced equipment while providing poor accuracy. This is where machine learning comes into play. Its ability to analyze big data and detect subtle patterns invisible to human observers makes it a faster alternative that can provide more accurate Parkinson's Disease identification. In this study, Parkinson's Disease is detected using handwriting images where tremors in the hands and fingers cause deviations, which is one of the earliest symptoms of Parkinson's disease. For this purpose, deep learning model was used by applying transfer learning. The PaHaW dataset, which includes 8 different handwriting samples from 37 Parkinson's patients and 38 control individuals, was used for the experiments. Due to the high data requirement of deep learning models, new data was generated by applying both traditional data augmentation methods such as rotation, translation and contours, and Progressive Growing of Generative Adversarial Network (PGAN) to the original dataset. With this data, new data combinations were created and thus the performances of deep learning models were significantly increased. By adapting AlexNet, EfficientNet-B0, GoogleNet and ResNet50 models to the problem pre-trained with ImageNet and MNIST datasets and applying transfer learning, the best result with 98,97% accuracy was obtained by using a combination of both PaHaW data, data produced by traditional methods and data produced by PGAN.
  • Item
    Derin sinir ağlarını kullanarak uzun ve kısa videolarda zamansal eylem tanıma
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Şahin, Yağmur; Sert, Mustafa
    Günümüzde videoların büyük bir veri kaynağı oluşturması, anlamsal bilgi çıkarımı ve eylem tanıma gibi konularda derin öğrenmenin önemini artırmıştır. Videoların karmaşık ve dinamik yapısı nedeniyle gelişmiş modelleme teknikleri ve algoritmaların kullanılması gerekliliği ortaya çıkmıştır. Bu çalışmada, sayısal teknolojilerle artan video içeriklerinden anlamsal bilgi çıkarımı amacıyla, videolarda eylem tanıma problemi araştırılmıştır. Mevcut çalışmaların birçoğu, kısa videoların sınıflandırılmasına odaklanmaktadır. Tez kapsamında, kısa videoların yanısıra, uzun videoların sınıflandırması için üç boyutlu evrişimsel sinir ağları ve dikkat mekanizmasına dayalı özgün bir model önerilmektedir. Bu entegrasyon hem kısa hem de uzun videolardaki öğrenme sürecini iyileştirmekte ve aktivitelerin doğru tanımlanabilmesine olanak sunmaktadır. Önerilen model, uzun videoların sınıflandırması için öncelikle bölge öneri ağı adı verilen bir sinir ağı ile uzun videoların olası olay sınırlarını tespit etmekte, daha sonra önerilen video sınırları için sınıflandırma yapmaktadır. HMDB, UCF ve ActivityNet gibi veri kümeleri üzerinde gerçekleştirilen deneysel çalışmalarda, dikkat mekanizmalarının model performansını önemli ölçüde artırdığı görülmüştür. Önerilen model, 3D evrişimsel sinir ağları ve dikkat mekanizmalarının entegrasyonuyla, videolardan öznitelik çıkarımı ve aktivite tespiti yeteneklerini geliştirmiştir. Kısa video klipleri için HMDB ve UCF veri kümeleri, uzun videolar içinse ActivityNet veri kümesi kullanılarak modelin farklı aktivite tipleri ve video yapılarındaki tanıma yeteneği ölçülmüştür. Özellikle UCF ve HMDB veri kümelerinde, Öz Dikkat mekanizması kullanılan model yüksek doğruluk oranlarına ulaşırken, ActivityNet’te Çok Başlıklı Dikkat mekanizması uzun videolardaki karmaşık etkileşimleri daha etkili bir şekilde tanıma yeteneği sergilemiştir. Bu bulgular, dikkat mekanizmalarının videolardan anlamsal bilgi çıkarımında önemli bir rol oynadığını ve derin öğrenme yöntemlerinin bu alandaki potansiyelini ortaya koymaktadır. Elde edilen sonuçlar, önerilen derin öğrenme modelinin farklı video yapılarına uyum sağlama yeteneğini ve etkili bilgi çıkarımı gerçekleştirme kapasitesini açıkça ortaya koymaktadır. In today’s world, the vast amount of video data has increased the importance of deep learning in areas such as semantic information extraction and action recognition. Due to the complex and dynamic nature of videos, there is a need for advanced modeling techniques and algorithms. This study investigates the problem of action recognition in videos with the aim of extracting semantic information from the increasing video contents with digital technologies. Many of the existing studies focus on the classification of short videos. Within the scope of the thesis, an original model based on three-dimensional convolutional neural networks and attention mechanism is proposed for the classification of not only short videos but also long videos. This integration enhances the learning process in both short and long videos, enabling accurate action detection. The proposed model focuses on classifying long videos by first identifying potential event boundaries within these videos using a neural network known as region proposal network, and subsequently performing classification on the proposed video segments. Experimental studies carried out on datasets like HMDB, UCF, and ActivityNet have shown that attention mechanisms significantly improve model performance. The proposed model, integrating 3D convolutional neural networks and attention mechanisms, has improved feature extraction and activity detection capabilities from videos. The model’s ability to recognize various activity types and video structures was evaluated using the HMDB and UCF datasets for short video clips and the ActivityNet dataset for longer videos. Specifically, in the UCF and HMDB datasets, the model using the Self Attention mechanism achieved high accuracy rates, while in ActivityNet, the Multi-Head Attention mechanism displayed better ability to recognize complex interactions in longer videos. These findings highlight the crucial role of attention mechanisms in extracting semantic information from videos and reveal the potential of deep learning methods in this area. The obtained results clearly indicate the proposed deep learning model’s adaptability to different video structures and its capacity for effective information extraction.
  • Item
    X-Ray görüntülerinden köpeklerde uzun kemik kırıklarının meydana gelme zamanına göre sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Tezcan, Berkan; Güney, Selda
    Biyomedikal alanda önemli bir rol oynayan derin öğrenme algoritmaları, son yılların en popüler konularından biridir. Bu algoritmalar, görüntüleme yöntemleri kullanılarak hastalık ve kırık tespiti, biyolojik veri kestirimi, doku ve organ bölütlemesi, eksik veri tamamlanması gibi birçok uygulama için başarılı sonuçlar sağlamaktadır. Kemiklerdeki kırık tespiti, özellikle bu alanda en çok araştırılan konulardan biridir. Ancak, bu uygulamaların büyük çoğunluğu insan tıbbında kullanılırken, veteriner tıp uygulamaları daha az araştırılmıştır. Bu alandaki eksiklik, tez konusunun en büyük motivasyon kaynağı olmuştur. Bu tez çalışması kapsamında, köpeklere ait X-ray görüntülerini içeren veri seti ile uzun kemiklerdeki kırığın varlığının saptanması ve var olması durumunda da kırığın zamanına göre sınıflandırılması hedeflenmiştir. Biyomedikal görüntü işleme alandaki pek çok çalışma gibi, bu çalışmada da farklı derin öğrenme mimari karşılaştırılarak sonuçlar en iyileştirilmeye çalışılmıştır. Deep learning algorithms, which play an important role in the biomedical field, are one of the most popular topics in recent years. These algorithms provide successful results for many applications such as disease and fracture detection, biological data prediction, tissue and organ segmentation, and missing data completion using imaging methods. Fracture detection in bones is particularly one of the most researched topics in this field. However, while the majority of these applications are used in human medicine, veterinary medicine applications have been less studied. The lack of research in this field has been the main motivation for the thesis topic. Within the scope of this thesis study, the aim is to detect the presence of a fracture in the long bones in dogs using a dataset containing X-ray images of dogs, and to classify the fracture according to its time of occurrence if it exists. Like many studies in the field of the biomedical image processing, different deep learning architectures are compared, and the results are tried to be optimized.
  • Item
    Derin öğrenme ve makine öğrenme teknikleri kullanılarak göz hastalıklarının tespiti
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2023) Arslan, Gözde; Erdaş, Çağatay Berke
    Göz hastalıkları insan yaşamını ciddi derecede etkileyen sağlık sorunlarından biridir. Göz hastalıkları arasında bulunan katarakt, diyabetik-retinopati, glokom gibi hastalıklar görme bozukluğuna ve geri dönüşü olmayan göz kusurlarına neden olur. İnsan yaşamında genetik, yaş ve çevresel faktörler göz sağlığını önemli ölçüde etkiler. Hastalık tespitin yapılması ve dolayısıyla hastanın yaşam kalitesinin yükseltilebilmesi için hastalığın doğru bir şekilde tespiti kritik bir rol oynamaktadır. Gelişen teknoloji ile yapay zeka göz kusurlarını ve dolayısıyla ilgili gözde bir hastalık olup olmadığını tespit edebilmektedir. Bu tez çalışması, önemli sağlık sorunlarından göz hastalıklarının derin öğrenme modelleri ve makine öğrenmesi algoritmaları kullanılarak tespit edilmesine yönelik çözümler geliştirmeyi amaçlamaktadır. Bu çalışmada derin öğrenme türlerinden biri olan Konvolüsyonel Sinir Ağları modelleri ve makine öğrenme algoritmaları kullanılmıştır. Hastalık başarısının tahmini ve sınıflandırılmasında geleneksel makine öğrenmesi algoritmalarından Destek Vektörü Makinesi, Naive Bayes Sınıflandırıcısı, K-En Yakın Komşu, Rastgele Orman kullanılmıştır. CNN modelinden DenseNet, EfficientNet, VGG, ResNet ve Xception mimarileri kullanılmıştır. Çoklu sınıflandırma probleminde, hastalık tespiti için kullanılan veri setinde 1074 normal, 1007 glokom, 1098 diyabetik-retinopati, 1038 katarakt verileri olmak üzere toplamda 4217 Retinal Fundus görüntüsü içermektedir. İkili sınıflandırma probleminde, hastalık tespiti için kullanılan veri setinde 1374 normal ve 1374 hastalıklı veriler olmak üzere toplamda 2748 Retinal Fundus görüntüsü içermektedir. Retinal Fundus göz hastalığı sınıflandırması çalışmasında ise hazır CNN mimarileri ve makine öğrenme ile mevcut probleme uyarlanarak deneyler yürütülmüş ve performansları karşılaştırılmıştır. CNN mimarilerinin konvolüsyonel katmalarında otomatik olarak üretilen öznitelikler makine öğrenme sınıflandırıcılarını beslemek için kullanılmıştır. Tespit ve sınıflandırma çalışmalarında elde edilen performanslara göre derin öğrenme mimarilerinin makine öğrenmesi algoritmalarından üstün geldiği gözlemlenmiştir. Eye diseases are one of the health problems that seriously affect human life. Diseases such as cataract, diabetic-retinopathy, glaucoma, which are among the eye diseases, cause visual impairment and irreversible eye defects. Genetic, age and environmental factors significantly affect eye health in human life. Accurate detection of the disease plays a critical role in detecting the disease and thus improving the quality of life of the patient. With the developing technology, artificial intelligence can detect eye defects and therefore whether there is a disease in the related eye. This thesis study aims to develop solutions for the detection of eye diseases, which are important health problems, by using deep learning models and machine learning algorithms. In this study, Convolutional Neural Network models, which is one of the deep learning types, and machine learning algorithms were used. In the prediction and classification of disease success, Support Vector Machine, Naive Bayes Classifier, K-Nearest Neighbor, Random Forest, which are traditional machine learning algorithms, were used. DenseNet, EfficientNet, VGG, ResNet and Xception architectures from the CNN model were used. In the multi-classification problem, the data set used for disease detection includes a total of 4217 Retinal Fundus images, 1074 normal, 1007 glaucoma, 1098 diabetic-retinopathy, 1038 cataract data. In the binary classification problem, the data set used for disease detection includes a total of 2748 Retinal Fundus images, 1374 normal and 1374 diseased data. In the retinal fundus eye disease classification study, experiments were carried out by adapting them to the existing problem with ready-made CNN architectures and machine learning, and their performances were compared. Automatically generated features in convolutional layers of ready-made CNN architectures are used to feed machine learning classifiers. According to the performances obtained in detection and classification studies, it has been observed that deep learning architectures are superior to machine learning algorithms.
  • Item
    Derin öğrenme yöntemleriyle trafik işaretlerinin gerçek zamanlı sınıflandırılması
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2024) Usanmaz, Kemal; Güney, Selda
    Günümüzde trafik güvenliği ve sürüş deneyimi, gelişmiş sürücü destek sistemlerini (Advanced Driver Assistance System, ADAS) önemli ölçüde etkilenmektedir. Sürücüler için önemli bilgiler taşıyan, uyarıcı niteliğinde olan ve trafiğin düzenli akışını sağlayan trafik işaretleri çoğu zaman sürücüler tarafından fark edilemez veya trafik işaretine bakma esnasında sürücünün dikkatini dağıtabilir, bunun sonucunda da çeşitli kazalar meydana gelir. Bu sebeple ADAS’ın içinde yer alan trafik işaretlerini algılayan ve sınıflandıran sistemler mevcuttur. Derin öğrenme teknikleri, özellikle de konvolüsyonel sinir ağı (Convolutional Neural Network, CNN) mimarileri üzerinden yapılan çalışmalar, bu alanda önemli ilerlemelere yol açmıştır. Bu tez çalışmasında derin öğrenme yöntemlerinden CNN kullanılarak sınıflandırma işlemleri gerçekleşmiş ve seçilen algoritmalardan hangisinin gerçek zamanlı bir sistemde en iyi performansı gösterdiği tespit edilmiştir. Bu çalışmada veri seti olarak, 43 sınıftan oluşan ve 39209 trafik işareti görüntüsü içeren Alman Trafik İşaretleri Bulma Veri Seti (German Traffic Sign Recognition Benchmark, GTSRB) kullanılmıştır. Veri setinin CNN algoritmalarına etkisini belirleyebilmek için veri arttırma teknikleri kullanılarak yeni veri kümeleri GTSRB’den türetilmiştir. Literatür araştırması sonucu seçilen SqueezeNet, GoogleNet, ResNet50 ve AlexNet algoritmaları için en iyi performansı verecek hiper parametreler sistematik bir yöntemle belirlenmiş, Matlab yazılımıyla oluşturulan kullanıcı arayüzüyle gerçek zamanlı sınıflandırma testleri yapılmıştır. Gerçek zamanlı testlerin sonucunda ResNet50 algoritmasının, %93,49 sınıflandırma doğruluk oranı ile gerçek zamanlı bir sistemde çalışabileceği gösterilmiştir. Nowadays, traffic safety and driving experience are significantly affected by advanced driver assistance systems (ADAS). Traffic signs, which carry important information for drivers, serve as a warning and ensure the orderly flow of traffic, often cannot be noticed by drivers, or may distract the driver while looking at the traffic sign, resulting in various accidents. For this reason, there are systems that detect and classify traffic signs within ADAS. Studies on deep learning techniques, especially convolutional neural network (CNN) architectures, have led to significant advances in this field. In this study, classification processes were carried out using CNN, one of the deep learning methods, and it was determined which of the selected algorithms showed the best performance in a real-time system. In this study, the German Traffic Sign Recognition Benchmark (GTSRB), which consists of 43 classes and contains 39209 traffic sign images, was used as the data set. In order to determine the effect of the dataset on CNN algorithms, new datasets were derived from GTSRB using data augmentation techniques. The hyper parameters that will give the best performance for the SqueezeNet, GoogleNet, ResNet50 and AlexNet algorithms selected as a result of literature research were determined with a systematic method, and real-time classification tests were carried out with the user interface created with Matlab software. As a result of real-time tests, it has been shown that the ResNet50 algorithm can work in a real-time system with a classification accuracy rate of 93.49%.
  • Item
    Derin öğrenmeye dayalı bir yaklaşım kullanarak kitap öneri videolarından başlık çıkarma
    (Başkent Üniversitesi Fen Bilimler Enstitüsü, 2024) Sarımehmetoğlu, Bartu; Erdem, Hamit
    Resimlerden ve videolardan metin çıkarmak; video arama, video düzenleme ve çeviri dahil olmak üzere çok çeşitli uygulamalarla ortaya çıkan bir araştırma alanıdır. Günümüzde farklı dillerde kitap tanıtım videoları sosyal medyada ve özellikle YouTube'da paylaşılmaktadır. Bu çalışmada, kitap tanıtım videoları aracılığıyla kitap başlıklarının alınması önerilmektedir. Geliştirilen sistem girdi olarak video çeker ve kitapların adlarını ayırır. İzleyici, tespit edilen kitap başlıklarına tıklayarak istediği kitabı seçebilir ve videonun ilgili bölümünü izleyebilir. Bu uygulama, izleyici tarafından zaman tasarrufu sağlar. Bu uygulamaya ulaşmak için kitapların adlarını videolardan almak için derin öğrenmeye dayalı bir sistem geliştirilmiştir. Çalışmada YOLO bazlı yöntem kullanılmıştır. Çalışmada farklı YOLO algoritmaları kullanılmış ve YOLOv5'in daha başarılı olduğu bulunmuştur. Bu çalışma, kitap tanıtım videolarından kitap başlıklarını çıkarmak için derin öğrenmeye dayalı bir yaklaşım geliştirerek metin çıkarma ve video analizi alanına katkıda bulunmaktadır. Extracting text from images and videos is an emerging field of research with a wide range of applications, including video search, video editing, and translation. Nowadays, book promotion videos in different languages are shared on social media and especially on YouTube. In this study; It is recommended to take book titles through book promotion videos. The developed system takes video as input and separates the names of the books. The viewer can select the desired book by clicking on the detected book titles and watch the relevant part of the video. This application result in time saving by the viewer. In order to achive this application, a deep learning-based system was developed to retrieve the names of books from videos. YOLO-based method was used in the study. Different YOLO algorithms were used in the study, and YOLOv5 was found to be more successful. This study contributes to the field of text extraction and video analysis by developing a deep learning-based approach to extract book titles from book promotion videos.
  • Item
    Kağıt bardak makinesinin otomasyonu ve gerçek zamanlı görüntü işlemeye dayalı ürün tespit yöntemi
    (2022) Aydın, Alaaddin; Güney, Selda
    Ülkemizde kâğıt bardak üretimi yapan firma sayısı her geçen gün giderek artmaktadır. Karton bardak basımı yapan makineler Çin, Kore vb. ülkelerde üretilmektedir. Türkiye’de de yerli olarak üretilen makineler vardır. Bu makinelerde bardaklar 4, 7, 8, 12 oz diye tabir edilen ölçülerde basılmaktadır. Servo motor, asenkron motor gibi motorlar ile makineler kontrol edilmektedir. Makine üstüne takılan sensörler ve ısıtıcı rezistanslar yardımıyla kaliteli ve fire kaybı az olan bardaklar basılmaktadır. Bu çalışmada daha önce üretimi yapılmış olan bardak basma makinesini servo motor, asenkron motor ve PLC ile kontrol ederek, görüntü işleme tabanlı hata tespiti yapan ve hatalı ürünü ayıklayan bir sistem tasarlanmıştır. Hata tespiti için gerçek zamanlı bir kamera aracılığıyla derin öğrenme yöntemlerinden Yolo ve Haarcascade algoritmaları kullanılarak sınıflandırma, OpenCv kütüphanesi kullanılarak da gerçek zamanlı nesne tespiti gerçekleştirilmiştir. Tespit edilen hatalı bardak bir piston ile üretim bandından alınıp bir kutuya atılmaktadır. Sensörler, servo motor enkoderi ve kullanıcı tarafından gelen komutlarla servo motor sürücüsüne komutlar verilmektedir. Asenkron sürücü parametreleri sürücü üzerinden ayarlanmaktadır. Bütün komutlar kullanıcı tarafından bir ekran üzerinden girilebilmekte ve üretilen ürünlerin sayısı yine ekran üzerinde kurulan sistem üzerinden izlenebilmektedir. Çalışmanın yapay zeka kısmında hatalı bardakların tespiti için önceden kendi oluşturduğumuz veri setinden alınan veriler Python dilinde ve Google Colab ortamında, YOLO algoritmasının modelleri ile sınıflandırılmıştır. Modeller eğitildikten sonra Jupyter Lab (tümleşik geliştirme ortamı) üzerinde OpenCv kütüphaneleri kullanılarak gerçek zamanlı olarak kameradan gelen veriler tespit edilmiştir. Haarcascade algoritması kullanılarak eğitilen modeller, gerçek zamanlı olarak PyCharm üzerinde OpenCv kütüphanesi kullanılarak tespit edilmiştir. Farklı derin öğrenme yöntemlerinin gerçek zamanlı sistemde performans üzerine etkisi incelenmiş ve başarılı sonuçlar elde edilmiştir. En başarılı sonuç Yolov5x mimarisi kullanılarak gerçekleştirilen gerçek zamanlı uygulamada % 90,8 doğruluk oranı ile elde edilmiştir. The number of companies producing paper cups in our country is increasing day by day. Paper cup printing machines are produced in countries such as China, Korea, etc. There are also domestically produced machines in Turkey. These machines can print paper cups in sizes called 4, 7, 8, 12 oz. Machines are controlled by motors such as servo motors and asynchronous motors. With the help of sensors and heating resistances mounted on the machine, high quality cups with less waste loss are printed. In this study, a system that controls the previously produced cup press machine with servo motor, asynchronous motor and PLC, makes image processing based error detection and removes the faulty product is designed. For error detection, classification using the deep learning methods Yolo and Haarcascade algorithms through a real-time camera, and real-time object detection using the OpenCv library. The detected faulty cup is taken from the production line with a piston and thrown into a box. Commands are given to the servo motor driver with the commands from the sensors, the servo motor encoder and the user. Asynchronous drive parameters are set on the drive. All commands can be entered by the user on a screen and the number of products produced can be monitored over the system installed on the screen. In the artificial intelligence part of the study, the data obtained from the dataset we created beforehand for the detection of faulty cups were classified with the models of the YOLO algorithm in the Python language and Google Colab environment. After the models were trained, data from the camera were detected in real time using OpenCv libraries on Jupyter Lab (integrated development environment). The data trained using the Haarcascade algorithm were detected in real time using the OpenCv library on PyCharm. The effect of different deep learning methods on performance in the real-time system has been examined and successful results have been obtained. The most successful result was obtained with 90.8% accuracy in real-time application using Yolov5x architecture.