Enstitüler / Institutes

Permanent URI for this communityhttps://hdl.handle.net/11727/1390

Browse

Search Results

Now showing 1 - 3 of 3
  • Item
    Yolov3 and kalman filter based star detecting algorithm for cubesats’ star tracker sensors
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2022) Yılmaz, Kevser; Nazlıbek, Sedat
    High accuracy of the attitude estimation in CubeSats is crucial for the reliability of the system and the complete fulfillment of CubeSat's missions. Star tracker cameras are reliable options for providing highly accurate attitude estimation on the satellites. The position information of the stars is one of the critical issues for high accuracy. Various star detection and position detection algorithms are used. Especially with the development of machine learning, in addition to traditional methods, state-of-the-art algorithms have begun to be developed. The accuracy of star detection in star detection algorithms using machine learning in the literature remains lower than in traditional methods. Therefore, this thesis uses the YOLOv3 deep learning network for star detection as a state of art method, and the traditional Kalman filter to track stars' positions and further increase accuracy by avoiding potential errors. The YOLOv3 algorithm, which has high sensitivity and fast working structure within the real-time object detection algorithms, processes the images from the star tracker cameras, increasing the sensitivity of the attitude estimation for star detection and position information by almost 99 percent. Moreover, in the attitude estimation algorithm developed with the star tracker for the cube satellites, the information coming from the YOLO network is filtered with the Kalman filter, which is one of the most reliable fractionation methods known, and the accuracy rate reaches almost 99 percent. CubeSat'larda tutum tahmininin yüksek doğruluğu, sistemin güvenilirliği ve CubeSat'ın görevlerini eksiksiz yerine getirmesi için çok önemlidir. Yıldız takip kameraları, uydularda yüksek doğrulukta tutum tahmini sağlamak için güvenilir seçeneklerdir. Tutum tahmininde hassas ölçümler yapabilmesi için yıldızların konum bilgisi kritik konulardan biridir. Literatürde çeşitli yıldız algılama ve konum algılama algoritmaları kullanılmaktadır. Özellikle makine öğrenmesinin gelişmesiyle birlikte geleneksel yöntemlerin yanı sıra son teknoloji algoritmalar da geliştirilmeye başlanmıştır. Literatürde makine öğrenimi kullanan yıldız tespit algoritmalarında yıldız tespitinin doğruluğu, geleneksel yöntemlere göre daha düşük kalmaktadır. Bu nedenle, bu tez, son teknoloji bir yöntem olarak yıldız tespiti için YOLOv3 derin öğrenme ağını ve yıldızların konumlarını izlemek ve olası hatalardan kaçınarak doğruluğu daha da artırmak için geleneksel Kalman filtresini kullanır. Gerçek zamanlı nesne algılama algoritmaları içerisinde yüksek hassasiyet ve hızlı çalışma yapısına sahip olan YOLOv3 algoritması, yıldız takip kameralarından gelen görüntüleri işleyerek, yıldız algılama ve konum bilgisi için konum tahmininin hassasiyetini neredeyse yüzde 96 oranında tek başına tamamlamaktadır. Ayrıca küp uydular için yıldız izleyici ile geliştirilen tutum tahmin algoritmasında YOLOv3 ağından gelen bilgiler bilinen en güvenilir tahmin yöntemlerinden biri olan Kalman filtresi ile filtrelenmekte ve doğruluk oranı neredeyse yüzde 99'a ulaşmaktadır.
  • Item
    Recognizing visual places from landscapes with zero shot learning
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2021) Savaşçı, Erdem; Sümer, Emre
    Image processing and deep learning methods are being developed day by day and the need of recognizing objects and extracting information from visual-based digital multimedia data like pictures and videos is increasing. Therefore, the algorithms are also changing rapidly to meet the requirements of the tasks in everyday life. Zero-shot learning is a new topic and it encourages having small datasets. It still accomplishes the recognition task efficiently. As the name implies, Zero-shot learning is the process of making predictions for the unseen or untrained categories of data based on some amount of data that is learned by the training process earlier. In this study, visual recognition which is based on detecting the city, country, and continent is investigated. There is no or enough similar work on this problem up to now. The unseen places are recognized by training on similar places by categorizing the cities, countries, and continents. Labels and some auxiliary features like a 3D color histogram and GIST features are used to increase the detection accuracy. A new dataset is created for this study and with this work, the importance of the amount of data in the dataset is discussed and various metrics like performance and duration are demonstrated. Also, the comparison with the regular training problem setup is discussed. After all the results are examined, it is seen that ZSL performs better when search space is constrained with only unseen classes at test time. Also, the original generalized ZSL method performs better than the other generalized ZSL method and also inductive ZSL. Compared to traditional learning, various ZSL methods can give sufficient results too. Resimler üzerinden tanıma gerçekleştirme halen üzerinde sıkça çalışılan bir konu olmakla beraber gün geçtikçe ihtiyacın da arttığı bir alandır. Örneksiz Öğrenme yöntemi ile daha az veri üzerinde çalışılmakta olduğu için ve gerçek hayat senaryolarına yakın olması itibariyle önceden görülmemiş ve lokasyonu bilinmeyen görsel yerler üzerinden tanıma işleminde kullanılmasının yararlı olacağı düşünülmüştür. Literatürde Örneksiz Öğrenme yöntemi yaklaşımı ile şehir, ülke ve kıta bazında bir tanıma işleminin gerçekleştirilmesi konusunda örnek olabilecek bir çalışmaya rastlanmamıştır. Tanıma işleminin güçlendirilmesi için uzaklık metotları, üç boyutlu histogram ve GIST (resim içerisindeki karakteristik özelliklerin kodlanmış hali) veri seti üzerinden çıkartılarak yer tahmini işleminde kullanılmıştır. Bu çalışmada farklı şehirlerin yer aldığı yeni bir veri seti oluşturulmuş olup, görülmemiş bir yer resmi üzerinden tahminin ancak önceden benzer yerler üzerinden gerçekleşen öğrenme işlemi sayesinde yapılabileceği için çalışmada alınmış olan bazı kararlar da anlatılmıştır. Çalışma kapsamında normal öğrenme tekniği ile kıyaslama yapılıp Örneksiz Öğrenme yönteminin avantajları anlatılmıştır. Tüm sonuçlar incelendikten sonra standart Örneksiz Öğrenme metodunun genelleştirilmiş ve test zamanında sadece test kümesi üzerinde çalışan versiyonundan daha iyi çalıştığı görülmüştür. Ek olarak genelleştirilmiş ve test zamanında eğitim ve test kümesi üzerinde çalışan versiyonun en iyi sonuçlar verdiği ve normal öğrenme tekniği ile kıyaslanabilir olduğu görülmüştür.
  • Thumbnail Image
    Item
    Video concept classıfıcatıon and retrıeval
    (Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2016) Ergün Akyüz, Hilal; Sert, Mustafa
    Search and retrieval in video content is a trending topic in computer vision. Difficulties of this research topic is two folds; extracting semantic information from structure of video images is not a simple task and demanding nature of video content requires efficient algorithms. Semantic information extraction is challenged by researchers for more than two decades, yet new improvements are still welcome by the community. Recent burst of efficient computer hardware architectures has exploited both accuracy and complexity of many algorithms adding a new dimension to the efficient algorithm selection. In this thesis, our goal is to classify visual concepts in video data for content-based search and retrieval applications. To this end, we introduce a complete visual concept classification and retrieval system. We use two state-of-the-art methods, namely “Bag-of-Words” (BoW) and “Convolutional Neural Network” (CNN) architecture for visual concept classification. The performance of the classifiers is further improved by optimizing the processing pipeline steps. For retrieval, we provide concept- and contentbased querying of video data and perform evaluations on Oxford Buildings and Paris datasets. Results show that, a substantial performance gain is possible by optimizing processing pipelines of the classifiers and deep learning based methods outperform the BoW. Video içerikleri içerisinde arama ve geri getirme bilgisayarlı görme alanında yükselen bir konudur. Bu alandaki zorluklar iki başlık altında toplanabilir; video imgeleri içerisindeki anlamsal bilginin çıkarımı kolay bir iş değildir ve video içeriklerini analiz edebilmek için yüksek verimlilikteki algoritmalara ihtiyaç duyulmaktadır. Bu alanda çalışan araştırmacılar anlamsal bilginin çıkarılması konusuna 20 yılı aşkın bir süredir eğilmektedir ve bu alandaki iyileştirmelere hala ihtiyaç duyulmaktadır. Son yıllarda bilgisayar mimarilerinin verimliliğinde yaşanan artışlar hem algoritmaların başarımlarını hem de karmaşıklıklarını artırmıştır ki bu da efektif algoritma seçimine yeni bir boyut kazandırmaktadır. Bu tez çalışmasında, amacımız video verileri içindeki görsel kavramların arama ve geri getirme uygulamalarına yönelik sınıflandırılmasıdır. Bu amaç doğrultusunda görsel kavram sınıflandırma ve geri getirme bazlı bir sistem öneriyoruz. Günümüzde çokça tercih edilen iki görsel sınıflandırma yaklaşımını sistemimize entegre ediyoruz; “Kelime Kümesi” yaklaşımı ve “Evrişimsel Sinir Ağları” yaklaşımı. Buna ek olarak, kelime kümesi temsili ve evrişimsel sinir ağları aşamalarında optimizasyonlar yaparak, öğrenme algoritmalarının başarımlarını artırıyoruz. Geri getirme için kavram ve örnek tabanlı sorgulama yöntemlerinin gösterimini yapıyoruz ve literatürde en çok tercih edilen Oxford Buildings ve Paris veri kümeleri üzerinde sonuçlarımızı görselliyoruz. Sonuçlar gösteriyor ki, kelime kümesi temsili ve evrişimsel sinir ağları aşamalarında yapılan optimizasyonlar yüksek performans artışlarını olası kılmaktadır ve derin öğrenme tabanlı metodlar kelime kümesi yaklaşımından daha iyi sonuçlar vermektedir.