Browsing by Author "Oğul, Hasan"
Now showing 1 - 20 of 21
- Results Per Page
- Sort Options
Item Alerjen proteinlerin otomatik sınıflandırılması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2008) Eren, Öykü; Oğul, HasanAlerjen proteinlerin tanınması ve sınıflandırılması, özellikle son yıllarda sıkça kullanılan genetik değisikliğe uğramıs gıdaların denetlenmesi ve biyo-ilaçların tasarımı açısından büyük önem kazanmıstır. Dünya Sağlık Örgütü ve Gıda ve Tarım Örgütü kurumları bu amaçla alerjen proteinlerin tespiti için bazı rehberler hazırlamıstır. Ancak, bu rehberlerde önerilen yöntemler çoğunlukla yarı-otomatik gerçeklestirilen ve tahmin yeterliliği düsük olan yöntemlerdir. Son birkaç yılda bazı otomatik yöntemler önerilse de bunlar ya istenilen yeterlilik seviyesine ulasamamıs ya da islem zamanı ve bellek gereksinimi açısından avantajsız olmuslardır. Bu çalısmada, alerjen proteinlerin sadece dizilim verisi kullanılarak, farklı makine öğrenme yöntemleri bilinen bazı dizilim gösterim yaklasımları ile denenmistir. Farklı dizilim gösterim yöntemleri için K-En Yakın Komsu, Bulanık K-En Yakın Komsu ve Destek Vektör Makineleri (DVM) kullanılmıs ve sonuçlar karsılastırmalı olarak verilmistir. The prediction and classification of the allergen proteins have received great importance on the inspection of genetically modified food, which are used especially in the recent years, and the design of bio-pharmaceuticals. World Health Organization (WHO) and Food and Agriculture Organization (FAO) prepared guidelines for the prediction of allergen proteins. However, the methods proposed in these guidelines are mostly semi-automatic and have low prediction accuracy. Although some automated methods have been proposed in the last few years, either they could not reach the required sufficiency level or they were insufficient as for the processing time and memory usage. In this study, various machine learning methods were tried with some known sequence representation approaches by using only the sequence data of the allergen proteins. For various sequence representation approaches, K-Nearest Neighbour, Fuzzy K-Nearest Neighbour and Support Vector Machines (SVM) were used and the results were given with comparison.Item Assocıatıng mıcrorna wıth ıts chemotherapy resıstance(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2016) İğdeli, Muratcan; Oğul, HasanGenes are regulated by several factors including tiny molecules, called microRNAs. This regulation affects several processes in the cell. Recent findings suggest that microRNAs play important role in resistance to certain chemotherapies. The knowledge of what microRNAs are potentially resistant to given chemotherapies is therefore a crucial knowledge on drug design and therapy scheduling activities. In this thesis, we attempt to predict the list of microRNAs which are resistant to given drug using solely their mature sequence information. With this objective, we employ three common approaches for sequence classification in bioinformatics, i.e. pairwise, generative and discriminative models. The experimental results on a knowledge-driven dataset promote the use of pairwise models as a complementary tool in association studies for microRNAs and drugs. Genler mikroRNA olarak adlandırılan küçük moleküller gibi birçok faktör tarafından düzenlenir. Bu düzenleme hücrelerde birçok süreci etkiler. Güncel buluşlar mikroRNA’ların kemoterapiye karşı dirençte önemli bir rol oynadığını göstermektedir. mikroRNA’ların verilen kemoterapiye karşı potansiyel dirençleri hakkındaki bilgi ilaç dizaynı ve terapi ayarlanması üzerinde çok önemli bir bilgidir. Bu tez çalışmasında, verilen ilaca karşı direnç gösteren mikroRNA’ların listesi, yalnızca mikroRNA’ların olgun dizilerinin bilgileri kullanılarak tahmin edilmeye çalışılmıştır. Bu açıdan, 3 farklı ve biyo-enformatik alanında yaygın olarak kullanılan dizi sınıflandırma metotları kullanılmıştır. Bunlar ikili karşılaştırma yöntemi, yayımlayıcı yöntem ve ayırt edici yöntemdir. Bilgi odaklı bir dataset üzerinden elde edilen deneysel sonuçlar ikili karşılaştırma modelini, mikroRNA’lar ve ilaçları ilişkilendirmede tamamlayıcı bir araç olarak göstermiştir.Item Breast cancer diagnosis from thermal images(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Cabıoğlu, Çağrı; Oğul, HasanMeme kanseri, kadınlar arasında en yaygın kanser türlerinden biridir. Göğüs kanserinin erken teşhisi ve tedavisi hastalar için hayati öneme sahiptir. Göğüs kanserine yakalanma oranı gün geçtikçe artar iken, erken teşhis teknikleri sayesinde ölüm oranları azalmaktadır. Gelişen teknoloji ile görüntüleme sistemlerinde birçok önemli gelişmeler yaşanmıştır. Kanserin saptanmasında çeşitli görüntüleme teknikleri kullanılmaktadır. Termal görüntüler, termal kamera tarafından radyasyon verilmeden bölgelerin sıcaklık farkı kullanılarak elde edilir. Bu çalışmada, termal görüntüler kullanılarak meme kanserinin bilgisayar destekli tanısı için yöntemler sunulmaktadır. Bu amaçla, transfer öğrenme metodolojisi kullanılarak çeşitli Evrişimli Sinir Ağı (CNN) modelleri tasarlanmıştır. Tasarlanan ağların performansı, doğruluk, kesinlik, hatırlama, F1 ölçüsü ve Matthews Korelasyon katsayısı dikkate alınarak bir kıyaslama veri kümesinde değerlendirilmiştir. Sonuçlar, önceden eğitilmiş evrişimsel katmanların tutulması ve yeni eklenen tam bağlantılı katmanların eğitiminin en iyi puanları verdiğini göstermektedir. CNN ile transfer öğrenme metodolojisini kullanarak %94.3 doğruluk, %94.7 hassasiyet ve %93.3 duyarlılık elde ettik. Breast cancer is one of the prevalent types of cancer. Early diagnosis and treatment of breast cancer have vital importance for patients. Various imaging techniques are used in the detection of cancer. Thermal images are obtained by using the temperature difference of regions without giving radiation by the thermal camera. In this study, we present methods for computer aided diagnosis of breast cancer using thermal images. To this end, various Convolutional Neural Network (CNN) models have been designed by using transfer learning methodology. The performance of the designed nets was evaluated on a benchmarking dataset considering accuracy, precision, recall, F1 measure, and Matthews Correlation coefficient. The results show that holding pre-trained convolutional layers and training newly added fully connected layers gives the best scores. We have obtained an accuracy of 94.3%, a precision of 94.7% and a recall of 93.3% using transfer learning methodology with CNN.Item Bütünleştirici modül ağlarıyla gen düzenleme analizi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Özcan, Giray Sercan; Oğul, HasanGen düzenlemesi karmaşık bir biyolojik olgudur. Bu sürecin güvenilir bir analizi, çok sayıda veri kaynağının kullanımını gerektirir. Bu tezde, Bayes modül ağları kullanılarak transkripsiyon sırası ve transkripsiyon sonrası gen düzenlemesinin aynı anda modellenmesi için bir yaklaşım sunulmaktadır. Model mRNA, mikroRNA ve transkripsiyon faktörlerinin birlikte düzenlenen elemanlarına ek olarak düşük seviyeli düzenlenme devrelerinin üretimi için mRNA ve mikroRNA ifade ve dizilim bilgisinin eşleştirilmiş örneklerini kullanır. Gerçek kanser veri seti üzerinde yapılan deneylerde, biyolojik olarak anlamlı birçok küme ve anlaşılabilir motifler elde edilmiştir. Sonuçlar, bazı test edilebilir biyolojik hipotezler üretilmesini de sağlamıştır.Item Derin öğrenme ağları kullanılarak protein metal bağlanma yerlerinin analizi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Haberal, İsmail; Oğul, HasanProteinler çevrelerinde bulunan metal iyonlarıyla kuvvetli bağlar oluşturarak katlanırlar ve üç boyutlu yapılarına ulaşırlar. Proteinlerin üç boyutlu yapısı, hücre içerisinde hangi yaşamsal fonksiyonu yerine getirdiğini gösterir. Protein dizilimi kullanılarak proteinlerin metallerle bağlanma durumunu tahmin etmek, proteinin yapısı, fonksiyonlarını tahmin etmek ve ilaç keşfi için önemlidir. Aminoasit dizilimlerinden elde edilen verilerden yola çıkarak ve makine öğrenmesi yöntemleri kullanılarak yapılan hesaplamalı tahminler çeşitli bioinformatik alanlarında yaygın olarak kullanılmaktadır. Bu tez çalışmasında, protein dizilimlerinde bulunan Histidin (HIS) ve Sistein (CYS) aminoasitlerinin metallerle bağlanma durumlarının tahmini için üç farklı derin öğrenme mimarisi önerilmektedir. Bu mimariler TensorFlow üzerinde çalışan Keras kullanılarak geliştirilmiştir. Bu mimariler sırasıyla evrişimsel sinir ağı, uzun-kısa süreli hafıza ve kapılı tekrarlayan hücre modelleri üzerine inşa edilmiştir. Bu modeller doğrudan dizilim verileri üzerinde çalışamadığından, ilgili modelleri beslemek üzere PAM skorlama matrisi, protein kompozisyonları ve ikili temsil yöntemlerine dayalı sayısallaştırma teknikleri uygulanmıştır. Geliştirilen mimariler ve protein dizilimi sayısallaştırma yöntemleri 2727 proteinden oluşan kıyaslama veri kümesi üzerinde test edilmiştir. Elde edilen sonuçlar Naive Bayes, destek vektör makineleri (SVM), Adaboost ve Bagging makine öğrenme yöntemleri ile elde edilen sonuçlarla karşılaştırılmıştır. Protein metal bağlanma yeri tahmini için en iyi sonuçların evrişimsel sinir ağ mimarisi ile elde edildiği görülmektedir. Bu sonuç, aynı veri kümesi ile literatürde var olan diğer çalışmalardan daha iyi başarım elde edildiğini göstermektedir. Elde edilen bu sonuçlar kullanılarak, bir metal iyonunun koordinasyonunda hangi kalıntıların birlikte yer aldığına karar vermek için metal bağlanma yerlerinin geometrisi değerlendirilmiştir. Proteins fold by forming strong bonds with the metal ions in their environment and reach their three-dimensional structure. The three-dimensional structure of proteins shows which critical function it performs in the cell. Prediction of protein metal binding sites using protein sequence is important for predicting protein structure, functions, and drug discovery. Computational estimates using machine learning methods based on data from amino acid sequences are widely used in various bioinformatics fields. In this thesis, three different deep learning architectures are proposed for the prediction of metal binding status of Histidine (HIS) and Cysteine (CYS) amino acids in protein sequences. These architectures are built on convolutional neural network (CNN), long-short term memory (LSM) and gated recurrent unit (GRU) models, respectively. These architectures are developed using Keras with Tensorflow backend. Since these models cannot work directly on sequence data, digitization techniques based on PAM scoring matrix, protein compositions and binary representation methods have been applied to feed the relevant models. Developed architectures and protein sequence digitization methods have been tested on benchmark data set consisting of 2727 proteins. The results obtained were compared with the results obtained with Naïve Bayes, Support vector machines, Adaboost and Bagging machine learning methods. It seems that the best results for prediction of protein metal binding site are obtained with CNN architecture. This result shows that better performance was obtained with the same dataset than other studies in the literature. Using these results, the geometry of the metal binding sites was evaluated in order to decide which residues are involved in the coordination of a metal ion.Item Ders videolarının içerik tabanlı erişimi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Ağzıyağlı, Veysel Sercan; Oğul, Hasanİnternet teknolojisinin ve içerik sağlayıcıların artmasıyla birlikte tüm dünyada ders videolarında da diğer videolarda olduğu gibi büyük bir artış gerçekleşmiştir. Covid 19 salgınının dünyayı etkisi altına alması hem çevrimiçi eğitim içeriğinin artmasına hem de uzaktan eğitimin hızlı bir şekilde artmasına sebep olmuştur. Video sayılarında bu yüksek artış hızı öğrencilerin video içeriklerine erişimini çok zorlaştırmıştır. Bu çalışmada önerilen yöntemler videoların içerik tabanlı erişimini sağlamak üzerinedir. Ders videoları metinsel, işitsel ve görsel içeriğe sahiptir. Bu çalışma için 110 videoluk bir ders videosu veri kümesi oluşturulmuştur. Veri kümesindeki ders videolarının metinsel içerikleri Optic Character Recognition (OCR) teknolojisi ile çıkarılmıştır. Bu çıkarılan içerikler üzerinden 3 adet geleneksel makine öğrenimi yöntemi ve 1 adet derin öğrenme yöntemi ile sınıflandırma gerçekleştirilmiştir. Kullanılan geleneksel makine öğrenimi yöntemleri Support Vector Machine, Naive Bayes ve Random Forest yöntemleridir. Kullanılan derin öğrenme yöntemi ise Long Short Term Memory yöntemidir. Bu çalışma, makine öğrenme yöntemlerinin ve derin öğrenme yönteminin ders videolarının içerik tabanlı erişimde kullanılabilmesi için bir yaklaşım önermektedir. By the development of the internet technology and increasing internet providers have risen the amount of lecture videos as well as the other type of contents. While the impact of Covid 19 Pandemic around all over, that also changed the road map of education. Both the number of online educational content and the distance learning source and demand have increased alot. This rate of increase in the content and providers made it difficult to reach exact contents at its finest. The methods suggested in this study aim content based access to videos. Lecture videos have textual, audio and visual content. In order to illuminate this study, a lecture video dataset with 110 videos was created and the textual contents of the lecture videos in the Data Set were extracted by Optical Character Recognition (OCR) technology. Classification has done by three traditional machine learning methods and one deep learning method. Traditional machine learning methods applied in this study are Support Vector Machine, Naive Bayes and Random Forest methods. The deep learning method applied is the Long Short Term Memory method. In this study it is intended using machine learning and deep learning approaches to reach content based lecture videos.Item Dizilim verisinden mikroRNA fonksiyon tahmini(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Tunce, Mehmet Emre; Oğul, HasanGelişen teknolojiyle birlikte bilimsel çalışmalar da hız kazanmıştır. Bu durum bilimsel çalışmaların sayısını arttırıp, elde edilen sonuçların başka çalışmalarda kullanılma oranını yükseltmiştir. Dolayısıyla kusursuz verilerle ve zaman kaybını minimize ederek çalışmak önemli bir hal almıştır. Özellikle kanser gibi bütün insanlığı önemli ölçüde etkileyen hastalıklarla ilgili çalışmalarda bu durum daha da önem kazanmıştır. Kanser çalışmalarındaki ilerlemeler, mikroRNA adı verilen kısa RNA dizilerinin kanserle ilişkili olduğunu ispatlamıştır. Bu durum mikroRNA’lar üzerinde yapılan deneylerin artmasına ve ilgili veri tabanlarına bir çok veri eklenmesine sebep olmuştur. Bu veriler her ne kadar özenle elde ediliyor olsa da, bazen eksik ya da yanlış olarak kaydedilebilmektedir. Ayrıca yapılan ölçümler mikroRNA’ların keşif hızına yetişememekte ve araştırmacılar bu ölçümlerin yapılmasını beklemek zorunda kalmaktadır. Bu çalışma ile mikroRNA ların gen ifadelerinin, bilgisayar destekli yöntemlerle tahmin edilmesi amaçlanmıştır. Bu kapsamda gen ifadesi aranan mikroRNA’nın, ifadesi bilinen mikroRNA’ların promotör kısımları ve transkripsiyon faktörler arasındaki ilişkiden faydalanarak ifadesinin tahminine çalışılmıştır. Çalışmada lineer regresyon, KNN regresyon ve RVM regresyon yöntemleri uygulanmış ve sonuçların doğruluğu Spearman ve Pearson doğrulama yöntemleriyle değerlendirilmiştir. Değerlendirmeler sonucunda RVM regresyon yönteminin yüksek başarı sağladığı görülmüştür. Bu çalışma dizilim verisinden mikroRNA ifadesi tahminine yönelik ilk çalışma olduğundan, sonraki çalışmalara ışık tutması bakımından önemli bir yere sahiptir.Item Döküman kategorizasyonu ve imza bölge analizi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Cüceoğlu, İlkhan; Oğul, HasanBu tezde, taranmış doküman görüntülerinin otomatik analizi üzerine çalışmalar yapılmıştır. Bu amaçla doküman analizinde iki alt problem ele alınmıştır; dokümanların otomatik kategorizasyonu ve doküman üzerinde imza tespiti. Doküman tabanlı resimlerin kategorizasyonu birçok uygulama için önemli bir araçtır. Bu çalışma bankacılık uygulamalarında sık kullanılan dokümanları kategorize eden bir altyapıyı tanıtmaktadır. Altyapı, dokümandan oluşturulan metin bilgisi ve doküman resim özniteliklerini kullanmaktadır. Özniteliklerin çıkartılması ve seçilmesi ile ilgili teknik uygulanmış ve Türkçe metinler için özelleştirilmiştir. Dokümanın resim özniteliklerini kullanarak yapılan kategorizasyon ise, işlem maliyeti yüksek olan optik karakter tanıma işlemine gereksinim duymadığından daha hızlı sonuç veren bir alternatif sunmaktadır. Dokümanlarda elle atılan imzanın bulunduğu bölgenin otomatik olarak belirlenmesi bankacılık, sigorta ve kamu sektöründeki iş süreçlerinde katma değer üretebilecek bir özelliktir. Çalışma, herhangi bir tip sigorta dokümanından imzanın çıkarılmasını sağlayan bir altyapıyı tanıtmaktadır. Geliştirilen altyapı, bölütlere ayrılmış resmin temsil eden resim öznitelikleri ile sınıflandırılması işlemine dayanmaktadır. Bölütleme, iki etaplı bağlı bileşenlerinin etiketlenmesi ile gerçekleştirilmektedir. Bölütler, farklı öznitelik temsil yöntemleri ile vektöre çevrilip, destek vektör makineleri ile sınıflandırılarak imza içeren ve içermeyen olarak ayrıştırılmaktadır. Gerçek sigorta dokümanlarından oluşan veri kümesi üzerinde yapılan deneyler, geliştirilen altyapının yüksek doğruluk değerlerine ulaşabildiğini ve gerçek hayattaki uygulamalarla birlikte çalışabileceğini göstermektedirItem Experiment Retrieval in Genomic Databases(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2019) Dede Şener, Duygu; Oğul, HasanGenomic data can be found in different formats such as experimental measurements, sequences, networks. Due to the rapid growth of such data in genomic repositories, retrieving relevant experiments has become an important issue to be addressed by researchers. To search an experiment through the databases, users generally use textual meta-data such as organism name, description, author, but this type of search is insufficient to represent the overall content of the experiment. Content-based search strategy has become an alternative solution for retrieving relevant experiments from huge data collections. This thesis study aims to develop retrieval models for different data types to find relevant experiments in genomic databases. The study has two main parts: time-series experiment retrieval framework and whole-metagenome sequencing sample retrieval framework. In the first part, different fingerprinting techniques and comparison metrics were used to retrieve relevant time-series experiments. The originality of this part consists in its attempt for taking gene expression profiles over the entire time points as a query and retrieving relevant samples from the data repository. The second part consists of developing a content-based retrieval framework for whole-metagenome sequencing samples. The framework involves different fingerprinting, feature selection methods and similarity measurements for a given data set. The main contribution of the study is extracting fingerprints based on two text mining methods. The experimental results showed that the proposed models have been successful in finding relevant experiments for genomic data in different formats. Experimental results also encourage the use of the proposed models in current database implementations. Genomik veri; deneysel ölçüm, sekans verileri, ağ yapıları gibi farklı formatlarda saklanmaktadır. Genomik veri tabanlarında saklanan bu tür verilerin son yıllardaki hızlı artışı, deneylerin geri getirimi konusundaki ihtiyaçları gündeme getirmektedir. Kullanıcılar, veri tabanında bir deneyi ararken genellikle metin-tabanlı arama tekniğini kullanmaktadırlar. Fakat bu teknik, deney içeriğini temsil etmede yetersiz kaldığı için yeni yöntemlere ihtiyaç duyulmaktadır. Bu ihtiyaç doğrultusunda, içerik tabanlı arama yöntemleri benzer deneylerin geri getiriminde kullanılan alternatif yöntem olmuştur. Bu tez, farklı türlerde olan genomik verilerin veritabanlarında aranabilmesini sağlayan geri getirim modellerinin tasarımını amaçlayan bir çalışmadır. Çalışma, zaman serisi deney geri getirimi, bütün metagenom sekanslama örneklemlerinin geri getirimi olmak üzere iki temel kısımdan oluşmaktadır. Birinci kısım, zaman serisi deneylerin geri getirimi için farklı imza yöntemlerinin ve uygun benzerlik metriklerinin uygulanmasını içermektedir. Bu çalışma zaman serisi deneyinin tümünü sorgu olarak alan ve arama yapan ilk çalışma olma özelliğini taşımaktadır. İkinci kısımda ise, tüm metagenom sekanslama deneylerinin geri getirimi için farklı imza yöntemlerini, özellik seçim algoritmalarını ve benzerlik metriklerini içeren bir içerik tabanlı arama altyapısı geliştirilmiştir. Çalışmanın temel katkısı, deney imzalarını oluşturmada iki farklı veri madenciliği yönteminin kullanılmasıdır. Deneysel sonuçlar, geliştirilen modellerin benzer deneyleri bulmada başarılı olduklarını göstermektedir. Ayrıca, sonuçlar geliştirilen bu modellerin mevcut veri tabanı uygulamalarında kullanımları konusunda umut vaat etmektedir.Item Gen ifade tahmini için veri bütünleştirme(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2019) Bayrak, Tuncay; Oğul, HasanCanlı formunun sürdürülebilirliğinin temelinde protein sentezi yer almaktadır. Protein sentezinde, insan genomundaki kodlayıcı genleri düzenleyen küçük nükleotid dizilerinin (mikro RNA) ve diğer yönetici genlerin (Transkripsiyon Faktör, TF) önemli görevleri vardır. Bu çalışmanın amacı, mikro RNA ve TF’lerin düzenleme bilgisinin protein kodlayıcı genlerin ifade tam değerlerinin kestirim performansına etkisini araştırmaktır. Gen ifade tam değerini tahmin etmek için regresyon tabanlı modelleri içeren sistematik yaklaşımlar ortaya konulmuştur. Öncelikle, gen ifade ölçümlerinde yaygın olarak karşılaşılan kayıp veri (missing data) problemini çözmek için doğrusal, k-NN ve İlişkisel Vektör Makinesi (RVM) regresyon modelleri uygulanmıştır. Regresyon modelinin eğitiminde genellikle aynı genin farklı deneylere ait ifade değerlerinden oluşan vektörler kullanılmaktadır. Daha sonra, bu ifade vektörlerine aynı deneye ait farklı gen ifade değerlerinin dâhil edilmesinin gen ifade tahminine etkisi araştırılmıştır. Bunun için İki Yönlü İşbirlikçi Filtreleme (Two-way collaborative filtering) yöntemi kullanılarak gen ifade değerlerinden oluşan tek yönlü veri matrisi iki yönlü veri matrisine dönüştürülmüş ve regresyon modeli bu yeni veri matrisi ile oluşturulmuştur. Gen ifade tahmini için ilk defa kullanılan bu yeni öznitelik sunum tekniği ile kestirim performansının artırıldığı görülmüştür. Ayrıca farklı kanser türlerine ait gen ifade verilerinin bütünleştirilmesinin gen ifade tahminine etkisi de araştırılmıştır. Burada, prostat kanserine ait gen ifade değerlerinin tahmin edilmesinde kolon kanseri verisinin model öğrenmede kullanılmasının kestirim performansını artırdığı görülmüştür. Literatürde gen ifade değerleri kullanılarak gen düzenleyici moleküller ile genler arasındaki ilişkinin tespit edilmesine yönelik çok sayıda çalışma bulunmaktadır. Ancak hücrede meydana gelen bu etkileşimler kullanılarak gen ifade tam değerinin tespitine yönelik çalışmalar oldukça kısıtlıdır. Son olarak, farklı veri yapısındaki miRNA-gen ve TF-gen regülasyon bilgileri ile gen ifade değerleri bütünleştirilmiş olup doğrusal ve RVM regresyon modelleri kullanılarak kestirim performansına etkisi araştırılmıştır. Veri bütünleştirme yaklaşımlarında Öklid, Affine Dönüşüm ve Bhattacharya uzaklık ölçütleri kullanılmıştır. Gen ifade matrisleri; Gene Expression Omnibus veritabanından, TF-gen regülasyon bilgisi TRANSFAC veritabanından ve miRNA-gen regülasyon bilgisi ise mirDB, mirTarbase ve mirConnX veri tabanlarından alınmıştır. Kestirim performansının değerlendirilmesinde Spearman benzerlik katsayısı, Pearson benzerlik katsayısı ve Hata Kareleri Ortalamasının Karekökü (RMSE) ölçütleri kullanılmıştır. miRNA-gen regülasyon bilgisinin bütünleştirilmesi ile gen ifade tahmini performansının artırıldığı görülmüştür. Protein synthesis is the basis of the sustainability of the living form. Small nucleotide sequences (micro-RNA) and other executive genes (Transcription Factor, TF) that regulate coding genes play an important role in the protein synthesis. The aim of this study was to investigate the effect of regulation information of micro-RNA and TFs on the performance of predicting the exact value of expressions of protein coding genes. In order to predict the exact value of gene expression, systematic approaches that includes regression-based models are introduced. First, linear, k-NN and Relational Vector Machine (RVM) regression models were applied to solve the common problem of missing data in gene expression measurements. The expression vectors used in the training phase of the regression model are generally composed of the expression values of the same gene that belongs to different experiments. After that, the effect of the inclusion of different gene expression values of the same experiment on these expression vectors was investigated. For this, the one-way data matrix, consisting of gene expression values, was transformed into a two-way data matrix using Two-way Collaborative Filtering method and the regression model was built with this new data matrix. It is observed that this new feature representation technique that is first used in this study for gene expression predicting increases the performance of predicting. In addition, the effect of integrating gene expression values of different cancer types on gene expression predicting is also investigated. Here, it is observed that the use of colon cancer data in model learning to predict the gene expression of prostate cancer increases prediction performance. There are many studies in the literature to determine the relationship between regulating molecules and genes using gene expression values. However, there are very limited studies based on predicting the exact value of gene expression by using these relations in the cell. Finally, miRNA-gene and TF-gene interaction information and gene expression values were integrated and the prediction performance outcomes obtained by using linear and RVM regression models were discussed. Euclidean, Affine Transformation and Bhattacharya distance measures were used in data integration approaches. Gene expression matrices from Gene Expression Omnibus; TF-gene regulation information from TRANSFAC; miRNA-gene regulation information from mirDB, mirTarbase and mirConnX were used. Spearman similarity coefficient, Pearson similarity coefficient and Root Mean Squared Error (RMSE) were used to evaluate the performance of predicting. It is observed that the performance of predicting gene expression is increased by integrating of miRNA-gene regulation information.Item Gen ifade veritabanlarında içerik tabanlı arama(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2014) Hayran, Ahmet; Oğul, HasanBüyük ölçekli gen ifade veritabanlarında zaman serisi mikrodizi deneylerinin içerik tabanlı aranması problemi ilk defa bu çalışmada araştırılmaktadır. Probleme bir bilgi geri getirim görevi olarak yaklaşılmış ve bir deneyin tamamı sorgu olarak ele alınıp önceki deneyler içerisinde aranmıştır. Metadata (üstveri) açıklamalarından daha ziyade içerik benzerliğine göre uygun deneylerin veri tabanı içerisinden bulunup getirilmesi gerekmektedir. Bu çalışmada, farklı parmak izi oluşturma yöntemleri ve uzaklık hesaplama şemalarının karşılaştırılması çeşitli zaman noktaları içerisindeki genlerin farklı ifade olma durumlarına dayalı geri getirim çatısı üzerinden sunulmuştur. Bizim oluşturduğumuz veri tabanı üzerinde yapılan tüm deneyler için, sonuçlar Pearson Bağıntı Katsayısı ve Tanimoto Uzaklığı’nın Öklid Uzaklığına göre farkı ifadeye dayalı parmak izlerinin karşılaştırılmasında yaklaşık %15 daha iyi olduğunu göstermektedir.Item Giyilebilir sensörlerle nesnel ağrı değerlendirme(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Erdoğan, Burak; Oğul, HasanAğrı, doku hasarıyla bağlantılı hoş olmayan bir his ve duygusal bir deneyimdir. Amacı vücudun reaksiyona girmesine izin vermek ve daha fazla doku hasarını önlemektir. Yorumlamak için sinir lifleri aracılığıyla beyne bir sinyal gönderildiğinde ağrı hissedilir. Ağrı deneyimi herkes için farklıdır ve ağrıyı hissetmenin ve tanımlamanın farklı yolları vardır. Bu ağrıyı tanımlamayı ve tedavi etmeyi zorlaştırabilir. Bu çalışmada, yaşamsal belirtiler kullanılarak ağrının objektif değerlendirilmesi için hesaplamalı bir çözüm sunulmaktadır. Ağrı oluşana kadar görülen hayati belirtiler kullanılmıştır ve ağrının varlığı tahmin edilmeye çalışılmıştır. Bu çalışma kapsamında MIMIC-III veri tabanı kullanılarak ağrı ile ilişkili 129,267 veri elde edilmiştir. Bu verilerin 76,310 tanesi ağrı var olarak işaretlidir. Bu veri kümesi kullanılarak ağrı var veya yok tahmini yapılmıştır. Alınan en yüksek AUROC skoru 0.711’dir ve Random Forest algoritması kullanılarak elde edilmiştir. Bu çalışma, makine öğrenmesi yöntemlerinin kullanılmasının, hastane ortamında ağrının bilgisayar desteğiyle izlenmesini bir dereceye kadar teşvik edebileceğini göstermektedir. Pain is an unpleasant sensation and emotional experience linked to tissue damage. It’s purpose is to allow the body to react and prevent further tissue damage. We feel pain when a signal is sent through nerve fibers to the brain for interpretation. The experience of pain is different for everyone, and there are different ways of feeling and describing pain. This can make it difficult to define and treat. In this study, a computational solution for objective assessment of pain using vital signs was offered. This thesis evaluates the performances of computational methods that take the sequence of vital signs acquired until pain onset as input and report the predicted existence of pain. In this study, 129,267 number of data related to pain were obtained by using MIMIC-III database. 76,310 of the data are marked as pain. Existance of pain estimation was made using this dataset. The highest AUROC score obtained was 0.711 using the Random Forest algorithm. This thesis argue that the use of computational intelligence methods can promote computer-aided monitoring of pain in hospitalized environment to a certain degree.Item Giyilebilir sensörlerle sağlık izleme(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2020) Aşuroğlu, Tunç; Oğul, HasanTeknolojinin gelişmesiyle birlikte verinin toplanması, saklanması ve işlenmesi yaygınlaşmış ve bu sebepten giyilebilir sensör teknolojisi günlük hayatımızda gitgide popülerleşmeye başlamıştır. Giyilebilir sensörler ve akıllı tekstiller daha küçük, daha ucuz ve kullanıcı tarafından kolaylıkla erişilebilir hale geldikçe günlük aktivite takibi ve sağlık alanlarında yaygın olarak kullanımı artmıştır. Günümüzde giyilebilir sensör teknolojileri, sağlık alanında hastalıkları önleme, erken teşhis ve kronik durumların yönetimi için etkili bir araç olarak kullanılmaktadır. Sağlık alanında giyilebilir sensörlerin kullanılmasının asıl amacı, hastanın sağlık parametrelerinin uzaktan izlemeyebilme imkânı ve dolayısıyla hastaların bir sağlık merkezine gitmelerine gerek kalmadan evlerinde tedavi olabilmesi ve hastalık durumunu takip edebilmesine olanak sağlamaktır. Bu bağlamda, tez çalışmasında giyilebilir sensörlerle elde edilen sinyalleri kullanarak hastalık seviyesi takibi çalışmaları gerçekleştirilmiştir. Çalışmada bu amaçla, ölümcül bir enfeksiyon hastalığı olan Sepsis ve günümüzde tedavisi olmayan nörolojik bir hastalık olan Parkinson hastalığı üzerine çalışmalar yapılmıştır. Sepsis hastalığında giyilebilir sensörlerle kolayca elde edilebilen hayati belirtiler kullanılmıştır. Bu hayati belirtiler, hastalık durumunu takip etmeyi sağlayan organ yetmezliği skorunun tahmin edilmesinde kullanılmıştır. Parkinson hastalığı semptom seviyesi değer tahmini, ayağa giyilen ve ayağa uygulanan kuvveti ölçen giyilebilir sensörlerle yürüyüş analizi yapılarak gerçekleştirilmiştir. Bu tahminleri gerçekleştirmek için tez çalışmasında geleneksel makine öğrenmesi yöntemlerinin yanı sıra, derin öğrenme ve tez çalışması kapsamında geliştirilen CNN ve Rastgele Orman tabanlı derin öğrenme hibrit mimarileri kullanılmıştır. Değer tahmin analizinde, geliştirilen hibrit mimarilerinin geleneksel yöntemlere göre performans artışı sağladığı gözlemlenmiştir. With the development of technology, the collection, storage and processing of data has become widespread, and therefore wearable sensor technology has become increasingly popular in our daily life. As wearable sensors and smart textiles become smaller, cheaper and easily accessible by the user, they are widely used in daily activity tracking and healthcare. Wearable sensor technologies are used today as an effective tool for disease prevention, early disease detection and management of chronic conditions. The main purpose of using wearable sensors in the field of healthcare is to monitor the health parameters of patients remotely, and therefore to enable patients to be treated at home and prognose the disease status without having to go to a healthcare center. To achieve a baseline in this manner, experiments were carried out in this thesis using the signals obtained with wearable sensors to prognose diseases. For this purpose, a fatal infectious disease called Sepsis and a neurological disease without treatment called Parkinson's disease, were selected for thesis study. Vital signs that can be easily obtained with wearable sensors are used in Sepsis prognose experiments. These vital signs have been used to predict the organ failure score that allows monitoring the disease status. Parkinson's disease symptom level value estimation was performed by walking analysis with wearable shoe system that measures the force applied to the foot. In order to perform these predictions, CNN and Random Forest based deep learning hybrid architectures are developed. Also, experiments are conducted with traditional machine learning and deep learning architectures to validate the performance of this approach. In experimental results, it was observed that the developed hybrid architectures provide performance increase compared to traditional methods.Item Metaloproteinlerin biyoenformatik analizi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2015) Küçükbay, Serkan Remzi; Oğul, HasanProtein içerisinde bulunan metal iyonları proteinlerin fonksiyonel görevlerini yerine getirebilmesi, yapısı ve kararlılığı için önem arz etmektedir. Bu sebeple, proteinler üzerinde metal ile bağlanma noktalarının yüksek performans ile tespiti çok önemlidir. Bu çalışma ile Sistein ve Histidin aminoasitlerinin protein dizilimlerini üzerinden metal ile bağlanma durumunu tahminleyen bir çalışma sunulmaktadır. Dört ayrı yöntem belirtilen amaç doğrultusunda kullanılmıştır. Bunlar; Destek Vektör Makinaları, Naive Bayes, Değişken uzunluklu Markov Zincirleri ve Smith Waterman algoritmasının bir sınıflandırıcı gibi kullanılmasıdır. Yukarda belirtilen bütün metotlar bu sınıflandırmayı sadece protein dizilim bilgisi üzerinden gerçekleştirilmiştir. Farklı birçok öznitelik vektörü oluşturulmuş ve bunların sonuçlara olan etkisi gözlemlenmiştir. Bu çalışma ile metal bağlanma noktaları %35 duyarlılık ve %75 anma değerleriyle Naive Bayes kullanarak, %25 duyarlılık ve %23 anma değerleriyle Destek Vektör Makinaları kullanarak, %0.05 duyarlılık ve %60 anma değerleriyle Değişken uzunluklu Markov zincirleri kullanarak ve çok düşük seçicilik performansı ile Smith Waterman algoritması kullanarak tahminlenebilmiştir. Bu çalışmalar sonrasında, seçilen öznitelik vektörlerinin sonuçlara önemli etkiler yaptığı gözlemlenmiştir. Aynı zamanda elde edilen sonuçlar Naive Bayes yönteminin bu alanda rekabetçi sonuçlar ürettiğini göstermiştir. Metal ions in protein are critical to the function, structure and stability of protein. For this reason, accurate prediction of metal binding sites in protein is very important. Here, we present our study which is performed for predicting metal binding sites for histidines (HIS) and cysteines from protein sequence. Four different methods are applied for this task: Support Vector Machine (SVM), Naive Bayes, Variable-length Markov chain and Smith Waterman Algorithm. All these methods use only sequence information to classify a residue as metal binding or not. Several feature sets are employed to evaluate impact on prediction results. We predict metal binding sites for mentioned amino acids at 35% precision and 75% recall with Naive Bayes, at 25% precision and 23% recall with Support Vector Machine and at 0.05% precision and 60% recall with Variable-length Markov chain, at very low performance with Smith Waterman Algorithm. We observe significant differences in performance depending on the selected feature set. The results show that Naive Bayes is competitive for metal binding site detection.Item MikroRNA deneylerinin bilgi tabanlı temsili ile tıbbi karar destek sürecinin desteklenmesi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2017) Çorapcıoğlu, M.Erdem; Oğul, HasanTıp teknolojilerinin gelişmesi ile hem kişiselleşmiş tıp yaklaşımı hem de gen ifadelerinin analizlerine yönelik çalışmalar yaygınlaşmaya başlamıştır. Gen ifadelerinin hastalık teşhisi ve benzer vakaların tespit edilmesi amacıyla kullanılabildiğinin gösterilmesi bu alanda disiplinler arası çalışmaların artmasına neden olmuştur. Gen ifadelerinin istatistiksel olarak karşılaştırılması esasına dayanan çalışmalar olmakla birlikte, alan bilgisinin analizlere yansıtılmasının araştırma verimliliğine olumlu olarak yansıyacağı değerlendirilmektedir. Bu tez çalışması kapsamında, mikroRNA (miRNA) ifadelerinin hastalık teşhisi ve ilgili vakaların geri getirilmesine yönelik kullanılmasında başarımın arttırılması hedeflenmiştir. Bu amaçla, alan bilgisinin analizlere yansıtılabilmesi için literatür tabanlı elde edilmiş miRNA grupları kullanılarak deney temsilinin küme bazlı yapılması yaklaşımı esas alınmıştır. Önerilen yaklaşım kapsamında araştırmacıların kullanımına açık tarayıcı tabanlı miSEA aracı (http://binf.baskent.edu.tr) geliştirilmiş ve deneylerin temsil edilmesi için kullanılmıştır. Bu yaklaşım ile geleneksel yöntemler karşılaştırılmış; sınıflandırma analizlerinde SVM algoritması ve geri-getirim çalışmalarında ise Öklid algoritması ile performans artışı sağlandığı tespit edilmiştir. Buna ek olarak, güncel gen ifade profilleme teknolojilerinin de analiz edilebilmesi için çapraz-teknoloji deney arama yaklaşımı önerilmiş ve performans analizleri yapılmıştır. Gerçekleştirilen sistem ve önerilen yaklaşımları içeren modüllerin karar destek sistemlerinde kullanılmasına yönelik öneri oluşturulmuştur. Recent technological advancements related with medical informatics has led to progress in both personalized medical support approach and the analysis of gene expression. It has been shown that gene expressions can be used to diagnose disease and identify similar cases. Besides the studies based on the statistical comparison of gene expressions, it is anticipated that the incorporation of the domain knowledge into the analyzes will make a positive contribution to the accuracy of research. Within the scope of this thesis, it is aimed to increase the success of using miRNA gene expressions to diagnose disease and to retrieve relevant cases. For this purpose, a set-based representation of experiments is proposed, which is based on the analysis of miRNA expressions together with miRNA sets obtained from the literature. Within the scope of the proposed approach, a browser-based tool, which is named as miSEA (http://binf.baskent.edu.tr), that is available to the use of researchers has been developed. The proposed approach has been compared with traditional methods and it has been found that performance improvement is achieved in classification by using SVM algorithm. Also, experiment retrieval performance improved by using Euclidean algorithm. In addition, a cross-technology experiment retrieval approach was proposed and performance analysis were conducted to analyze current gene expression profiling technologies. Moreover, a proposal has been made to use the modules including the implemented system and the suggested approaches in decision support systems.Item MikroRNA veri tabanlarında bil getir-getirimi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2015) Açıcı, Koray; Oğul, HasanBüyük ve açık veri tabanlarında bulunan biyolojik deneylerin içerik tabanlı geri getirimi biyoenformatik ve hesaplamalı biyolojide güncel bir problemdir. Ġçerik-tabanlı getirimde genel olarak, herhangi bir deneysel üst-veri içermeyen örnek sorgu kullanarak bir veri tabanında arama yapılabilmesi hedeflenmektedir. Bu çalıĢmada özel olarak mikrodizi veri tabanlarında ilgili mikroRNA deneylerinin geri-getirimi problemine odaklanılmıĢtır. Bunun için iĢlemsel bir alt yapı önerilmiĢtir. Mikrodizi profil deneylerinde farklı ifade olan mikroRNA‘ları belirlemek için bir normal-tekdüze karıĢım modeli alt yapıya uyarlanmıĢtır. Ayrıca mikrodizi deney içeriğini temsil etmek için bilgi-tabanlı bir yöntem önerilmiĢtir. ÖlçülmüĢ ifade verisi üzerinde istatistiksel zenginleĢme analizi için mikroRNA‘ların kemoterapi direncini temel alan bir dizi ek açıklamalı mikroRNA kümesi kullanılmıĢtır. Farklı ifade değerlerini temel alan gerçek-değerli deney imzalarını ikili hale çevirmede kullanmak üzere sıra-tabanlı bir eĢikleme yöntemi önerilmiĢtir. Kategorik imzaları karĢılaĢtırmak için etkili bir benzerlik ölçütü tanıtılarak iki deney arasındaki ilgililiğin ortaya çıkarılmasında kullanılmıĢtır. Önerilen modelin geri-getirim kabiliyetini ayırt etmek için deneysel ilgililik iki farklı bakıĢ açısı ile değerlendirilmiĢtir. Birincisi hastalık iliĢkisi, ikincisi ise embriyonik köken ortaklığıdır. Bilindiği kadarıyla deney geri getirim problemi, mikroRNA mikrodizileri bağlamında ilk defa bu çalıĢma ile incelenmiĢtir. Content-based retrieval of biological experiments in large public repositories is a recent challenge in computational biology and bioinformatics. The task is, in general, to search in a database using a query-by-example without any experimental meta-data annotation. Here, a more specific problem that seeks a solution for retrieving relevant microRNA experiments from microarray repositories is considered. A computational framework is proposed with this objective. The framework adapts a normal-uniform mixture model for identifying differentially expressed microRNAs in microarray profiling experiments. Also a knowledge-based approach for representing microarray experiment content is proposed. A group of annotated microRNA sets based on their chemotherapy resistance are used for a statistical enrichment analysis over observed expression data. A rank-based thresholding scheme is offered to binarize real-valued experiment fingerprints based on differential expression. An effective similarity metric is introduced to compare categorical fingerprints, which in turn infers the relevance between two experiments. Two different views of experimental relevance are evaluated, one for disease association and another for embryonic germ layer, to discern the retrieval ability of the proposed model. To the best of one's knowledge, the experiment retrieval task is investigated for the first time in the context of microRNA microarrays.Item Müzik üst-veri tahmini için Türkçe şarkı sözü madenciliği(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2015) Kırmacı, Başar; Oğul, HasanMüzik geri getirimi, internet ve ilgili teknolojilerin eğlence amaçlı yaygın kullanımı ile birlikte önemli bir problem haline gelmiĢtir. Kullanıcının aradığı Ģarkıya daha kolay ulaĢabilmesi, aradığı Ģarkıya benzer diğer Ģarkıları daha kolay bulabilmesi, dinlemek isteyebileceği Ģarkıları listeleyebilmesi için müzik geri getirim sistemleri geliĢtirilmiĢtir. Uygulanacak yöntem ne olursa olsun müzik nesnelerinin analiz edilmesi ve bu analizlere bağlı olarak müzik nesnelerinin anlamlandırılması gerekmektedir. Müzik analizi ile ilgili bu çalıĢmalar iki veri türü üzerine yoğunlaĢmıĢtır. Bunlar; müzik geri getirim sistemleri için melodik ve aranjman özniteliklerin kullanıldığı içerik sinyali ve Ģarkının adı, türü, bestecisi gibi verilerin bulunduğu üst-veri bilgileridir. ġarkı sözü metninin kullanımı çok azdır. Bu çalıĢma müzik geri getirim uygulamalarında Türkçe Ģarkı sözü metninden müzik üst-verilerinin tahmin edilebilirliğine dayalı bir altyapı sağlamaktadır. Hazırlanan Ģarkı sözleri veri kümeleri üzerinden Türkçe metnine ve dilbilgisi yapısına göre öznitelikler seçilmiĢtir. Seçilen öznitelikler kullanılarak bir makine öğrenme algoritması ile Ģarkı sözü yazarını, türünü ve yayın tarihini tahmin edebilen bir sistem önerilmiĢ ve farklı tarzlardaki söz yazarlarından oluĢturulan geniĢ bir Ģarkı veri kümesinde performansı değerlendirilmiĢtir. Elde edilen sonuçlar böyle bir yaklaĢımın müzik veri madenciliği ve bilgi geri getirimi çalıĢmalarında faydalı olabileceğini göstermektedir. Music retrieval has become an important problem with the widespread use of internet and related technologies for entertainment purposes. Music retrieval systems were developed for users to find songs they are looking for and similar ones in an easier manner, and list songs they might want to listen. Music objects should be analyzed and interpreted according to those analyses independent of the method that is going to be implemented. These studies on music analysis are mainly focused on two data types; content signal that is based on melodic and musical arrangement properties for music retrieval systems and meta-data information, such as name, genre, composer of the song. The use of lyrics text is very few. This study provides a basis for the prediction of meta-data of music from lyrics text in music retrieval applications. Features were chosen on the song lyrics data sets prepared according to the Turkish text and grammar structure. A system that can predict the writer, genre and relaese date of the song using the chosen features and a machine learning algorithm was presented and its performence on a large song data set generated from song writers with different styles was evaluated. Results show that this kind of an approach might be useful for music data mining and information retrieval studies.Item Prostat Kanseri ̇ İlintili MikroRNA Kümelerinin Tespiti(22nd Signal Processing and Communications Applications Conference (SIU 2014), Trabzon,, 2014) Haberal, İsmail; Oğul, HasanMicroRNAs (miRNAs) are a class of small non- coding RNAs of 22 nucleotides which normally function as negative regulators of target mRNA expression at the posttran- scriptional level. miRNAs play a role for one or more target genes by suppressing in processes as growth, differentiation, proliferation and cell death. Recent evidence has shown that miRNA mutations or mis-expression correlate with various hu- man cancers and indicates that miRNAs can function as tumour suppressors and oncogenes. MicroRNAs have been shown to repress the expression of important cancer-related genes and might prove useful in the diagnosis and treatment of cancer. In this study, hierarchical microRNA clusters are obtained through microarray expression data in order to analyze the microRNA prostate cancer relationships. Clustering results are evaluated by their biological relevance. It is seen that such approach can be useful in detectitn relationships between microRNAs and diseases.Item Taşınabilir sensörlerden aktivite ve kişi tanıma(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2017) Erdaş, Çağatay Berke; Oğul, Hasanİnsan fiziksel aktivitelerinin ve ilgili aktiviteyi yapan kişinin uzaktan tespiti, çeşitli alanlarda ihtiyaç duyulan önemli bir konudur. Bu amaçla giyilebilir hareket sensörlerinin kullanımı son yıllarda yaygınlaşmıştır. Bu tezde ivmeölçer, jiroskop ve manyetometre vasıtası ile hareket ve kişi tanıma üzerine çalışılmıştır. Sensörlerden elde edilen veriler üzerinden çıkarılan zaman, frekans ve dalgacık uzayı öznitelikleri ile Random Forest, J48, Adaboost ve Desicion Stump ikilisi, Support Vector Machine ve k-NN gibi öğrenme algoritmaları sınıflandırma amaçlı kullanılmıştır. Buna ek olarak, elde edilen sınıflandırma performansını geliştirmek için; filtreleme, öznitelik seçimi, sensör füzyonu gibi yöntemler denenmiştir. Bahsi geçen yöntemler, hem erişime açık veri kümelerinde hem de bu çalışma kapsamında toplanan el aktivitesi verileri üzerinde denenmiş ve sonuçları raporlanmıştır. Remotely detecting an activity and the person who performs this activity is an important issue that is needed in various fields. For this purpose, the usage of wearable motion sensors has been widespread in recent years. In this thesis, motion and person recognition were studied by means of accelerometer, gyroscope and magnetometer. The time, frequency and wavelet features were extracted from the data obtained from the sensors and learning algorithms such as Random Forest, J48, Adaboost and Desicion Stump, Support Vector Machine and k-NN were used for classification purposes. In addition, in order to improve the classification performance obtained; filtering, feature selection, fusion of sensors have been tried. The methods mentioned have been tried on both the open access data sets and hand activity data collected within the scope of this study, and the results have been reported.Item Yapay sinir ağları optimizasyon algoritmalarının banka özkaynak karlılığı tahmini üzerinde karşılaştırmalı performans analizi(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2021) Balcı, Tolgay; Gasilov, Nizami; Oğul, HasanBir ülkenin finansal sisteminin en önemli parçası olan bankacılık sektörünün performansını ve karlılığını ölçmek her zaman önemlidir. Performans ölçümü sayesinde bankalar rekabet durumunu, büyüme potansiyellerini ve riskleri değerlendirebilir ve faaliyetlerini sürdürmede daha başarılı olabilirler. Literatürde, bankacılık performans değerlendirmesinde yapay sinir ağları (YSA) nadiren kullanılmıştır. Bu nedenle, mevcut tezde bankaların performanslarını kestirmek için YSA kullanımının derinlemesine incelenmesi hedeflenmiştir. Amaç, bir dizi finansal parametreler verildiğinde, YSA hesaplama yöntemlerini kullanarak bankaların özkaynak getirilerini tahmin etmektir. Tez, Türkiye'deki tüm mevduat bankaları ele alınarak gerçekleştirilmiştir. Bağımsız değişkenler olarak kabul edilen 6 dış ve 8 iç parametrenin 11 yıla ait çeyrek dönemlik verileri kullanılmıştır. Veri kümesi; Bankacılık Düzenleme ve Denetleme Kurumu, Türkiye Bankalar Birliği, Türkiye İstatistik Kurumu ve Türkiye Cumhuriyet Merkez Bankası bilgilerine dayanarak oluşturulmuştur. Çeşitli YSA optimizasyon algoritmalarının, bağımlı değişken olarak alınan banka özkaynak getirisini tahmin etme başarıları karşılaştırılmıştır. Yapılan sayısal deneyler sonucunda, kullanılan tüm YSA yöntemlerinin %80'in üzerinde doğruluk payı ile özkaynak karlılığını tahmin ettikleri görülmüştür. Ayrıca, en iyi YSA yönteminin her banka için farklı olduğu gözlemlenmiştir. Lineer regresyon yöntemi ile karşılaştırma, YSA yöntemlerinin daha başarılı olduklarını göstermiştir. It is always important to measure the performance and profitability of the banking sector, which is the most important part of a country’s financial system. Thanks to performance measurement, banks can evaluate the competitive situation, growth potential and risk, and they can be more successful to continue their activities. In the literature, artificial neural networks (ANN) have rarely been used for evaluating economic performance. Therefore, in the present thesis, it is aimed to examine the use of ANN in depth to estimate the performance of banks. The aim is to estimate returns on bank equity by using ANN calculation methods for given a set of financial parameters. The thesis was carried out by considering all deposit banks in Turkey. Quarterly data for 11 years of 6 external and 8 internal parameters, which are considered as independent variables, were used. The dataset was created based on information of Banking Regulation and Supervision Agency, the Banks Association of Turkey, Turkey Statistical Institute and the Central Bank of the Republic of Turkey. The success of various ANN optimization algorithms in predicting the bank return on equity, which is regarded as the dependent variable, has been compared. As a result of the numerical experiments conducted, it was seen that all the ANN methods predicted the return on equity with an accuracy of over 80%. Also, it has been observed that the best ANN method is different for each bank. Comparison with linear regression method showed that ANN methods are more successful.