Enstitüler / Institutes
Permanent URI for this communityhttps://hdl.handle.net/11727/1390
Browse
1 results
Search Results
Item Alerjen proteinlerin otomatik sınıflandırılması(Başkent Üniversitesi Fen Bilimleri Enstitüsü, 2008) Eren, Öykü; Oğul, HasanAlerjen proteinlerin tanınması ve sınıflandırılması, özellikle son yıllarda sıkça kullanılan genetik değisikliğe uğramıs gıdaların denetlenmesi ve biyo-ilaçların tasarımı açısından büyük önem kazanmıstır. Dünya Sağlık Örgütü ve Gıda ve Tarım Örgütü kurumları bu amaçla alerjen proteinlerin tespiti için bazı rehberler hazırlamıstır. Ancak, bu rehberlerde önerilen yöntemler çoğunlukla yarı-otomatik gerçeklestirilen ve tahmin yeterliliği düsük olan yöntemlerdir. Son birkaç yılda bazı otomatik yöntemler önerilse de bunlar ya istenilen yeterlilik seviyesine ulasamamıs ya da islem zamanı ve bellek gereksinimi açısından avantajsız olmuslardır. Bu çalısmada, alerjen proteinlerin sadece dizilim verisi kullanılarak, farklı makine öğrenme yöntemleri bilinen bazı dizilim gösterim yaklasımları ile denenmistir. Farklı dizilim gösterim yöntemleri için K-En Yakın Komsu, Bulanık K-En Yakın Komsu ve Destek Vektör Makineleri (DVM) kullanılmıs ve sonuçlar karsılastırmalı olarak verilmistir. The prediction and classification of the allergen proteins have received great importance on the inspection of genetically modified food, which are used especially in the recent years, and the design of bio-pharmaceuticals. World Health Organization (WHO) and Food and Agriculture Organization (FAO) prepared guidelines for the prediction of allergen proteins. However, the methods proposed in these guidelines are mostly semi-automatic and have low prediction accuracy. Although some automated methods have been proposed in the last few years, either they could not reach the required sufficiency level or they were insufficient as for the processing time and memory usage. In this study, various machine learning methods were tried with some known sequence representation approaches by using only the sequence data of the allergen proteins. For various sequence representation approaches, K-Nearest Neighbour, Fuzzy K-Nearest Neighbour and Support Vector Machines (SVM) were used and the results were given with comparison.