Derin ağ tabanlı özniteliklerle gazların sınıflandırılması ve konsantrasyon değerlerinin regresyon analizi
Özet
Elektronik burun (e-burun), kimyasal sensör dizilimi ile biyolojik malzemelerden yayılan
uçucu bileşikler üzerinde hassas ölçümler yaparak çeşitli özellikleri belirleyen, tanımlayan
ve sınıflandıran elektronik algılama teknolojisine dayalı bir cihazdır. İnsan koku alma
mekanizmasını taklit ederek çalışan bu sistemler, son yıllarda farklı alanlarda yaygın olarak
kullanılmaktadır. E-burundaki önemli konulardan biri de farklı gazların farklı konsantrasyon
değerlerinin tahmin edilmesidir. Gaz konsantrasyonlarının doğru bir şekilde tahmin
edilmesi, hastalık tespiti gibi hassas konularda da çok önemli bir rol oynamaktadır. Bu
çalışma, derin öğrenme (Deep Learning, DL) ağlarını kullanarak 4 adet metal oksit gaz
sensörü tarafından tespit edilen etanol, metan, etilen ve karbon monoksit gazlarının
konsantrasyon seviyelerinin ve değerlerinin sınıflandırma ve regresyon başarılarının
artırılması amacıyla yapılmıştır. Gazların konsantrasyon seviyelerine göre sınıflandırma
başarılarının karşılaştırılmasında ve belirli bir aralıktaki konsantrasyon değerlerinin tahmin
başarılarının karşılaştırılmasında farklı yöntemler kullanılmıştır. Bu işlemlerin
gerçekleştirilmesi için gaz verilerine ön işleme ve farklı öznitelik çıkarımı adımları
uygulanmıştır. Bu çalışmanın odak noktası, öznitelik çıkarımı yapılmasında yeni yöntemler
geliştirerek sınıflandırma ve regresyondan elde edilen başarının artırılmasıdır. Bu amaçla,
iki yeni metodoloji önerilmiştir. Geliştirilen yöntemlerden birinde, derin öğrenme ağlarından
biri olan Uzun Kısa-Süreli Bellek (Long Short-Term Memory, LSTM) ağlarının tam
bağlantılı katmanından öznitelik çıkarımı yapılmış, çıkarılan öznitelikler sınıflandırma ve
regresyonda kullanılmıştır. Önerilen diğer metodolojide ise LSTM ağının tam bağlantılı
katmanından elde edilen veriler Zamansal Evrişimli Ağ (Temporal Convolutional Network,
TCN) modeline giriş olarak uygulanmıştır ve bu TCN’nin tam bağlantılı katmanından elde
edilen özniteliklerde sınıflandırma ve regresyon çalışmalarında kullanılmıştır (LSTMFCLTCNFCL).
Önerilen her iki yöntemin sonuçları geleneksel yöntemlere göre
karşılaştırıldığında hem sınıflandırma hem de tahmin sonuçlarında iyileşme olduğu, başarının arttığı ve ortalama karesel hataların da önemli ölçüde azaldığı görülmektedir.
Ayrıca, ön işleme aşamasında sinyal düzeltme uygulandığı zaman sonuçlarda dikkate değer
bir şekilde artış olduğu da görülmektedir. Hem sinyal düzeltmenin uygulanması hem de
geliştirilen yöntemlerle sonuçlarda iki taraflı bir iyileşme olması sağlanmıştır.
Sınıflandırmada Destek Vektör Makinesi (Support Vector Machines, SVM) algoritması
94,7% ile en yüksek doğruluk oranını verirken, regresyonda ise en düşük ortalama karesel
hatalar Gauss Süreci Regresyonu (Gaussian Process Regression, GPR) ile elde edilmiştir.
Electronic nose (e-nose) is a device based on electronic sensing technology that determines,
identifies and classifies various properties by making precise measurements on volatile
components emitted from biological materials with a chemical sensor array. These systems,
which work by imitating the human olfactory mechanism, have been widely used in different
fields in recent years. One of the important issues in e-nose is the estimation of different
concentration values of different gases. Accurate estimation of gas concentrations plays a
crucial role in sensitive issues such as disease detection. This study was carried out to
increase the classification and regression success of the concentration levels and values of
ethanol, methane, ethylene and carbon monoxide gases detected by 4 metal oxide gas sensors
using deep learning networks. Different methods was used to compare the classification
successes of gases according to their concentration levels and to compare the estimation
successes of concentration values in a certain range. In order to perform these operations,
preprocessing and different feature extraction steps were applied to the gas data. The focus
of this study is to increase the success of the classification and regression by developing new
methods for feature extraction. For this purpose, two new methodologies have been
proposed. In one of the developed methods, feature extraction was made from the fully
connected layer of Long Short-Term Memory (LSTM) networks, which is one of the deep
learning networks, and the extracted features were used in the classification and regression.
In the other proposed methodology, the data obtained from the fully connected layer of the
LSTM network was applied as an input to the Temporal Convolutional Network (TCN), and
the features obtained from the fully connected layer of this TCN were used in classification
and regression studies (LSTMFCL-TCNFCL). When the results of both proposed methods
are compared with the traditional methods, it is seen that there is an improvement in both
classification and estimation results, the success is increased and the mean squared errors
are significantly reduced. In addition, it is seen that there is a remarkable increase in the results when signal correction is applied in the preprocessing stage. Both the application of
signal correction and the developed methods have provided a bilateral improvement in the
results. While the Support Vector Machine algorithm gave the highest accuracy rate with
94,7% in the classification, the lowest mean square errors in regression were obtained with
the Gaussian Process Regression.