Sayısal haritalama tekniklerinin performanslarının karşılaştırılması DNA dizilimlerinin ekson ve intron olarak sınıflandırılması Pencereleme fonksiyonlarının sınıflandırma performansına etkisi Makale Bilgileri ÖZET Geliş: 12.06.2015 Kabul: 04.08.2016 DOI: Bir DNA dizilimindeki bazların oluşturdukları kombinasyonlar, o DNA dizilimindeki bir gene karşılık gelir, bu genlerden de RNA kopya dizilimleri çıkarılır. Kopyalanan bu RNA'lar oluşurken genin baz dizilimi baştan sona tümüyle okunmaz. Genlerin okunmayan ve kodlanmayan bölümüne intron, kodlanan kısımlarına ise ekson denir. Bir DNA dizilimindeki protein nerede, ne kadar kodlanır? Büyüme ve gelişme nerede düzenlenir? Kök hücreler nerede başka hücreye dönüştürülür? Tüm bu soruların cevabı ve kanser gibi genetik hastalıkların araştırılması DNA dizilimlerinin ekson ve intron olarak sınıflandırmasıyla mümkündür. Çalışmanın amacı, DNA diziliminin ekson ve intron olarak sınıflandırılmasında farklı sayısal haritalama tekniklerinin performanslarını karşılaştırmaktır. Bu amaç doğrultusunda insan türünün MEFV genine ait DNA dizilimleri, 9 farklı haritalama tekniği ile sayısal dizilere dönüştürülmüştür. Dönüştürülen sayısal dizilerin sınıflandırılmasında Ayrık Fourier Dönüşümü yöntemi kullanılmıştır. Bu yöntemde 4 farklı pencereleme fonksiyonu kullanılmış, sınıflandırma başarımları karşılaştırılmıştır. Ayrıca Fourier tabanlı yöntemle elde edilen sonuçlar, Destek Vektör Makineleri ve K-en yakın komşu algoritması gibi makine öğrenme tabanlı yöntemlerle karşılaştırılmıştır. İnteger haritalama tekniği Ayrık Fourier Dönüşümü yönteminde %96,2 ile diğer makine öğrenme yöntemlerine göre en yüksek sınıflandırma başarımı sağlamıştır. Hamming pencereleme fonksiyonunda sınıflandırma başarısı diğer pencereleme fonksiyonlarından daha yüksek çıkmıştır.