Bilgisayar ve internetin, günlük yaşamın vazgeçilmez bir unsuru haline gelmesi ile birlikte internet sitelerinin ve web tabanlı uygulamaların sayısı da hızla artmıştır. Bilgi, fikir, para gibi birçok önemli unsurun internet siteleri ve uygulamalar aracılığıyla paylaşımının yapılması ise bilgi güvenliği konusunu önemli ve güncel bir hale getirmiştir. Günümüze kadar güvenlik duvarı, virüs programları gibi yazılımlar bilgisayar ve sistem güvenliği için kullanılmış ancak yeterli olmamıştır. Bu nedenle mevcut yazılımlara alternatif olarak ortaya atılan saldırı tespit sistemleri ile anormal davranışlar tespit edilerek olası tehlikelerin çözümlenmesi amaçlanmıştır. Bu çalışmada ise saldırı tespit sistemleri için üretilen KDDCup99 veri seti üzerinde ki kare, bilgi kazancı, kazanım oranı, gini katsayısı, oneR, reliefF, genetik, ileriye doğru ve geriye doğru öznitelik seçim algoritmaları uygulanarak yeni veri setleri elde edilmiştir. Elde edilen yeni veri setlerini, orijinal boyuttaki veri seti ile karşılaştırmak için en yakın k komşu, destek vektör makineleri ve aşırı öğrenme makineleri kullanılarak farklı modeller geliştirilmiştir. Çalışmada, her üç yöntem için belirtilen öznitelik seçme yöntemleri kullanılarak test verileri için en yüksek başarıma sahip modeller başarı oranı, hassasiyet yanlış alarm oranı, fölçütü gibi çeşitli metrikler yardımıyla karşılaştırılmıştır. Yapılan analizlerin sonucunda öznitelik seçim yöntemlerinin her üç sınıflama yöntemi içinde başarı oranını artırdığı ve modellerin daha hızlı çalışmasını sağladığı görülmüştür. Ayrıca, yüksek başarı oranları, diğer sınıflama yöntemlerine oranla son derece hızlı olması, eğitim algoritmasının basit olması gibi nedenlerden dolayı aşırı öğrenme makinalarının çevrimiçi saldırı tespit sistemlerine rahatlıkla entegre edilebileceğini ve alternatif bir yöntem olarak kullanılabileceğini göstermiştir.
Sentiment analysis is the process of determining the attitude or the emotional state of a text automatically. Many algorithms are proposed for this task including ensemble methods, which have the potential to decrease error rates of the individual base learners considerably. In many machine learning tasks and especially in sentiment analysis, extracting informative features is as important as developing sophisticated classifiers. In this study, a stacked ensemble method is proposed for sentiment analysis, which systematically combines six feature extraction methods and three classifiers. The proposed method obtains cross-validation accuracies of 89.6%, 90.7% and 67.2% on large movie, Turkish movie and SemEval-2017 datasets, respectively, outperforming the other classifiers. The accuracy improvements are shown to be statistically significant at the 99% confidence level by performing a Z-test.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.