Dünya genelinde sosyal medya kullanımının artması ile siber zorbalığın ve doğal olarak siber zorbalığa maruz kalan kişilerin sayısı da aynı oranda artmaktadır. Mağdurların daha fazla bu duruma maruz kalmaması, aynı zamanda yeni mağduriyetlerin de oluşmaması açısından siber zorbalığın tespiti önem arz etmektedir. Literatürde siber zorbalıkla ilgili birçok çalışma bulunmakta iken, Türkçe dilindeki cümleleri analiz ederek siber zorbalığı tespit eden çok fazla çalışmaya rastlanmamıştır. Bu çalışmanın mevcut çalışmalardan farkı, Türkçe hazırlanmış bir veri seti üzerinde hem önişlem yaparak siber zorbalığın tespitinin başarısını ölçmek hem de çok büyük dokümanlarla çalışıldığında öznitelik sayısını düşürerek başarıyı düşürmeyecek bir yöntem bulmaktır. Bu sebeple öznitelik seçici olarak henüz Türkçe Siber zorbalık veri setlerinde denenmemiş bir yöntem olan Balina Optimizasyon algoritması bu çalışmada kullanılmış olup veri setine önişlemler gerçekleştirilerek K-En Yakın Komşu (KNN), Çok Terimli Naïve Bayes (MNB) ve Rastgele Orman (RF) sınıflandırıcı algoritmaları ile siber zorbalığın tespitinin başarısı ölçülmüştür. Yapılan deneylere göre, her üç sınıflandırıcı ile ham veri setine sınıflandırma işlemi gerçekleştirilirken hem önişlem yapıldığında hem de Balina Optimizasyon Algoritması ile öznitelik seçimi yapıldığında öznitelik sayısı azalmış olup doğruluk değeri büyük oranda artmıştır. Özellikle kök alma işlemi hariç diğer tüm önişlemlerin gerçekleştiği veri setinde sınıflandırıcı olarak RF Algoritması ile öznitelik seçici olarak Balina Optimizasyon Algoritması birlikte kullanıldığında doğruluk oranı %85’ten %91’e yükselmiştir. Bu da gösteriyor ki, önişlem yapma ve Balina Optimizasyon Algoritması ile öznitelik seçimi nitelik sayısını da önemli ölçüde azaltarak siber zorbalık tespitindeki başarıyı arttırmaktadır.
Sentiment analysis (SA) is a necessary duty for various areas where this method is very important to know public opinion of users about brands, products, events, etc. In this way, customer satisfaction can be increased for companies by making the necessary changes on the product. In this study, we aim to implement a SA on the comments made by users on online sales sites. We propose and test four machine learning (ML) algorithms and a deep learning (DL) model. Feature selection methods enable algorithms to capture existing patterns more easily and reduce running times by finding features that contribute highly to classification within the dataset and reducing the search space. Therefore, we apply the binary version of Sailfish Optimization (SOA), also called Binary Sailfish Optimizer (BSO), as a feature selector to a textual dataset and run for SA for the first time. In order to evaluate its performance, we make a comparison with two optimization algorithms, named Harmony Search (HS) and Bat Algorithm (BA). The results show that the BSO is ahead of the HS and BA algorithms with an F-Score of 0.91, using almost half of the available features.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.