2021
DOI: 10.31590/ejosat.774144
|View full text |Cite
|
Sign up to set email alerts
|

TF-IDF ve Doc2Vec Tabanlı Türkçe Metin Sınıflandırma Sisteminin Başarım Değerinin Ardışık Kelime Grubu Tespiti ile Arttırılması

Abstract: Öz TF-IDF terim ağırlıklandırma ölçümü kelimelerin metinler içinde geçme sıklığı bilgisine dayalıdır. Bu ölçüm kelimeler arasındaki anlamsal ilişkiyi barındırmamaktadır. Yapay sinir ağlarına dayalı olan Doc2Vec metodu kelimeler ve kelimeleri içeren dokümanlar arasındaki anlamsal ilişkiyi barındırmakta ve yönetilebilir boyutlu doküman vektörlerinin elde edilmesini sağlamaktadır. Ardışık kelime grubu tespitinin metin madenciliği üzerindeki olumlu etkileri literatürde sunulan pek çok çalışma tarafından belirtilmi… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2021
2021
2022
2022

Publication Types

Select...
3

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(1 citation statement)
references
References 10 publications
0
0
0
1
Order By: Relevance
“…Doc2Vec, sabit olmayan uzunluktaki bir dokümanı bir vektöre dönüştürür ve bu dokümanın her kelimesini birleştirir (Tahvili vd., 2020). (Kınık ve Güran, 2021). PV-DM'de model, küçük bir pencerede bağlam kelimelerini ve paragraf vektörünü kullanarak merkez kelimeyi tahmin etmek üzere eğitilir.…”
Section: Doc2vec Mimarisiunclassified
“…Doc2Vec, sabit olmayan uzunluktaki bir dokümanı bir vektöre dönüştürür ve bu dokümanın her kelimesini birleştirir (Tahvili vd., 2020). (Kınık ve Güran, 2021). PV-DM'de model, küçük bir pencerede bağlam kelimelerini ve paragraf vektörünü kullanarak merkez kelimeyi tahmin etmek üzere eğitilir.…”
Section: Doc2vec Mimarisiunclassified