[Id]Sebuah dokumen berita seringkali terkait lebih dari satu kategori, untuk itu diperlukan pemanfaatan metode kategorisasi yang tidak hanya cepat tetapi juga dapat mengelompokkan sebuah berita kedalam banyak kategori. Banyak metode yang dapat digunakan untuk mengkategorisasi dokumen berita, salah satunya adalah ontologi. Pendekatan ontologi dalam kategorisasi sebuah dokumen berita didasarkan pada kemiripan fitur yang ada di dokumen dengan fitur yang ada di ontologi. Penggunaan ontologi dalam kategorisasi yang hanya didasarkan pada kemunculan term dalam menghitung relevansi dokumen menyebabkan banyak kemunculan fitur lain yang sebenarnya sangat terkait menjadi tidak terdeteksi. Dalam? paper ini diusulkan? metode baru untuk kategorisasi dokumen berita? yang terkait dengan banyak kategori, metode ini berbasis domain specific ontology yang perhitungan relevansi dokumen terhadap ontologinya tidak hanya didasarkan pada kemunculan term tetapi juga memperhitungkan relasi antar term yang terbentuk. Uji coba dilakukan pada dokumen berita berbahasa indonesia dengan 2 kategori yaitu olahraga dan teknologi. Hasil uji coba menunjukkan nilai rata-rata akurasi yang cukup tinggi yaitu kategori olahraga adalah 93,85% sedangkan pada kategori teknologi adalah 96,32%.Kata Kunci: Dokumen berita, kategorisasi, multi-label, ontologi,? domain-spesifik.[En]A news document often related? to more than one category,? necessary for utilization? the method of categorization that is not only fast but also able to Classify a news into many categories. Many methods can be used to categorize the news documents, one of which is an ontology. Ontology approach in the categorization of a document is based on the similarity of news features in documents with features that exist in the ontology. The use of ontologies in categorization that just based on the occurance of the term in calculating the relevance of the document, led to the emergence of many other fea-tures that are actually very relevant is undetectable. This paper proposed a new method for categorizing news documents are related with many categories, the method is based on a specific domain ontology and for document relevance calculation is not only based on the occurrence of the term but also take into account the relationships between terms that are formed. Tests performed on the Indonesian language news document with? two categories: sports and technology. The trial results show the value of the average accuracy is high, that the sports category was 93,85% and the technology category is 96,32%.Keywords : News document, ?categorization, multi-label, Ontology, domain-specific.
aBstraKSebuah dokumen berita seringkali terkait lebih dari satu kategori, untuk itu diperlukan pemanfaatan metode kategorisasi yang tidak hanya cepat tetapi juga dapat mengelompokkan sebuah berita kedalam banyak kategori. Banyak metode yang dapat digunakan untuk mengkategorisasi dokumen berita, salah satunya adalah ontologi. Pendekatan ontologi dalam kategorisasi sebuah dokumen berita didasarkan pada kemiripan fitur yang ada di dokumen dengan fitur yang ada di ontologi. Penggunaan ontologi dalam kategorisasi yang hanya didasarkan pada kemunculan term dalam menghitung relevansi dokumen menyebabkan banyak kemunculan fitur lain yang sebenarnya sangat terkait menjadi tidak terdeteksi. Dalam paper ini diusulkan metode baru untuk kategorisasi dokumen berita yang terkait dengan banyak kategori, metode ini berbasis domain spesifik ontologi yang perhitungan relevansi dokumen terhadap ontologinya tidak hanya didasarkan pada kemunculan term tetapi juga memperhitungkan relasi antar term yang terbentuk. Uji coba dilakukan pada dokumen berita berbahasa indonesia dengan 2 kategori yaitu olahraga dan teknologi. Hasil uji coba menunjukkan nilai rata-rata akurasi yang cukup tinggi yaitu kategori olahraga adalah 93,85% sedangkan pada kategori teknologi adalah 96,32%.Kata Kunci: Dokumen berita; Domain-spesifik; Kategorisasi; Multi-label; Ontologi.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.