Pengelompokkan peneliti seringkali menggunakan informasi tekstual yang terdapat pada artikel ilmiah peneliti, contohnya judul, abstrak, dan kata kunci sehingga menghasilkan kelompok peneliti dengan kemiripan informasi tekstual pada artikel ilmiah mereka. Pengelompokkan peneliti juga seringkali menggunakan jumlah publikasi dan sitasi sehingga menghasilkan kelompok peneliti yang memiliki jumlah publikasi dan sitasi yang cenderung sama. Berdasarkaan kedua metode di atas, penelitian ini mencoba untuk menganalisis penggunaan topik artikel ilmiah pada proses ekstraksi fitur produktivitas. Fitur ini merupakan fitur yang didapatkan melalui penghitungan kinerja peneliti berdasarkan jumlah publikasi dan sitasi. Hasil ekstraksi fitur akan digunakan untuk klasterisasi peneliti menggunakan metode K-Means++. Sebelum data peneliti diklasterisasi, terlebih dahulu data peneliti dianalisis untuk menghilangkan kemungkinan adanya outlier. Evaluasi hasil klaster dilakukan dengan mempertimbangkan nilai Sum Squared Error dan Silhouette. Hasilnya, klaster optimal didapatkan dengan nilai K sama dengan 8 dan nilai silhouette sama dengan 0.15396. Kemudian, hasil klaster dianalisis untuk dapat memberikan label terhadap masing-masing klaster dengan mempertimbangkan topik artikel ilmiah, jumlah publikasi dan jumlah sitasi.