Kebutuhan non-fungsional (NFRs) memiliki peranan yang sangat penting untuk merancang sebuah sistem. Tetapi, mengidentifikasi NFRs masih menjadi tantangan nyata. NFRs dapat digunakan untuk memastikan apakah sistem sesuai dengan kebutuhan pengguna. Oleh karena itu, dibutuhkan suatu sistem untuk dapat mengidentifikasi NFRs. Penelitian sebelumnya menggunakan dataset dengan jumlah NFRs lebih banyak dibanding kebutuhan fungsional (FRs) memperoleh nilai tinggi. Akan tetapi, faktanya adalah NFRs lebih sedikit dari pada FRs. Penelitian selanjutnya menggunakan dataset dengan jumlah NFRs lebih sedikit dibandingkan (FRs) memperoleh nilai rendah terutama precision dan recall. Berdasarkan permasalahan pada penelitian sebelumnya, perlu dilakukan optimalisasi dengan cara menambahkan semantik pada metode FSKNN. Sistem yang digunakan untuk mengidentifikasi NFRs terdiri dari dua tahap. Pertama, sistem akan menghasilkan data latih secara otomatis tanpa pengukuran semantik. Setelah itu, data latih tersebut ditambahkan pengukuran semantik dan menghasilkan data latih baru. Kedua, proses klasifikasi menggunakan FSKNN. Pengujian dilakukan berdasarkan nilai ketetanggaan tertinggi. Hasil dari pengujian menggunakan dataset dengan penambahan pengukuran semantik memperoleh nilai accuracy, precision, dan recall lebih baik yaitu sebesar 98,04%, 25,05%, dan 21,35. Data latih baru dengan penambahan semantik memperoleh hasil lebih tinggi dari data latih tanpa penambahan semantik. Nilai precision rendah karena dataset yang digunakan tidak seimbang.
Abstract
Non-functional requirements (NFRs) are very important to design a system. However, identifying NFRs remains a real challenge. NFRs can be used to determine whether the system meets user requirements. Therefore, we need a system to be able to identify NFRs. Previous studies using a dataset with a higher number of NFRs than functional requirements (FRs) obtained high scores. However, the fact is that there are fewer NFRs than FRs. Subsequent studies using datasets with fewer NFRs than FRs obtain low values, especially precision, and recall. Based on the problems in previous studies, it is necessary to optimize by adding semantics to the FSKNN method. The system used to identify NFRs consists of two stages. First, the system will generate training data automatically without semantic measurements. After that, the training data is added with semantic measurements and generates new training data. Second, the classification process uses FSKNN. Testing is done based on the highest neighbor value. The results of testing using a dataset with the addition of semantic measurements obtained better accuracy, precision, and recall values of 98,04%, 25,05%, and 21,35. New training data with semantic additions obtains higher results than training data without semantic additions. The precision value is low because the dataset used is unbalanced.