Tindak pidana korupsi merupakan kegiatan yang dapat mengakibatkan kerugian keuangan negara atau perekonomian negara serta dapat menghambat pembangunan nasional. Semenjak penindakan kasus korupsi 2013-2020, pada tahun 2014 merupakan angka tertinggi dalam jumlah kasus, yaitu sebanyak 629 kasus, sedangkan pada tahun 2020 negara mengalami kerugian tertinggi sebesar Rp. 18,6 Triliun. Adanya permasalahan tersebut perlu dilakukan kebijakan yang tepat serta antisipasi dalam meminimalisir kerugian negara pada tahun selanjutnya. Oleh karena itu penelitian ini melakukan prediksi kerugian negara berdasarkan tindak pidana korupsi dengan menggunakan regresi linear berganda. Regresi linear berganda merupakan salah satu metode statistik yang digunakan untuk menelusuri pola hubungan antara variabel terikat dengan dua atau lebih variabel bebas. Pembelajaran regresi linear berganda dalam penelitian ini menghasilkan model regresi yang dimana menghasilkan nilai konstanta yaitu 284645.5891073216 serta nilai koefisien yaitu -139837.38007863 dan 363493.06049751. Kemudian penelitian ini melakukan pengukuran performa model regresi linear dengan kondisi pembagian data 80% untuk data training dan 20% untuk data testing. Dari kondisi pembagian data tersebut memperoleh nilai RMSE sebesar 8447373.485 untuk data training dan 9769609.026 untuk data testing. Sedangkan untuk nilai koefesien determinasi memperoleh nilai sebesar 0.579 untuk data training yang tingkat hubungan antar variabelnya cukup kuat dan 0.662 untuk data testing yang berarti tingkat hubungan antar variabelnya kuat. Dengan melakukan prediksi menggunakan metode regresi linear berganda dapat memberikan informasi yang membantu pemerintah dalam mengambil kebijakan yang tepat terahadap permasalahan kasus korupsi serta meminimalisir dan mengantisipasi kerugian negara yang lebih besar untuk tahun selanjutnya.
Classification is a technique that can be used for prediction, where the predicted value is a label. The classification of drug determination aims to predict the type of drug that is accurate for patients with the dataset that has been obtained. The data used in this study are data from the patient's medical records based on the symptoms of the disease but the type of medicine is not yet known. The data set used comes from kaggle.com which is then presented in the form of a decision tree with a mathematical model. To complete this research, a classification method is used in data mining, namely the decision tree. The decision tree method is used to find the relationship between a number of candidate variables, so that it becomes a classification target variable by dividing the data into 70% data testing and 30% training data. The results obtained from this study are in the form of rules and an accuracy rate of 96.36% as well as the recall and precision values of each type of drug using a multiclass configuration matrix.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.