Introduction. Patients with diabetes are exposed to various cardiovascular risk factors, which lead to an increased risk of cardiac complications. Therefore, the development of a diagnostic system for diabetes and cardiovascular disease (CVD) is a relevant research task. In addition, the identification of the most significant indicators of both diseases may help physicians improve treatment, speed the diagnosis, and decrease its computational costs.Aim. To classify subjects with different diabetes types, predict the risk of cardiovascular diseases in diabetic patients using machine learning methods by finding the correlational indicators.Materials and methods. The NHANES database was used following preprocessing and balancing its data. Machine learning methods were used to classify diabetes based on physical examination data and laboratory data. Feature selection methods were used to derive the most significant indicators for predicting CVD risk in diabetic patients. Performance optimization of the developed classification and prediction models was carried out based on different evaluation metrics.Results. The developed model (Random Forest) achieved the accuracy of 93.1 % (based on laboratory data) and 88 % (based on pysicical examination plus laboratory data). The top five most common predictors in diabetes and prediabetes were found to be glycohemoglobin, basophil count, triglyceride level, waist size, and body mass index (BMI). These results seem logical, since glycohemoglobin is commonly used to check the amount of glucose (sugar) bound to the hemoglobin in the red blood cells. For CVD patients, the most common predictors inlcude eosinophil count (indicative of blood diseases), gamma-glutamyl transferase (GGT), glycohemoglobin, overall oral health, and hand stiffness.Conclusion. Balancing the dataset and deleting NaN values improved the performance of the developed models. The RFC and XGBoost models achieved higher accuracy using gradient descending order to minimize the loss function. The final prediction is made using a weighted majority vote of all the decisions. The result was an automated system for predicting CVD risk in diabetic patients.
АннотацияВведение. Аритмия, или нерегулярное сердцебиение, возникает, когда электрическая система сердца дезорганизована или не синхронизирована, и может вызвать инсульты, внезапную сердечную смерть и другие осложнения. Автоматизированная классификация аритмий с использованием глубокого обучения сэкономила бы время и энергию при внедрении в систему поддержки принятия решений в больницах. Цель работы. Изучение эффективности улучшения классификации аритмий после использования двоичных изображений сегментированных сигналов электрокардиограммы (ЭКГ) с комбинациями ортогональных и поверхностных сигналов. Материалы и методы. В данной статье изучается классификация аритмий с использованием двоичных изображений поверхностных и ортогональных сигналов ЭКГ. Маркировка данных автоматизируется с использованием языка программирования Python, для всех сигналов реализуется предварительная обработка, а затем полученные сигналы наносятся на график и сегментируются в 2-секундных окнах. Эти сегменты сохраняются как изображения RGB, затем преобразуются в двоичные изображения, где сигнал белый, а фон черный. Предварительно обученная модель Alexnet используется для классификации девяти классов, где каждая поверхностная ЭКГ и ортогональное отведение классифицируются отдельно. Результаты. Производительность модели оценивается по средней точности, прецизионности, F1-score и матрице путаницы всех лидов. Результаты параллельной классификации ЭКГ в 12 отведениях лучше, чем для ортогональных отведений, и все отведения с точностью, прецизионностью и F1-score равны 0.84, 0.78 и 0.71 соответственно. Заключение. Производительность модели оценивалась для трех случаев: 12 поверхностных отведений ЭКГ, ортогональных отведений и всех отведений. Вычисленные средние значения показателей (точность, прецизионность и оценка F1) для каждого случая показывают, что использования 12 поверхностных отведений ЭКГ достаточно для классификации девяти различных типов аритмии с использованием двоичных изображений сегментов ЭКГ.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.