У роботі представлено порівняльне оцінювання ефективності систем автоматизованої комп'ютерної діагностики, розроблених на основі двох класифікаторів — каскаду дескрипторів Хаара та AdaBoost, під час лапароскопічної діагностики апендициту та метастазів печінки.
Для навчання використовували зображення, а також гама-кореговані та конвертовані у HSV шкалу кольори RGB зображення, отримані під час лапароскопічної діагностики. Дескриптори, що використовували для навчання класифікатора AdaBoost отримували за допомогою методу локального бінарного патерну, який включав інформаційні показники кольору, а також показники текстури. Після завершення навчання проводили тест оцінювання ефективності діагностики при якому використовували зображення, що не застосовували для навчання.
Найбільш високим показник повноти (recall) був при тестовій діагностиці апендициту за допомогою навчання класифікатора AdaBoost дескрипторами модифікованого кольору локального бінарного патерну, отриманими з RGB зображень, — 0,745, а під час діагностики метастазів печінки — 0,902. Також коректність діагностики (accuracy) склала 74,4 % під час діагностики апендициту та 89,3 % при діагностиці метастазів печінки. Коректність діагностики із застосуванням класифікатора Хаара була найбільш високою за умови діагностики метастазів печінки та склала 0,672 при використанні RGB зображень, 0,723 — при навчанні HSV зображеннями.
Діагностика із застосуванням класифікатора Хаара є менш ефективною порівняно з діагностикою, що здійснювалась із застосуванням класифікатора AdaBoost, навчання якого здійснювали із застосуванням дескрипторів модифікованого кольору локального бінарного патерну.
ABSTRACT:Human activity is a persistent subject of interest in the last decade. On the one hand, video sequences provide a huge volume of motion information in order to recognize the human active actions. On the other hand, the spatial information about static human poses is valuable for human action recognition. Poselets were introduced as latent variables representing a configuration for mutual locations of body parts and allowing different views of description. In current research, some modifications of Speeded-Up Robust Features (SURF) invariant to affine geometrical transforms and illumination changes were tested. First, a grid of rectangles is imposed on object of interest in a still image. Second, sparse descriptor based on Gauge-SURF (G-SURF) invariant to color/lighting changes is constructed for each rectangle separately. A common Spatial POselet Descriptor (SPOD) aggregates the SPODs of rectangles with following random forest classification in order to receive fast classification results. The proposed approach was tested on samples from PASCAL Visual Object Classes (VOC) Dataset and Challenge 2010 providing accuracy 61-68% for all possible 3D poses locations and 82-86% for front poses locations regarding to nine action categories.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.