The paper presents a review of study on detection and classification of defects using semantic image segmentation based on convolutional neural networks. Taking into account the revealed general features of flaw detection tasks of various industries related to the lack of a large marked data set and the need to detect defects of small sizes. The convolutional neural network of the u-net architecture was chosen as the basis for the decision support system. Testing of this architecture on several datasets yielded positive results regardless of the area of use.
В настоящее время одной из актуальных задач автоматизации документооборота организации в условиях поступления разнообразной документации от большого количества контрагентов является проверка и классификация сканированных материалов. В статье представлен анализ и основные характеристики существующих способов решения данной задачи. Целью исследования является разработка программного модуля, позволяющего классифицировать документы с точностью не менее 97 % в режиме реального времени, что актуально для электронного документооборота в крупных и средних компаниях. Приведено описание решения поставленной задачи на основе сверточной нейросети (CNN -Convolutional Neural Network). Входными данными для программного модуля является pdf-файл сканированного документа, выходными данными является xml-файл с классом документа. Для повышения точности и скорости работы программы были решены задачи по кодированию сигнала для нейронной сети и определению ее структуры. Приведено описание этапов обработки сканированных документов и архитектуры разработанной нейросети. Предложенный метод классификации позволяет классифицировать страницы с высокой точностью на небольшом датасете. Проведено тестирование программы на датасете из 9628 страниц и 22 возможных классов. Точность составила 99,1 %. Время классификации одной страницы без учета чтения файла и копирования в GPU составляет 2 мс на GeForce 780TI. Полное время классификации страницы составляет примерно 22,3 мс.Ключевые слова: автоматизация документооборота, интеллектуальный документооборот, классификация документов, сверточная нейросеть, распознавание изображений
The paper represents a description of the object recognition technology on a road using moving stereo pair of cameras in real time. The developed algorithm is characterized by high processing speed and performs reliable detection of arbitrary shape obstacles. Calculation time for one iteration from receiving input images (size 1280 * 480) to detecting obstacles is less than 2 msec for a Geforce GTX 1080T video card.
The paper presents a description of the gypsum dough spill analysis method on the basis of computer vision for automated control of gypsum feed and conveyor belt speed. The task of computer vision is to control the form of gypsum dough spill on the basis of optical analysis of video data in real time.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.