АннотацияСтатья посвящена проблеме выделения единиц знаний из множеств (корпусов) темати-ческих текстов. Данная проблема актуальна для построения систем обработки, анализа, оценивания и понимания информации, в частности, изображений. Конечной практической целью здесь является поиск наиболее рационального варианта передачи смысла средствами заданного естественного языка (ЕЯ) для последующей фиксации фрагментов знаний в те-заурусе и онтологии предметной области (ПО). В настоящей статье разбиением слов исход-ной фразы на классы по значению меры TF-IDF относительно текстов корпуса решается за-дача поиска в корпусе фраз, максимально близких исходной по описываемому фрагменту фактического знания и формам его выражения в языке.Ключевые слова: распознавание образов, интеллектуальный анализ данных, теория ин-формации, тест открытой формы, языковое представление экспертных знаний.Цитирование: Михайлов, Д.В. Выделение знаний и языковых форм их выражения на множестве тематических текстов: подход на основе меры TF-IDF / Д.В. Михайлов, А.П. Козлов, Г.М. Емельянов // Компьютерная оптика. -2015. Т. 39, № 3. -С. 429-438. ВведениеРазработка эффективных способов и средств опи-сания решаемых задач -одно из ведущих направле-ний распознавания образов и интеллектуального ана-лиза данных. Сказанное немаловажно в сфере обра-ботки, анализа и понимания изображений [1]. Для многих приложений, в частности, учебных курсов с использованием открытых тестов, естественным ис-точником знаний здесь будут публикации отечест-венных и зарубежных научных школ в виде моногра-фий, обзорных статей, сборников трудов конферен-ций и т.п. Наиболее актуальными при этом задачами являются тематическая рубрикация текстовых доку-ментов [2], а также представление предметных облас-тей в виде тезаурусов и онтологий [3]. Основная про-блема -поиск наиболее рационального варианта пе-редачи смысла в единице знаний, определяемой семантически эквивалентными (СЭ) фразами пред-метно-ограниченного ЕЯ. Сам же смысл должен быть отражён в максимально компактном объёме тексто-вых данных. Решение данной проблемы выделением необходимого и достаточного набора минимальных семантико-синтаксических текстовых единиц и свя-зей между ними на множестве СЭ-фраз обсуждалось авторами в [4]. При этом в круг задач эксперта, тре-бующих автоматизации, входит: − поиск СЭ-форм описания отдельного фрагмента знания (факта ПО) в заданном ЕЯ; − сопоставление знаний эксперта с наиболее близ-кими фрагментами знаний других экспертов. Следует отметить, что решение указанных задач не сводится к простому выделению из текста понятий и отношений между ними с подсчётом семантической близости пар и групп понятий [12]. Поиск и класси-фикация языковых форм представления знаний здесь предполагает выявление в текстовом корпусе контек-стов использования универсальной (общей) лексики, за счёт которой обеспечивается переход от исходной фразы к фразам, наиболее близким ей по смыслу (ге-нерация синонимичных перифраз [5]). Близкую зада-чу, но принципиально обратного характера решает обучаемый детектор перифраз, предложен...
Повышение диагностической эффективности легочных заболеваний в настоящее время является весьма актуальной задачей. Для построения автоматизированных систем распознавания и классификации рентгенологических изображений необходимо выполнить процесс локализации патологических образований на флюорограммах грудной клетки. Правильный выбор способа сегментации исследуемых сегментов рентгенологических изображений обеспечивает качество сегментации и способствует повышению точности принимаемых диагностических решений. В статье приведена структурная схема устройства, реализующая способ автоматической сегментации флюорограмм грудной клетки. Для построения алгоритмов обнаружения патологических образований применяется построение гистограммы яркости изображения в выделенном окне. Определяются графические примитивы, аппроксимирующие гистограмму яркости флюорограммы в окне анализа оптимального размера. На основе полученной информации формируется вектор информативных признаков. Решение о принадлежности вектора информативных признаков к одному из выделяемых классов осуществляют посредством обучаемого двухальтернативного классификатора. По мере продвижения окна анализа по изображению осуществляется окончательное формирование бинарного изображения.
Метод выделения быстродвижущихся объектов при использовании цифрового оптического локатора… Ваниев А.А., Емельянов Г.М.Компьютерная оптика, 2013, том 37, №4 477 МЕТОД ВЫДЕЛЕНИЯ БЫСТРОДВИЖУЩИХСЯ ОБЪЕКТОВ ПРИ ИСПОЛЬЗОВАНИИ ЦИФРОВОГО ОПТИЧЕСКОГО ЛОКАТОРА СЛЕДЯЩЕГО ТИПА Ваниев А.А., Емельянов Г.М. Новгородский государственный университет имени Ярослава МудрогоАннотация В статье рассматриваются особенности задачи выделения быстродвижущихся объектов по изображениям, получаемым с подвижного фотоприёмного устройства. Предлагается ал-горитм, основанный на вычислении межкадровой разности. Одновременно предложенный алгоритм устраняет недостаток известного метода, заключающийся в появлении инверсных изображений объекта.Ключевые слова: цифровой оптический локатор, выделение объектов, траекторные измерения.Введение Переход от фотоплёночной технологии регистра-ции изображения в оптических средствах измерения угловых координат к цифровой, благодаря примене-нию ПЗС-матриц, привёл к пересмотру технологии обработки измерительной информации. Появилась возможность обнаруживать и оценивать движение в реальном или близком к нему времени.Отличительная особенность цифровых оптиче-ских локаторов следящего типа (ЦОЛС) состоит в том, что лоцируемый объект обнаруживается в не-большом поле обзора пространства [1]. Пространст-венные углы поля обзора обычно не превышают не-скольких угловых градусов. В случае использования фотоприёмных устройств (ФПУ) высокого разреше-ния эта особенность позволяет определять координа-ты цели с высокой точностью. Однако эта же особен-ность приводит к необходимости решения задачи ав-томатического сопровождения движущихся объектов без привлечения информации из дополнительных ис-точников, таких как РЛС.Эту задачу можно разбить на ряд подзадач: • выделение движущихся объектов на изображении, полученном с подвижного ФПУ; • идентификация интересующего объекта (цели), который необходимо сопровождать; • выработка управляющих воздействий для опорно-поворотного устройства (ОПУ). В рамках данной работы рассматривается подза-дача 1 для случая быстродвижущихся объектов. Под быстродвижущимися объектами будем понимать объекты, угловое перемещение которых за время од-ного кадра превышает угловые размеры самого объ-екта при наблюдении с измерительного пункта.Рассмотрим последовательность видеокадров, по-ступающих с ФПУ с частотой 25 -100 Гц.В этой последовательности кадров появляются движущиеся объекты, количество которых изна-чально неизвестно. В одном и том же кадре в поле зрения могут присутствовать несколько объектов одновременно. Объекты могут отличаться ярко-стью, размером, формой и скоростью движения. В этих условиях необходимо выделить движущиеся объекты и получить информацию, достаточную для их идентификации и определения параметров движения. Описание измерительного комплексаУпрощённая структура измерительной станции следящего типа представлена на рис. 1. Рис. 1. Структура измерительной станции следящего типа: ФПУ -фотоприёмное устройство; ДУП -датчики углового положения; ОПУ -опорно-поворотное устройство; УВ -управляющ...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.