К вопросу об определении границ именных групп при решении задач автоматического извлечения информации из текстов на русском языке Аннотация. Рассматривается задача выделения сложных именных групп в русскоязычных публицистических текстах в приложении к задачам автоматического извлечения информации. Под сложными именными группами понимаются длинные именные группы, содержащие генитивные, предложные конструкции, а также имена собственные. Предлагается схема поиска границ именных групп, начиная с фрагмента текста, заведомо содержащего именную группу. Разработан алгоритм выделения таких фрагментов. Произведена их классификация на основании частоты встречаемости типов фрагментов, количества слов фрагмента, их частеречного состава, наличия уже выделенных именованных сущностей разных видов, информации о вхождении частей фрагментов в списки сложных предлогов и устойчивых сочетаний. Приводится первоначальная система признаков для построения алгоритма автоматического выделения именных групп в границах построенных на первом этапе анализа фрагментов. В экспериментальной части исследования произведено выделение фрагментов (58032 фрагмента) из коллекции текстов общественно-политической тематики (1000 документов), произведен анализ сложных случаев. Ключевые слова и фразы: автоматическое извлечение информации, выделение именованных сущностей, извлечение ситуаций, выделение именных групп, синтаксический анализ. Введение Задача автоматического извлечения информации заключается в отображении некоторых фрагментов текста на естественном языке в определенную структуру (модель), состоящую из объектов и связей между ними. В качестве примеров можно привести задачи извлечения именованных сущностей, терминов, ключевых слов, фактов, автоматическое составление пресс-портретов, авторефератов и др. Любая задача по извлечению информации предполагает: Работа выполнена при финансовой поддержке РФФИ, проект 15-07-05277_а.
We consider the Lie group PSL 2 (R) (the group of orientation preserving isometries of the hyperbolic plane) and a left-invariant Riemannian metric on this group with two equal eigenvalues that correspond to space-like eigenvectors (with respect to the Killing form). For such metrics we find a parametrization of geodesics, the conjugate time, the cut time and the cut locus. The injectivity radius is computed. We show that the cut time and the cut locus in such Riemannian problem converge to the cut time and the cut locus in the corresponding sub-Riemannian problem as the third eigenvalue of the metric tends to infinity. Similar results are also obtained for SL 2 (R).
We give an example of a Riemannian manifold homeomorphic to a sphere such that its diameter cannot be realized as a distance between antipodal points. We consider a Berger sphere, i.e., a three-dimensional sphere with Riemannian metric that is compressed along the fibers of the Hopf fibration. We give a condition for a Berger sphere to have the desired property. We use our previous results on a cut locus of Berger spheres obtained by the method from geometric control theory.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.