Аннотация. Статья раскрывает содержание понятий «субъективность», «объективность» и «тональная релевантность» и сферу их применения в системах извлечения мнений. Автор прослеживает становление термина тональная релевантность и полисемическое использование этого термина в рамках данной научной проблемы. Автором проанализирован корпус рецензий на фильмы, в котором предложения размечены как релевантные или нерелевантные, и корпус новостных статей с размеченными отношениями между сущностями. Кроме того, был проведён эксперимент по автоматическому извлечению релевантных пар сущностей и полярности их оценки. Проведённый анализ показал целесообразность произошедшего перехода к тональной релевантности от дихотомии субъективность vs. объективность.
АннотАция Цель. Проверка гипотезы о возможности применения результатов анализа тональности при экспертизе текста. Процедура и методы. Во время исследования был собран корпус песенных текстов конкурса «Евровидение», из которых были автоматически извлечены тональные лексические единицы и посчитана общая тональность композиции. Показатели тональности были оценены при помощи базовых критериев статистики. Собранные результаты были проанализированы с точки зрения их информативности для лингвистической экспертизы. Результаты. На основе анализа извлечённых лексем и анализа текстов композиций удалось показать преимущества выделения тональных единиц перед проведением лингвистической экспертизы текста. Теоретическая и / или практическая значимость. В статье сформулированы предложения по работе со сложностями, которые возникают при проведении анализа тональности песенных текстов. Ключевые словА анализ тональности, лингвистическая экспертиза, извлечение мнений, песенный дискурс, субъективность, песня струКтурА Введение Тональность как языковая категория Эксперимент Тональные единицы в лингвистической экспертизе Заключение
Целью исследования выступает выявление закономерностей для автоматического поиска мнения автора в статьях, относящихся к жанру информационной журналистики, который накладывает ограничение на выражение оценочных суждений. Автором соб ран корпус политических статей, для лексем из этой коллекции рассчитана мера из сферы информационного поиска: обратная частота документа. Эмпирически показана применимость этого критерия для поиска сниженной лексики, которая является индикатором наличия мнения автора. В заключение сформулированы направления дальнейшего исследования этой проблемы и рассмотрен вопрос выявления мнения автора через обратную частоту документа в других текстах.
Sentiment analysis is a modern task in natural language processing and linguistics. Also referred to as opinion mining, it deals with different kinds of affective states: opinion, emotions, stance and evaluations. Sentiment itself is the polarity of these affective states. Taking analytical articles as source material for the study, several problems should be considered. Firstly, these texts broaden the understanding of the subject of opinion, because it does not coincide with the author of the text in the majority of cases. Secondly, subjects and objects of opinion are entities – words or word combinations with strictly denoted referent. In the paper only Named Entities, that are normally expressed by proper nouns, are considered. This kind of sentiment analysis requires deeper research of possible sentiment relations between entities and of lexical and grammatical influence on these relations. The paper is devoted to the study of the influence of the group of lexemes on opinion structure. The research shows that mutual sentiment can be presented as stable patterns.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.