This paper describes the KLUEless system which participated in the SemEval-2015 task on "Sentiment Analysis in Twitter". This year the updated system based on the developments for the same task in 2014 (Evert et al., 2014) and (Proisl et al., 2013 participated in all five subtasks. The paper gives an overview of the core features extended by different additional features and parameters required for individual subtasks. Experiments carried out after the evaluation period on the test dataset 2015 with the gold standard available are integrated into each subtask to explain the submitted feature selection.
This paper describes the SNAP system, which participated in Task 4 of SemEval-2014: Aspect Based Sentiment Analysis. We use an XML-based pipeline that combines several independent components to perform each subtask. Key resources used by the system are Bing Liu's sentiment lexicon, Stanford CoreNLP, RFTagger, several machine learning algorithms and WordNet. SNAP achieved satisfactory results in the evaluation, placing in the top half of the field for most subtasks.
У статті проаналізовано типологію вживання абревіатур на позначення медич- них і фармацевтичних понять у професійних терміносистемах. Метою нау- кової розвідки є визначення найуживаніших моделей таких термінологічних одиниць у відповідних галузях й опис специфіки їх можливих класифікацій на базі комплексного аналізу. З огляду на необхідність прицільного вивчення цієї частини професійного словника англійської мови для адекватного розшифро- вування змісту й функціонального потенціалу скорочень, у роботі запропоно- вано їх класифікацію за тематичним критерієм, за формальним вираженням і за значенням. Увагу акцентовано на дослідженні лексичних абревіативних одиниць, оскільки за результатами аналізу дібраного мовного матеріалу визна- чено, що вони є найбільш уживаними (порівняно з графічними). З’ясовано, що в медичній і фармацевтичній галузях (як у практичному засто- суванні в історіях хвороб, так і в теоретичній базі, відображеній у наукових розвідках і довідковій літературі) абревіації підлягають поняття на позначення таких категорій, як назви й опис хвороб, номінація анатомічних структур і фізіологічних показників, лікувальні й діагностичні процедури, мовні одиниці на позначення лікувальних установ, медичного обладнання, статусу медич- ного працівника і хворого, абревіація в професійних програмах і стандартах. Доведено, що серед дібраних методом суцільної вибірки абревіатур кількісно переважають ініціальні, що стисло передають значення багатокомпонентних лексичних одиниць, виходячи з їх функціонального призначення раціоналізу- вати й оптимізувати фахову мовленнєву діяльність. Вони представлені алфа- вітизмами, акронімами й змішаними скороченнями, причому виявлено, що останні є досить незначною кількісною групою. Визначено, що в синонімічному шарі цих професійних контекстів вживаними є як повні синоніми, так і неповні, з кількісною перевагою останніх. Наявним є явище антонімії, особливо на позначення фізіологічних показників тіла й клі- нічних виявів хвороб. З’ясовано, що надзвичайно поширеними є полісемія, а також омонімія англійських абревіатур, що в разі перекладу рідною мовою реципієнта є проблемою для адекватного тлумачення змісту цільових одиниць.
This paper describes the SemantiKLUE system (Proisl et al., 2014) used for the SemEval-2015 shared task on Semantic Textual Similarity (STS) for English. The system was developed for SemEval-2013 and extended for SemEval-2014, where it participated in three tasks and ranked 13th out of 38 submissions for the English STS task. While this year's submission ranks 46th out of 73, further experiments on the selection of training data led to notable improvements showing that the system could have achieved rank 22 out of 73. We report a detailed analysis of those training selection experiments in which we tested different combinations of all the available STS datasets, as well as results of a qualitative analysis conducted on a sample of the sentence pairs for which SemantiKLUE gave wrong STS predictions.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.