Аннотация. В статье приводится обзор основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Проводится исследование основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Рассматриваются вопросы, связанные с возможностями искусственного интеллекта как технологии для решения задачи модерации текстового наполнения социальных сетей. Алгоритм, полученный с применением TF-IDF меры, определяет важность слов в текстовом сообщении и успешно борется с содержащими нецензурные слова и выражения блоками, но не всегда учитывает смысл. Данный подход пригоден для онлайн-обработки, по причине нетребовательности к вычислительным ресурсам. Алгоритм, построенный с применением этого метода, работает быстро и достигает приемлемой эффективности. Установлено, что корректно классифицировать сообщения оптимальнее всего получается у нейросетевых алгоритмов. Однако для этого требуется мощные вычислительные ресурсы и при этом затрачивается большое количество времени на обработку. По этой причине такие алгоритмы более подходят для модерации текстового наполнения социальной сети в офлайн-режиме. Сделаны выводы по проведенному исследованию.Ключевые слова: токсичное сообщение, аугментация данных, онлайн режим, офлайн режим, TF-
The paper deals with the issues of decomposition of control algorithms for the processes in parallel computing systems and the use of automaton models. When designing parallel processing systems, an important task is the formal presentation of process control algorithms since they allow achieving a packaged solution to the problems of specification, development, implementation, verification, and analysis of complex control systems, including the control of interacting processes and resources in parallel computing systems. It is especially necessary to use formal methods to verify complex information processing systems by model testing. One of the methods for the formal description of control algorithms is based on the use for these purposes of the nondeterministic automaton (NDA) logic, which is a method that allows one to present control algorithms for information processing in the form of systems of canonical equations describing all particular events implemented in the algorithm. The advantage of such a language is that all transitions in the control system are described not in terms of system states, but in terms of particular events, the simultaneous existence of which determines all states and transitions in the system; this allows avoiding a "combinatorial explosion" in the state space to the possibilities of means verification. Purpose of the paper: research of control algorithms for parallel computing systems using the NDA apparatus. The development and research object is parallel decomposition of control algorithms for parallel computing systems using automatic models.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.