Resumen. En la interacción humano-robot la generación automática de diálogos es una parte importante. Los diálogos generados deben garantizar una conversación coherente entre el humano y el robot, se espera que la interacción sea lo más natural y eficaz que se pueda. En este trabajo se plantea el uso de entidades semánticas como elementos básicos que posteriormente serán utilizados para la realización de un módulo de comprensión del lenguaje como parte de un sistema de diálogos. Para poder identificar las entidades semánticas en los diálogos se evaluaron dos herramientas para reconocer entidades nombradas (NER), que utilizan como núcleo un clasificador basado en Campos Aleatorios Condicionales. Los resultados que se obtienen en este trabajo permiten afirmar que estos dos NER tienen buenos resultados en el reconocimiento de las entidades semánticas (tokens) pues de manera global superan el 84% de exactitud. El corpus utilizado en este trabajo es el corpus español DIHANA, el cual está compuesto de diálogos sobre un sistema de información de consultas telefónicas sobre horarios y precios de trenes de largo recorrido.Palabras clave: sistema de diálogos, entidad semántica, reconocedor de entidad nombrada.Abstract. In the human-robot interaction the automatic generation of dialogues is an important part, the generated dialogues must guarantee a coherent conversation between the human and the robot, the interaction is expected to be as natural and effective as possible. In this paper, the use of semantic entities as basic elements is proposed, which will later be used for the realization of a language understanding module as part of a dialog system. To identify the semantic entities in the dialogues, two tools for recognizing named entities (NER) were evaluated, using as a nucleus a classifier based on Conditional Random Fields. The results obtained in this work allow us to affirm that these two NERs have satisfactory results in the recognition of semantic entities (tokens) because, overall, they exceed 84% accuracy. The corpus used in this 99
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.