No abstract
Resumen-La equivalencia léxica de traducción se define mediante correspondencias establecidas entre dos lenguas, comúnmente denominadas lengua de origen y lengua meta. Este artículo propone un método de extracción de dichas equivalencias en palabras no funcionales. El algoritmo se basa en dos recursos principales: 1) MultiWordNet como léxico especializado para cada uno de los idiomas involucrados y 2) textos paralelos como información adicional para proporcionar diversas lexicalizaciones de las palabras a corresponder. Utiliza como fundamento principal el hecho de que las redes de palabras que conforman MultiWordNet están alineadas. Además, se presenta la reutilización del repositorio de pares léxicos obtenidos, señalando la forma en que esta información es susceptible de ser usada en un sistema de alineación a nivel de palabras. Para realizar los experimentos se emplearon textos paralelos bilingües sin notación morfosintáctica alguna, alineados a nivel de oración en los pares de idiomas español / inglés y español / italiano. Palabras clave-Equivalencias léxicas, alineación, redes de palabras, textos paralelos.
La evaluación de un Sistema Basado en Conocimiento es una fase del ciclo de desarrollo en este paradigma que comúnmente busca que el sistema tenga una sintaxis correcta, una semántica válida y que el grado de usabilidad y utilidad sea alto. Sin embargo, en esta etapa no se hace una valoración de la organización que tiene la Base de Conocimiento, lo cual pudiera repercutir en la eficiencia de la aplicación resultante, independientemente de que cumpla con los aspectos considerados para su evaluación.El presente trabajo propone un conjunto de coeficientes para medir, cuantitativamente, la estructura de un Sistema Experto basado en Reglas. Dichos coeficientes determinan la independencia entre los resultados que brinda el sistema, el nivel de profundidad en el razonamiento seguido para alcanzar estos resultados y la cantidad de conocimiento asociado al proceso de razonamiento. El valor obtenido para cada coeficiente, constituye la base para la interpretación de las características analizadas, permitiendo predecir la calidad del sistema bajo estudio.
Abstract. Parallel texts are enriched by alignment algorithms, thus establishing a relationship between the structures of the implied languages. Depending on the alignment level, the enrichment can be performed on paragraphs, sentences or words, of the expressed content in the source language and its translation. There are two main approaches to perform word-level alignment: statistical or linguistic. Due to the dissimilar grammar rules the languages have, the statistical algorithms usually give lower precision. That is why the development of this type of algorithms is generally aimed at a specific language pair using linguistic techniques. A hybrid alignment system based on the combination of the two traditional approaches is presented in this paper. It provides user-friendly configuration and is adaptable to the computational environment. The system uses linguistic resources and procedures such as identification of cognates, morphological information, syntactic trees, dictionaries, and semantic domains. We show that the system outperforms existing algorithms.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.