Link to this article: http://journals.cambridge.org/abstract_S1351324912000010How to cite this article: ESAÚ VILLATORO, ANTONIO JUÁREZ, MANUEL MONTES, LUIS VILLASEÑOR and L. ENRIQUE SUCAR (2012). Document ranking renement using a Markov random eld model. AbstractThis paper introduces a novel ranking refinement approach based on relevance feedback for the task of document retrieval. We focus on the problem of ranking refinement since recent evaluation results from Information Retrieval (IR) systems indicate that current methods are effective retrieving most of the relevant documents for different sets of queries, but they have severe difficulties to generate a pertinent ranking of them. Motivated by these results, we propose a novel method to re-rank the list of documents returned by an IR system. The proposed method is based on a Markov Random Field (MRF) model that classifies the retrieved documents as relevant or irrelevant. The proposed MRF combines: (i) information provided by the base IR system, (ii) similarities among documents in the retrieved list, and (iii) relevance feedback information. Thus, the problem of ranking refinement is reduced to that of minimising an energy function that represents a trade-off between document relevance and inter-document similarity. Experiments were conducted using resources from four different tasks of the Cross Language Evaluation Forum (CLEF) forum as well as from one task of the Text Retrieval Conference (TREC) forum. The obtained results show the feasibility of the method for re-ranking documents in IR and also depict an improvement in mean average precision compared to a state of the art retrieval machine. * This work was done under partial support of CONACyT project grants: 61335, CB-2008-106013 and CB-2009-134186. 1 Depending on the context, items may refer to text documents, images, audio or video sequences.
RESUMENEn este trabajo presentamos una comparación entre cuatro algoritmos de aprendizaje automático para identificación del hablante. El estudio hace hincapié en la simplificación de la caracterización de la señal de voz al no usar reconocimiento fonético. Los resultados hasta ahora alcanzados nos brindan elementos para preferir el algoritmo de Máquinas de Vectores de Soporte (SVM). Palabras ClavesPersonalización de la interfaz, identificación del hablante, máquinas de vectores de soporte. INTRODUCCIÓNUna interfaz dinámica que cambie su apariencia o que proponga los elementos más comúnmente utilizados por un usuario específico son algunos de los elementos que se buscan al personalizar una interfaz. Por supuesto, uno de los primeros pasos en esta tarea es identificar al usuario. Este trabajo está orientado a identificar al usuario a través de su voz. De manera primordial el habla conlleva un mensaje a través del idioma. Pero la señal de voz también nos permite determinar el lenguaje hablado, la emoción, el género, en ocasiones la edad, así como la identidad del hablante. La tarea de identificación del hablante es una tarea que ha sido ampliamente estudiada, y además es desempeñada con altos porcentajes de certeza[1]. En nuestro caso deseamos identificar al usuario sin depender de lo que se diga, es decir, buscamos un sistema de identificación independiente del texto. Por otro lado, uno de los retos del presente trabajo es realizar la tarea de identificación sin depender de un reconocedor fonético, al trabajar directamente sobre los coeficientes extraídos de la señal de voz. A continuación se describen los experimentos realizados así como los resultados alcanzados. EXPERIMENTOSPara las fases de entrenamiento y evaluación se usó un corpus para el español mexicano conformado por grabaciones de 50 personas. Por cada persona se tienen 50 frases a 44kHz sin ruido, de 3 seg. La duración total del corpus es de aproximadamente 250 minutos. Cada grabación fue segmentada en ventanas sin solapamiento de: 30ms, 50ms y 80ms. De cada segmento se extrajeron sus coeficientes utilizando LPC (Linear Predictive Coefficients) y MFCC ( Mel Frequency Cepstra Coefficients). Los algoritmos de aprendizaje automático usados en esta comparación fueron: redes neuronales (ANN), vecinos más cercanos (k-nn), regresión lineal localmente ponderada (LWR) y máquinas de vectores de soporte (SVM). Las configuraciones específicas de cada algoritmo fueron: k-nn con k igual 50 e igual a 60; para LWR k=2000; para ANN tipo feedforward con 200:125:50 (200 nodos de entrada, 125 nodos en la capa oculta, 50 nodos para las clases), entrenadas por 1600 épocas con una tasa de aprendizaje de 0.005; y para SVM no se hizo ningún tipo de re-escalamiento a los datos y se utilizó un kernel de tipo polinomial. Para evaluar cada uno de los métodos de aprendizaje se utilizó la técnica de validación cruzada con 10 pliegues (10 fold cross-validation). RESULTADOSLa siguiente tabla muestra la precisión alcanzada con cada algoritmo para cuando se caracterizó la señal con MFCC...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.