Quiero agradecer a todos aquellos que de una manera u otra han tenido que ver con la realización del presente trabajo.Estoy agradecido a los componentes del grupo PRHLT que me han proporcionado un entorno estimulante, especialmente a Alberto Sanchis, como amigo y experto en verificación de hipótesis, por su orientación y por haber estado a deshoras contándome los entresijos de la verificación. A Alejandro H. Toselli, amigo y codirector de este trabajo, que ha ayudado a que esta tesis tomara la linea de trabajo que ha tomado. Gracias a Carlos Martínez por su compañerismo y apoyo, y a Verónica por su ayuda en la experimentación. A la gente del ITI, la que está y la que ya no, a Paco Casacuberta, a Alfons, y muy especialmente a Enrique Vidal por todo.A ATROS con el que he compartido muchas horas de angustias, alegrías y decepciones, y con el que he aprendido a programar.A Clara por su paciencia e incondicionalidad, y por brindarme el equilibrio y el sosiego que me han permitido avanzar en la consecución de esta tesis, por cuidarme cuando he estando enclaustrado, por forzarme a descansar cuando me he ofuscado, y por todas esas pequeñas cosas que no sería propio dejar constancia aquí.A todos mi más sincera gratitud.
Moisés Pastor i Gadea
RESUMENEn esta tesis se estudia el problema de la robustez en los sistemas de reconocimiento automático de texto manuscrito off-line. Los sistemas de reconocimiento automático de texto manuscrito estarán maduros para su uso generalizado, cuando sean capaces de ofrecer a cualquier usuario, sin ningún tipo de preparación o adiestramiento para su utilización, una productividad razonable. Se hace necesario pues, construir sistemas flexibles y robustos en cuanto a la entrada, de tal manera que no se requiera del escritor ningún esfuerzo extra, que no haría si escribiese para ser leído por un humano.La intención del preproceso de la señal es hacer el sistema invariante a fuentes de variabilidad que no ayuden a la clasificación. En la actualidad no hay definida una solución general para conseguir invariabilidad al estilo de escritura, y cada sistema desarrolla la suya ad-hoc. En esta tesis se explorarán diferentes métodos de normalización de la señal de entrada off-line. Para ello se hace un amplio estudio de algoritmos de preproceso, tanto a nivel de toda la imagen: umbralización, reducción del ruido y corrección del desencuadre; como a nivel de texto: slope, slant y normalización del tamaño de los caracteres.Los sistemas dependientes del escritor obtienen mejores tasas de acierto que los independientes del escritor. Por otra parte, los sistemas independientes del escritor tienen más facilidad para reunir muestras de entrenamiento. En esta tesis se estudiará la adaptación de sistemas independientes del escritor para su utilización por un único escritor, con la intención de que a partir de una pocas muestras producidas por este escritor se mejore la productividad del sistema (para este escritor), o lo que es lo mismo, que éste pueda escribir de manera más relajada sin que el sistema pierda...