En el marco del debate acerca de la necesaria presencia de géneros discursivos cercanos al polo de la inmediatez comunicativa, como mejor estrategia para aproximarnos a la oralidad de tiempos pretéritos, en el presente artículo se describen los principios hermenéuticos y metodológicos de un corpus compilado a lo largo de la última década por el grupo de investigación Sociolingüística, de la Universitat Jaume I. Integrado por tradiciones escritas de impronta oral, mayoritariamente correspondencia privada, a la que se añaden en menor proporción algunos géneros autobiográficos (diarios, memorias de servicios, crónicas de soldados), el corpus supera ya los catorce millones de palabras, escritas por cerca de siete mil españoles de diferente extracción social y dialectal entre finales del siglo XV y la primera mitad del XX. A partir de las limitaciones que para el análisis sociolingüístico presentan otros corpus, en el artículo se revisan los principales fundamentos que guían la arquitectura de este, entre las que sobresale la necesidad de contar con una selección suficientemente amplia y representativa de los diferentes periodos estudiados, haciendo posible así la investigación sobre variables (morfosintácticas, léxicas, discursivas) que, por su propia naturaleza, poseen escasa recurrencia en el discurso. Tipológicamente, se configura, pues, como un corpus específico, por la finalidad de su aprovechamiento, eminentemente sociolingüística; y secundario, dada la explotación que en él se hace de textos editados previamente, aunque seleccionados, de acuerdo con parámetros rigurosos.