En este trabajo indagamos sobre el valor de distintos corpus del español en la red para el estudio de la variación lingüística. Para ello, comparamos los resultados del estudio de cinco fenómenos lingüísticos en dos corpus de comunicación mediada por ordenador (esTenTen, constituido por distintos tipos de textos en línea, y el corpus de tuits del proyecto Proyectando la variación lingüística de Internet). Los fenómenos lingüísticos estudiados son la elisión de la /d/ intervocálica, las formas de tratamiento en plural, el uso no referencial de ello, la pluralización de haber existencial y el uso coloquial del sufijo superlativo –érrimo. El análisis muestra que los macrocorpus compilados de forma automática sin distinguir al menos los géneros de la comunicación digital documentada pueden presentar elevadas cantidades de ruido estadístico y que, por favorecer los contextos monológicos, pueden ser problemáticos para la documentación de determinados fenómenos muy marcados (ya sea diatópica, diafásica o diastráticamente). Su mayor ventaja es la elevada cantidad de datos que ofrecen. Por el contrario, los corpus más controlados y que privilegian contextos más prominentemente dialógicos son preferibles para el estudio de las variables lingüísticas propias de la inmediatez comunicativa, a pesar de que resultan más difíciles de compilar y consultar.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.