Pour les sciences du langage, comme pour toutes les sciences, la question du rapport aux données est l'une des plus fondamentales qui soit. Les avancées technologiques récentes en matière d'analyse et de fouille de bases et de banques de données linguistiques ont donné à la question de la relation entre corpus et modèles une acuité nouvelle. Face aux constructions génératives qui voient la théorie comme fondamentalement sous déterminée par les données factuelles, de nouvelles approches ont été proposées qui mettent au premier plan les faits de langue observables et construisent l'analyse linguistique comme une modélisation des usages. Voir dans ce renversement de la relation entre données et modèles un simple effet des technologies nouvellement disponibles et défendre que les linguistiques de corpus ne sont rien d'autre que de simples dispositifs techniques au service d'une linguistique descriptive, empirique ou herméneutique, occulte les questions épistémologiques centrales qui commandent la relation de la science linguistique à ses observables. En réanalysant l'opposition classique entre sciences de l’exemplumet sciences dudatum, je montre ici que la linguistique, et singulièrement la phonologie, se sont construites, contre la grammaire, comme des sciences empiriques ayant pour objet la modélisation des observables linguistiques. La notion de corpus apparaît ainsi l'une des plus anciennes qui soient. Comprendre son ancienneté et construire son historicité permettent de saisir ce qui est en jeu dans son resourcement technologique récent et permet de voir le moment génératif comme une parenthèse, certes un temps productive, dans la longue confrontation du linguiste modélisateur à ses corpus d'observables. L'enjeu de la réanalyse de la notion de corpus en linguistique et en phonologie est donc considérable, contre la vulgate saussurienne qui doit si peu à la pensée du Maître genevois, il ne s'agit de rien de moins que frayer le chemin d'une linguistique de parole, conditionsine qua non, comme il l'a souvent dit, d'une linguistique de la langue.