Este trabalho apresenta as primeiras indicações empíricas de pesquisa feita com corpus infantil longitudinal realizado com um informante brasileiro (G.), que mora em Couto de Magalhães, uma pequena cidade do Vale do Jequitinhonha, em Minas Gerais. Os registros em áudio começaram a ser feitos no 5 o mês de vida do informante e estenderam-se por 18 meses em sessões mensais regulares de 30 minutos cada. Trata-se de uma forma de diário parental que, através da metodologia de corpus com contagem de itens feita através de software, buscou obter dados referentes à sua evolução do uso lexical e observar como se deram as variações no número de ocorrências das formas pré-lexicais, a saber: os balbucios, as pré-palavras e as proto-palavras, e no número de ocorrências das primeiras pré-palavras, proto-palavras, palavras e expressões holofrásicas. O material oral coletado foi transcrito de acordo com o padrão internacional CHAT. Durante o período estudado, foram consideradas 833 ocorrências produzidas pelo informante. Observou-se que houve queda proporcional do valor do número de pré-palavras e de proto-palavras, e aumento do valor proporcional do número de palavras e expressões holofrásicas. Os dados obtidos foram organizados, tabelados e comparados de acordo com o percentual de suas ocorrências. A eles, foi proposta uma interpretação interacionista dialógica. Palavras-chave: aquisição da língua materna; diário parental; registro oral; categorias lexicais e pré-lexicais.