Neste artigo, objetivamos discutir as possíveis relações que se estabelecem entre as teorias enunciativa e multimodal em aquisição de linguagem. Para tanto, apresentaremos alguns conceitos sobre a Teoria Enunciativa com base em Benveniste e seus dissidentes, bem como a Teoria Multimodal tendo como referências centrais os autores McNeill, Kendon e seus interlocutores, considerando a perspectiva da Aquisição da Linguagem. Metodologicamente, realizamos uma revisão de literatura com abordagem qualitativa, utilizamos duas teses e uma dissertação frutos de Programas de Pós-Graduação do Brasil e de Portugal com estudos concentrados na linguística; dezoito artigos; e três livros que discutem sobre a relação entre a enunciação, o corpo e a aquisição da linguagem. As bases de dados on-line são: ScIELO, Periódicos CAPES e acervo de livros disponíveis na biblioteca da Universidade Católica de Pernambuco. Verificamos que durante a infância a criança realiza a aquisição da linguagem utilizando a enunciação a partir da multimodalidade. Concluímos que a criança se apropria dos mecanismos enunciativos, assumindo aos poucos a condição de sujeito e as relações de alteridade, utilizando os recursos multimodais de produção vocal, gestos, olhar e expressões faciais.