“…A identificação de marcas de pontuação (Batista, 2011;Batista et al, 2012;Moniz, 2013) e de disfluências (e.g., pausas preenchidas lexicalizadas, como "aam" e/ou "mm", apagamentos, substituições, entre outros 1 ) nas transcrições já permitiu uma melhoria significativa do output do sistema, o que resultou numa diminuição da taxa de erro de reconhecimento (Moniz et al, 2014b). Com a recente disponibilização de uma grande quantidade de corpora de fala espontânea, foi possível analisar os eventos em falta, nomeadamente, os marcadores discursivos (Liu et al, 2006;Ostendorf et al, 2008), tópico do presente estudo.…”