2014
DOI: 10.1016/j.specom.2014.05.004
|View full text |Cite
|
Sign up to set email alerts
|

Speaking style effects in the production of disfluencies

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
7
0
11

Year Published

2016
2016
2024
2024

Publication Types

Select...
4
3

Relationship

3
4

Authors

Journals

citations
Cited by 25 publications
(22 citation statements)
references
References 25 publications
0
7
0
11
Order By: Relevance
“…The first ones, extracted in the context of [13], are the following: duration of speech with and without internal silences, pitch (f0), and energy normalized maximum, minimum, average, mean, and standard deviation, as well as pitch and energy slopes. Tempo measures encompass: articulation rate (number of phones or syllables per duration of speech without internal silences); speech rate (number of phones or syllables divided by the duration of speech with internal silences), and phonation ratio (100% times the duration of speech without internal silences divided by the duration of speech including the internal silences).…”
Section: Methodsmentioning
confidence: 99%
“…The first ones, extracted in the context of [13], are the following: duration of speech with and without internal silences, pitch (f0), and energy normalized maximum, minimum, average, mean, and standard deviation, as well as pitch and energy slopes. Tempo measures encompass: articulation rate (number of phones or syllables per duration of speech without internal silences); speech rate (number of phones or syllables divided by the duration of speech with internal silences), and phonation ratio (100% times the duration of speech without internal silences divided by the duration of speech including the internal silences).…”
Section: Methodsmentioning
confidence: 99%
“…No resto desta secção, incluem-se na variação entre estilos de fala as diferenças entre diálogos espontâneos e aulas universitárias (Trancoso et al 2008;Moniz et al 2011;Moniz 2013;Moniz et al 2014b), e as diferenças entre relatos espontâneos e apresentações orais escolares (Mata 1999;Moniz 2006;Moniz et al 2014a;Mata et al 2014b;no prelo). Tal como referido acima, estas diferenças estão relacionadas com a quantidade de planeamento prévio envolvido nos tipos de produção, em função da clareza da informação que se pretende transmitir e do grau de interação entre falante e ouvinte(s).…”
Section: Variação Estilísticaunclassified
“…O enriquecimento de transcrições automáticas depende de: i) transcrições manuais, ii) transcrições produzidas pelo reconhecedor automático e iii) análise do sinal acústico (para mais informações sobre este processo, veja-se Batista et al 2012aBatista et al e 2012bMoniz 2013;Moniz et al 2014b;Cabarrão et al 2015). A anotação manual é complexa sobretudo no caso da anotação de corpora de fala espontânea, uma vez que implica pontuar fala, por um lado, e identificar disfluências e marcadores discursivos, por outro -tarefas que, como se sabe, afetam a concordância inter-anotadores em distintos corpora do português europeu (cf.…”
Section: Prosódia E Processamento Automáticounclassified
“…Estudos preliminares em PE (Batista, 2011;Moniz, 2013;Moniz et al 2014a) mostraram que com base num conjunto de pistas puramente prosódicas é possível predizer e sistematizar padrões regulares na identificação das distintas marcas de pontuação e de reposição de fluência. Para o efeito, as pistas que mais contribuem para a predição da reposição de fluência a seguir a uma sequência disfluente contemplam: i) duas palavras contíguas idênticas; ii) subida dos níveis de f 0 e de energia na palavra que inicia uma reposição de fluência e um contorno estacionário de f 0 na palavra anterior; e iii) grau de confiança da palavra que inicia a reposição superior ao da disfluência propriamente dita.…”
Section: Enquadramento Teóricounclassified
“…No entanto, também em ambos os corpora, ainda que se verifique um menor número de estruturas identificadas como marcadores discursivos (a cobertura no CORAL é de 18% e no LECTRA de 11%), aqueles que são identificados mostram uma classificação correta (a precisão no CORAL é de 53% e no LECTRA de 72% -Quadro 8). Quadro 10: Matriz de confusão para o corpus LECTRA treinado com o corpus não-equilibrado CORAL Os resultados obtidos são melhores para as disfluências do que para os marcadores discursivos, uma vez que, tal como descrito em Moniz et al (2014a), existe uma marcação de contraste prosódico que se manifesta no aumento de energia entre a região a reparar e a reparação de fluência em ambos os corpora. Esta estratégia de produção de disfluências não se observa nos marcadores discursivos de forma consistente, exibindo estes uma variedade de padrões prosódicos.…”
Section: Amostra Não-equilibrada Amostra Equilibradaunclassified