2008
DOI: 10.1109/msp.2008.918023
|View full text |Cite
|
Sign up to set email alerts
|

Speech segmentation and spoken document processing

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
36
0
4

Year Published

2009
2009
2021
2021

Publication Types

Select...
4
3
2

Relationship

0
9

Authors

Journals

citations
Cited by 42 publications
(40 citation statements)
references
References 14 publications
0
36
0
4
Order By: Relevance
“…They may be quite flexible, elliptic, restructured, and even incomplete (Blaauw, 1995). Structural metadata events (Liu et al, 2006;Ostendorf et al, 2008), i.e. punctuation marks and disfluencies, are being added to several corpora in EP, including CPE-FACES, in order to enrich automatic speech recognition outputs, for legibility purposes and also for the empirical study of interactions among different linguistic levels of analysis.…”
Section: Annotation Proceduresmentioning
confidence: 99%
“…They may be quite flexible, elliptic, restructured, and even incomplete (Blaauw, 1995). Structural metadata events (Liu et al, 2006;Ostendorf et al, 2008), i.e. punctuation marks and disfluencies, are being added to several corpora in EP, including CPE-FACES, in order to enrich automatic speech recognition outputs, for legibility purposes and also for the empirical study of interactions among different linguistic levels of analysis.…”
Section: Annotation Proceduresmentioning
confidence: 99%
“…According to Ostendorf et al in [12], the segmentation of spoken languages can be divided into: audio diarization and structural segmentation. Audio diarization aims to distinguish speech from music through the grouping of acoustically homogeneous regions.…”
Section: Related Workmentioning
confidence: 99%
“…A principal motivação deste trabalho é a realização de uma tarefa de classificação automática multiclasse para determinar, com base nas propriedades prosódicas das palavras, quais as que são marcadores discursivos, quais as que são disfluências e quais as que são constituintes similares a frases (do inglês sentence like-units, SUs). No domínio do processamento automático de fala, as marcas de pontuação, que delimitam SUs, as disfluências e os marcadores discursivos fazem parte de um conjunto de eventos designados no inglês structural metadata events (Liu et al, 2006;Ostendorf et al, 2008). Nesta linha de análise, pretende-se recuperar automaticamente a pontuação e as maiúsculas em fronteiras de frase, bem como a anotação e filtragem de disfluências e de marcadores.…”
Section: Introductionunclassified
“…A identificação de marcas de pontuação (Batista, 2011;Batista et al, 2012;Moniz, 2013) e de disfluências (e.g., pausas preenchidas lexicalizadas, como "aam" e/ou "mm", apagamentos, substituições, entre outros 1 ) nas transcrições já permitiu uma melhoria significativa do output do sistema, o que resultou numa diminuição da taxa de erro de reconhecimento (Moniz et al, 2014b). Com a recente disponibilização de uma grande quantidade de corpora de fala espontânea, foi possível analisar os eventos em falta, nomeadamente, os marcadores discursivos (Liu et al, 2006;Ostendorf et al, 2008), tópico do presente estudo.…”
Section: Introductionunclassified