Movie scene segmentation using background information

Chen, Lianghua; Lai, Yu-Chun; Liao, Hong-Yuan Mark

doi:10.1016/j.patcog.2007.07.024

Cited by 45 publications

(11 citation statements)

References 29 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…[30] Considering that Bhattacharyya distance gives a value between 0 and 1, the similarity of color histograms is more significant when the value is closer to zero. As proposed by Chen et al, [31] we consider that two images under comparison are potential key-frames when the Bhattacharyya coefficient φ(·) is larger than or equal to 0.9.…”

Section: Video Summarizationmentioning

confidence: 99%

A unified approach to content-based indexing and retrieval of digital videos from television archives

Souza¹,

Pádua

Nunes³

et al. 2014

AIR

View full text Add to dashboard Cite

This work addresses the development of a unified approach to content-based indexing and retrieval of digital videos from television archives. The proposed approach has been designed to deal with arbitrary television genres, making it suitable for various applications. To achieve this goal, the main steps of a content-based video retrieval system are addressed in this work, namely: video segmentation, key-frame extraction, content-based video indexing and the video retrieval operation itself. Video segmentation is addressed as a typical TV broadcast structuring problem, which consists in automatically determining the boundaries of each broadcasted program (like movies, news, among others) and inter-program (for instance, commercials). Specifically, to segment the videos, Electronic Program Guide (EPG) metadata is combined with the detection of two special cues, namely, audio cuts (silence) and dark monochrome frames. On the other hand, a color histogram-based approach performs key-frame extraction. Video indexing and retrieval are accomplished by using hashing and k-d tree methods, while visual signatures containing color, shape and texture information are estimated for the key-frames, by using image and frequency domain techniques. Experimental results with the dataset of a multimedia information system especially developed for managing television broadcast archives demonstrate that our approach works efficiently, retrieving videos in 0.16 seconds on average and achieving recall, precision and F1 measure values, as high as 0.76, 0.97 and 0.86 respectively.

show abstract

Section: Video Summarizationmentioning

confidence: 99%

A unified approach to content-based indexing and retrieval of digital videos from television archives

Souza¹,

Pádua

Nunes³

et al. 2014

AIR

View full text Add to dashboard Cite

show abstract

“…Apesar das tomadas poderem ser muito semelhantes visualmente, o assunto tratado pelos personagens pode variar, o que caracteriza uma mudança de cena nesse segmento. Esse entendimento de cena está mais próximo do usuário, que tende a mentalmente organizar as informações por assuntos ou eventos (Yeung e Yeo, 1997;Hanjalic et al, 1999b;Durak, 2004;Chen et al, 2008).…”

Section: Motivaçãounclassified

“…Isso ocorre pois um observador humano tende a lembrar de diversos eventos após assistir um filme (Yeung e Yeo, 1997;Hanjalic et al, 1999b;Chen et al, 2008;Durak, 2004), e normalmente os eventos são representados por meio de cenas (Chen et al, 2008).…”

Section: Estrutura De Vídeounclassified

“…Apesar de originalmente ser aplicada somente em histogramas de cores, outros tipos de histograma tem sido utilizados em conjunto com essa técnica, e ela tem sido utilizada em diversos trabalhos de segmentação de vídeo com bastante sucesso (Ngo et al, 2000;Zhai e Shah, 2005a;Chen et al, 2008). Essa medida avalia a similaridade entre dois histogramas, sendo capaz de tratar mesmo mudanças de escala.…”

Section: Medidas De Similaridadeunclassified

See 1 more Smart Citation

Detecção de cenas em segmentos semanticamente complexos

Lopes¹

View full text Add to dashboard Cite

Dedico esse trabalho a meus pais e à minha noiva, que sempre me apoiaram e ajudaram em todos os momentos. AgradecimentosAgradeço em primeiro lugar a Deus, por ter me iluminado durante todo o desenvolvimento do trabalho, dando a paciência e a inspiração necessária para sua realização.Agradeço também, a meu orientador, pelos infindáveis conselhos e por sua orientação sempre tão pertinente.Agradeço aos professores das matérias realizadas no mestrado, que certamente contribuíram beneficamente para a realização dessa pesquisa.Agradeço aos colegas e amigos do laboratório de pesquisa, que sempre me apoiaram e me deram forças nos momentos de desânimo.Agradeço ao CNPq pelo auxílio financeiro, processo n°134245/2011-3. Agradeço à FAPESP pelo auxílio financeiro, processo n°2011/05238-0, Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). "As opiniões, hipóteses e conclusões ou recomendações expressas neste material são de responsabilidade do(s) autor(es) e não necessariamente refletem a visão da FAPESP". Resumo Diversas áreas da Computação (Personalização e Adaptação de Conteúdo, Recuperação de Informação, entre outras) se beneficiam da segmentação de vídeo em unidades menores de informação. A literatura apresenta diversos métodos e técnicas cujo objetivo é identificar essas unidades. Uma limitação é que tais técnicas não tratam o problema da detecção de cenas em segmentos semanticamente complexos, definidos como trechos de vídeo que apresentam mais de um assunto ou tema, e cuja semân-tica latente dificilmente pode ser determinada utilizando-se somente uma única mídia. Esses segmentos são muito relevantes, pois estão presentes em diversos domínios de vídeo, tais como filmes, noticiários e mesmo comerciais.A presente Dissertação de Mestrado propõe uma técnica de segmentação de vídeo capaz de identificar cenas em segmentos semanticamente complexos. Para isso utiliza a semântica latente alcançada com o uso de Bag of Visual Words para agrupar os segmentos de um vídeo. O agrupamento é baseado em multimodalidade, analisando-se características visuais e sonoras de cada vídeo e combinando-se os resultados por meio da estratégia fusão tardia. O presente trabalho demonstra a viabilidade técnica em reconhecer cenas em segmentos semanticamente complexos. The literature reports lots of techniques and methods, whose goal is to identify these units. One of these techniques' limitations is that they don't handle scene detection in semantically complex segments, which are defined as video snippets that present more than one subject or theme, whose latent semantics can hardly be determined using only one media. Those segments are very relevant, since they are present in multiple video domains as movies, news and even television commercials. This Master's dissertation proposes a video scene segmentation technique able to detect scenes in semantically complex segments. In order to achieve this goal it uses latent semantics extracted by the Bag of Visual Words to group a video segments. This grouping process is based on multimodalit...

show abstract

“…Enquanto a detecção de tomadasé o primeiro passo para a realização da análise do vídeo, a detecção de cenasé o primeiro passo em direção a compreensão semântica do vídeo digital (Chen et al, 2008). Seguindo o fluxo contrário dessa definição, nota-se què a compreensão semântica depende de estruturas denominadas cenas.…”

Section: Detecção De Cenas E a Lacuna Semânticaunclassified

Segmentação de cenas em telejornais: uma abordagem multimodal

Coimbra¹

View full text Add to dashboard Cite

Movie scene segmentation using background information

Cited by 45 publications

References 29 publications

A unified approach to content-based indexing and retrieval of digital videos from television archives

A unified approach to content-based indexing and retrieval of digital videos from television archives

Detecção de cenas em segmentos semanticamente complexos

Segmentação de cenas em telejornais: uma abordagem multimodal

Contact Info

Product

Resources

About