Proceedings 15th International Conference on Pattern Recognition. ICPR-2000
DOI: 10.1109/icpr.2000.903018
|View full text |Cite
|
Sign up to set email alerts
|

Extracting actors, actions and events from sports video -a fundamental approach to story tracking

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1

Citation Types

0
15
0
2

Publication Types

Select...
4
3
2

Relationship

1
8

Authors

Journals

citations
Cited by 24 publications
(17 citation statements)
references
References 5 publications
0
15
0
2
Order By: Relevance
“…Event detection is approached either by developing feature-based event models [8], [12], [13], [22]- [24], [26], by searching for keywords in speech (e.g. commentator) [4] and closed captions [16], by using MPEG-7 metadata [11] or by involving several of the above-mentioned clues into inter-modal collaboration [3], [9], [21]. We see the main disadvantage of this approach in the need for numerous and reliable event models which should take into account not only all highlight-related events but also various realizations of these events and their coverage that may change from one broadcaster to another.…”
mentioning
confidence: 99%
“…Event detection is approached either by developing feature-based event models [8], [12], [13], [22]- [24], [26], by searching for keywords in speech (e.g. commentator) [4] and closed captions [16], by using MPEG-7 metadata [11] or by involving several of the above-mentioned clues into inter-modal collaboration [3], [9], [21]. We see the main disadvantage of this approach in the need for numerous and reliable event models which should take into account not only all highlight-related events but also various realizations of these events and their coverage that may change from one broadcaster to another.…”
mentioning
confidence: 99%
“…Luo và cộng sự [15] đề xuất mô hình kết hợp Expectation -Maximization để định nhãn khuôn mặt và dáng điệu của con người một cách đồng thời. Nitta và cộng sự [16] gán nhãn cho con người và hành động của họ trong các video thể thao bằng cách đầu tiên là dùng văn bản (phụ đề đóng -closed caption) để trích ra các phân cảnh (scenes) cùng với con người, hành động và sự kiện họ xuất hiện, sau đó phân đoạn lại video tương ứng bằng cách sử dụng các đầu mối từ hình ảnh, cuối cùng liên kết các phân đoạn video với các phân đoạn văn bản. Marszalek và cộng sự [17], theo cách khác, trình bày kết quả nghiên cứu về phát hiện hành động và địa điểm trong video chủ yếu dựa trên giả thiết rằng hành động của con người có liên quan cao đến địa điểm mà họ xuất hiện.…”
Section: Các Nghiên Cứu Liên Quanunclassified
“…Các khuôn khổ và mô hình này được kết hợp với nhau trong một bộ phân loại hỗn hợp hành động-khung cảnh dựa trên kỹ thuật SVM. Bằng cách đề xuất các phương pháp nhằm phát hiện một tập hợp các khái niệm, [15,16,17] đã tận dụng mối liên hệ giữa các khái niệm này -điều rất có giá trị trong việc chú thích tự động các khái niệm trong video. Ví dụ như, một khung cảnh "dưới nước‖ thường xuất hiện với một con "cá mập" thay vì là một "con chim"; hoặc một tập các khuôn mặt giống nhau đồng xuất hiện có hệ thống cùng với cái tên Bush trong mô tả văn bản tương ứng nên được gán tên là Bush.…”
Section: Các Nghiên Cứu Liên Quanunclassified
“…There has also been increasing interest in using textual information along with visual information for various tasks. Nitta et al [19] annotated sports video by associating text segments with image segments. Their approach uses prior knowledge of the Figure 2.…”
Section: Background and Related Workmentioning
confidence: 99%