2020
DOI: 10.1007/s13735-019-00187-6
|View full text |Cite
|
Sign up to set email alerts
|

Characterization and classification of semantic image-text relations

Abstract: The beneficial, complementary nature of visual and textual information to convey information is widely known, for example, in entertainment, news, advertisements, science, or education. While the complex interplay of image and text to form semantic meaning has been thoroughly studied in linguistics and communication sciences for several decades, computer vision and multimedia research remained on the surface of the problem more or less. An exception is previous work that introduced the two metrics Cross-Modal … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
13
0
4

Year Published

2020
2020
2024
2024

Publication Types

Select...
4
2
1

Relationship

0
7

Authors

Journals

citations
Cited by 18 publications
(17 citation statements)
references
References 38 publications
0
13
0
4
Order By: Relevance
“…Tương tự như đối với kiểu liên kết tương đồng, kiểu liên kết tương phản này cũng chưa được giải thích và minh họa bằng ví dụ rõ ràng trong mô hình phân loại các kiểu liên kết của Martinec và Salway [9] và van Leeuwen [20]. Một số nghiên cứu về liên kết hình ảnh -ngôn bản trong các thể loại (genre) khác nhau gần đây đã phân tích kiểu liên kết này kỹ hơn [12,22].…”
Section: Phương Phápunclassified
See 3 more Smart Citations
“…Tương tự như đối với kiểu liên kết tương đồng, kiểu liên kết tương phản này cũng chưa được giải thích và minh họa bằng ví dụ rõ ràng trong mô hình phân loại các kiểu liên kết của Martinec và Salway [9] và van Leeuwen [20]. Một số nghiên cứu về liên kết hình ảnh -ngôn bản trong các thể loại (genre) khác nhau gần đây đã phân tích kiểu liên kết này kỹ hơn [12,22].…”
Section: Phương Phápunclassified
“…Như vậy, chúng ta có thể thấy toàn văn bản đã được mở rộng từ chuyện chờ xem đội Anh đá bóng sang chuyện ăn mít: Chúng tôi ngồi chờ đội của nước Anh đá bóng. Chúng tôi thấy sốt ruột ghê và chúng tôi đã ăn mít như thế này đây.Tóm lại, giống như trong thể loại văn học và báo chí[12,22], trong thể loại giao tiếp hằng ngày như văn bản đa phương thức trên Facebook của người Mỹ và người Việt, liên kết mở rộng cũng được sử dụng để bổ sung thông tin có liên quan vào mạch chính của câu chuyện được kể, dẫn dắt người đọc sang một ý mới có liên quan. Trong kiểu liên kết này, hình ảnh thường được sử dụng để mở rộng thông tin trình bày trong ngôn bản.…”
unclassified
See 2 more Smart Citations
“…However, none of these studies propose any predictive models for cross-modal correlation categories. Recently, researchers pay more attention to the prediction of the cross-modal correlation categories and expand the existing classification system based on image specificity [13], emotion [14], interrelation metrics [15,16], parallel and non-parallel [17], contextual and semiotic relations [18], visual content contribution [19], etc. They annotate data and train models to predict the cross-modal correlation category around the following tasks: multimodal regression [13] or multimodal classification [14,15,16,17,18,19].…”
Section: Introductionmentioning
confidence: 99%