Characterization and classification of semantic image-text relations

Otto, Christian; Springstein, Matthias; Anand, Avishek; Ewerth, Ralph

doi:10.1007/s13735-019-00187-6

Cited by 18 publications

(17 citation statements)

References 38 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Tương tự như đối với kiểu liên kết tương đồng, kiểu liên kết tương phản này cũng chưa được giải thích và minh họa bằng ví dụ rõ ràng trong mô hình phân loại các kiểu liên kết của Martinec và Salway [9] và van Leeuwen [20]. Một số nghiên cứu về liên kết hình ảnh -ngôn bản trong các thể loại (genre) khác nhau gần đây đã phân tích kiểu liên kết này kỹ hơn [12,22].…”

Section: Phương Phápunclassified

“…Như vậy, chúng ta có thể thấy toàn văn bản đã được mở rộng từ chuyện chờ xem đội Anh đá bóng sang chuyện ăn mít: Chúng tôi ngồi chờ đội của nước Anh đá bóng. Chúng tôi thấy sốt ruột ghê và chúng tôi đã ăn mít như thế này đây.Tóm lại, giống như trong thể loại văn học và báo chí[12,22], trong thể loại giao tiếp hằng ngày như văn bản đa phương thức trên Facebook của người Mỹ và người Việt, liên kết mở rộng cũng được sử dụng để bổ sung thông tin có liên quan vào mạch chính của câu chuyện được kể, dẫn dắt người đọc sang một ý mới có liên quan. Trong kiểu liên kết này, hình ảnh thường được sử dụng để mở rộng thông tin trình bày trong ngôn bản.…”

unclassified

“…Ngược lại, người Mỹ thường chọn khai triển, chi tiết hóa những tham thể hay quá trình họ đang trình bày. Nói cách khác, người Mỹ có xu hướng chọn phân tích sâu những yếu tố họ đang đề cập để phát triển ý trong phát ngôn của mình hơn mở rộng ý theo hướng liên quan.Mặc dù liên kết mở rộng được sử dụng trong các thể loại văn học cũng như truyền thông bằng tiếng Anh[12,22], nhưng sự khác nhau rõ nét về cách sử dụng liên kết này giữa người Việt và người Mỹ trong thể loại văn bản giao tiếp thường ngày này cho thấy đặc điểm văn hóa của hai nhóm khách thể nghiên cứu. Sự khác nhau này là một bằng chứng thực nghiệm cho giả thiết về sự khác nhau trong tư duy cũng như trong cách tổ chức và trình bày ý tưởng trong các văn bản nói và viết của người phương Đông, cụ thể là người Việt và người nói tiếng Anh bản ngữ.…”

unclassified

“…Tuy nhiên, trong một phát ngôn đa phương thức, việc sử dụng các biện pháp tu từ như liên tưởng, ẩn dụ, hoán dụ và tương phản đôi khi gây khó khăn cho người đọc trong việc nắm bắt nội dung mà người viết muốn diễn đạt. Hiện tượng này Otto và cs [12]. gọi là "semantic gap" (tạm dịch là khoảng cách ngữ nghĩa).…”

unclassified

See 3 more Smart Citations

Liên Kết Logic Ngữ Nghĩa Trong Văn Bản Đa Phương Thức: So Sánh Giữa Người Việt Và Người Mỹ

Le¹

2020

HueUni-JSSH

View full text Add to dashboard Cite

Bài báo này trình bày các kiểu liên kết logic ngữ nghĩa giữa ngôn ngữ-hỉnh ảnh trong dòng trạng thái trên Facebook của hai nhóm đối tượng nghiên cứu Việt và Mỹ. Bên cạnh kiểu liên kết phóng chiếu, các kiểu bành trướng khác nhau đều được tìm thấy trong các dòng trạng thái được nghiên cứu. Tuy nhiên, người Mỹ có xu hướng hay sử dụng liên kết triển khai chi tiết, trong khi người Việt lại thường mở rộng ý tưởng sang một ý liên quan mới bằng nhiều biện pháp phong phú. Sự khác nhau giữa hai nhóm đối tượng nghiên cứu trong liên kết ngữ nghĩa có ý nghĩa thông báo và định hướng cho vấn đề văn bản đa phương thức trong dạy học ngoại ngữ.

show abstract

Section: Phương Phápunclassified

unclassified

See 2 more Smart Citations

Liên Kết Logic Ngữ Nghĩa Trong Văn Bản Đa Phương Thức: So Sánh Giữa Người Việt Và Người Mỹ

Le¹

2020

HueUni-JSSH

View full text Add to dashboard Cite

show abstract

“…However, none of these studies propose any predictive models for cross-modal correlation categories. Recently, researchers pay more attention to the prediction of the cross-modal correlation categories and expand the existing classification system based on image specificity [13], emotion [14], interrelation metrics [15,16], parallel and non-parallel [17], contextual and semiotic relations [18], visual content contribution [19], etc. They annotate data and train models to predict the cross-modal correlation category around the following tasks: multimodal regression [13] or multimodal classification [14,15,16,17,18,19].…”

Section: Introductionmentioning

confidence: 99%

AnANet: Modeling Association and Alignment for Cross-modal Correlation Classification

Xu¹,

Wang²,

Tian³

et al. 2021

Preprint

View full text Add to dashboard Cite

The explosive increase of multimodal data makes a great demand in many cross-modal applications that follow the strict prior related assumption. Thus researchers study the definition of cross-modal correlation category and construct various classification systems and predictive models. However, those systems pay more attention to the fine-grained relevant types of cross-modal correlation, ignoring lots of implicit relevant data which are often divided into irrelevant types. What's worse is that none of previous predictive models manifest the essence of crossmodal correlation according to their definition at the modeling stage. In this paper, we present a comprehensive analysis of the image-text correlation and redefine a new classification system based on implicit association and explicit alignment. To predict the type of image-text correlation, we propose the Association and Alignment Network according to our proposed definition (namely AnANet) which implicitly represents the global discrepancy and commonality between image and text and explicitly captures the cross-modal local relevance. The experimental results on our constructed new image-text correlation dataset show the effectiveness of our model.

show abstract

A Text-Image Pair Is Not Enough: Language-Vision Relation Inference with Auxiliary Modality Translation

Lu,

Zhang,

et al. 2023

Lecture Notes in Computer Science

View full text Add to dashboard Cite

Characterization and classification of semantic image-text relations

Cited by 18 publications

References 38 publications

Liên Kết Logic Ngữ Nghĩa Trong Văn Bản Đa Phương Thức: So Sánh Giữa Người Việt Và Người Mỹ

Liên Kết Logic Ngữ Nghĩa Trong Văn Bản Đa Phương Thức: So Sánh Giữa Người Việt Và Người Mỹ

AnANet: Modeling Association and Alignment for Cross-modal Correlation Classification

A Text-Image Pair Is Not Enough: Language-Vision Relation Inference with Auxiliary Modality Translation

Contact Info

Product

Resources

About