Từ khóa: Tra cứu ảnh dựa vào nội dung, phản hồi liên quan, truy vấn đa điểm, phân cụm phổ. I. GIỚI THIỆUTra cứu ảnh dựa vào nội dung (CBIR-Content Based Image Retrieval) đã nhận đƣợc nhiều sự quan tâm trong thập kỷ qua, do nhu cầu xử lý hiệu quả lƣợng dữ liệu đa phƣơng tiện khổng lồ và tăng nhanh chóng. Nhiều hệ thống CBIR đã đƣợc phát triển, gồm QBIC, Photobook, MARS, NeTra, PicHunter, Blobworld, VisualSEEK, SIMPLIcity và những hệ thống khác. Trong một hệ thống CBIR tiêu biểu, các đặc trƣng ảnh trực quan mức thấp (tức là màu, kết cấu và hình dạng) đƣợc trích rút tự động cho mục tiêu đánh chỉ số và mô tả ảnh. Đối với cách tiếp cấn truy vấn bởi mẫu, một ảnh truy vấn đƣa vào hệ thống sẽ đƣợc xử lý tƣơng tự nhƣ ảnh cơ sở dữ liệu để sinh ra một véctơ thích hợp. Tra cứu tiếp theo đƣợc thực hiện bằng việc sinh ra một danh sách các ảnh đƣợc phân hạng theo thứ tự giảm dần của độ đo tƣơng tự so với ảnh truy vấn.Là một vấn đề quan trọng trong CBIR, độ đo tƣơng tự lƣợng hóa sự giống nhau về nội dung giữa từng cặp ảnh. Phụ thuộc vào kiểu đặc trƣng mà chúng ta lựa chọn độ đo tƣơng tự thích hợp. Tất cả các kỹ thuật tra cứu dựa vào nội dung hiện nay đều thừa nhận thông tin tƣơng hỗ giữa độ đo tƣơng tự ảnh và ngữ nghĩa của ảnh. Bằng các cách khác nhau, độ đo tƣơng tự cố gắng nắm đƣợc một khía cạnh nào đó của nội dung ảnh, đó là ngữ nghĩa kế thừa từ độ tƣơng tự hay đặc trƣng mức thấp. Tuy nhiên, ngữ nghĩa kế thừa từ độ tƣơng tự nhiều khi không giống với khái niệm mức cao đƣợc truyền tải bởi một ảnh (ngữ nghĩa của ảnh). Đó chính là khoảng cách ngữ nghĩa [7], nó phản ánh sự khác biệt giữa năng lực mô tả hạn chế của đặc trƣng trực quan mức thấp và khái niệm mức cao. Cách tiếp cận dựa vào phản hồi liên quan đối với tra cứu ảnh dựa vào nội dung là một lĩnh vực nghiên cứu tích cực trong mấy năm qua nhằm rút ngắn khoảng cách ngữ nghĩa. Một số nghiên cứu tốt theo cách tiếp cận này có thể tìm thấy trong [1; 3; 8; 10; 11; 13; 14; 16]. Hầu hết các hệ thống CBIR đã có biểu diễn các ảnh bằng các véctơ đặc trƣng sử dụng các đặc trƣng trực quan, trong đó hai véctơ đƣợc coi là gần nhau nếu hai ảnh tƣơng ứng với hai véctơ đó sẽ tƣơng tự nhau hơn. Khi các hệ thống CBIR đƣa ra một tập các ảnh đƣợc xem là tƣơng tự với một ảnh truy vấn đã cho, ngƣời dùng có thể lấy ra các ảnh liên quan nhất đối với truy vấn đã cho và hệ thống điều chỉnh lại truy vấn sử dụng các ảnh liên quan mà ngƣời dùng vừa chọn. Các kỹ thuật CBIR dựa vào phản hồi liên quan không yêu cầu ngƣời dùng cung cấp các truy vấn khởi tạo chính xác nhƣng yêu cầu ngƣời dùng xây dựng truy vấn lý tƣởng thông qua đánh giá các ảnh là liên quan hay không.Các cách tiếp cận đối với CBIR giả thiết rằng, về nguyên tắc các ảnh liên quan gần với ảnh truy vấn trong không gian đặc trƣng nào đó. Tuy nhiên, sự tƣơng tự giữa các ảnh mà con ngƣời nhận thức lại có sự khác biệt với khoảng cách giữa chúng trong không gian đặc trƣng. Tức là, các ảnh liên quan về mặt ngữ nghĩa có thể nằm phân tán trong toàn bộ không gian đặc trƣng và nằm rải rác ở một số cụm chứ không phải một cụm. Trong trƣờng hợp này, các cách t...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.