Image retrieval systems adopt a combination of multiple features and then total distance measures of particular features for ranking the results. Therefore, the top-ranked images with smallest total distance measures are returned to the users. However, images with smallest partial distance measures which are suitable for users’ purpose may not be included in these results. Therefore, partial distance measure should be considered. In this paper, we propose to adopt the Pareto set in the distance measure space. This set assures that the returned results contain not only points with smallest total distance obtained by linear combinations, but also other points have smallest partial distance measures which cannot be found by the linear combination in the distance measure space. Especially, the searching space based on the distance measures is compacted by our algorithm, namely PDFA. This algorithm collects all the Pareto set with different depths, and is efficient for the classification and regression tree (CART). The experimental results on three image collections show the effectiveness of our proposed method.
Relevance feedback as a bridge between high level semantic concepts and low features. It is important to improve the performance of content based image retrieval (CBIR) is preprocessing image features and refining distance measures for query based on user information needs. We propose a novel method to normilize features and distance for CBIR using combination features. In addition, we also use relevant feedback from users and learning from low features to update weights distance measures and refine query. Experimental results over the benchmark Corel dataset demonstrate the effectiveness of this propose method.
Từ khóa: Tra cứu ảnh dựa vào nội dung, phản hồi liên quan, truy vấn đa điểm, phân cụm phổ. I. GIỚI THIỆUTra cứu ảnh dựa vào nội dung (CBIR-Content Based Image Retrieval) đã nhận đƣợc nhiều sự quan tâm trong thập kỷ qua, do nhu cầu xử lý hiệu quả lƣợng dữ liệu đa phƣơng tiện khổng lồ và tăng nhanh chóng. Nhiều hệ thống CBIR đã đƣợc phát triển, gồm QBIC, Photobook, MARS, NeTra, PicHunter, Blobworld, VisualSEEK, SIMPLIcity và những hệ thống khác. Trong một hệ thống CBIR tiêu biểu, các đặc trƣng ảnh trực quan mức thấp (tức là màu, kết cấu và hình dạng) đƣợc trích rút tự động cho mục tiêu đánh chỉ số và mô tả ảnh. Đối với cách tiếp cấn truy vấn bởi mẫu, một ảnh truy vấn đƣa vào hệ thống sẽ đƣợc xử lý tƣơng tự nhƣ ảnh cơ sở dữ liệu để sinh ra một véctơ thích hợp. Tra cứu tiếp theo đƣợc thực hiện bằng việc sinh ra một danh sách các ảnh đƣợc phân hạng theo thứ tự giảm dần của độ đo tƣơng tự so với ảnh truy vấn.Là một vấn đề quan trọng trong CBIR, độ đo tƣơng tự lƣợng hóa sự giống nhau về nội dung giữa từng cặp ảnh. Phụ thuộc vào kiểu đặc trƣng mà chúng ta lựa chọn độ đo tƣơng tự thích hợp. Tất cả các kỹ thuật tra cứu dựa vào nội dung hiện nay đều thừa nhận thông tin tƣơng hỗ giữa độ đo tƣơng tự ảnh và ngữ nghĩa của ảnh. Bằng các cách khác nhau, độ đo tƣơng tự cố gắng nắm đƣợc một khía cạnh nào đó của nội dung ảnh, đó là ngữ nghĩa kế thừa từ độ tƣơng tự hay đặc trƣng mức thấp. Tuy nhiên, ngữ nghĩa kế thừa từ độ tƣơng tự nhiều khi không giống với khái niệm mức cao đƣợc truyền tải bởi một ảnh (ngữ nghĩa của ảnh). Đó chính là khoảng cách ngữ nghĩa [7], nó phản ánh sự khác biệt giữa năng lực mô tả hạn chế của đặc trƣng trực quan mức thấp và khái niệm mức cao. Cách tiếp cận dựa vào phản hồi liên quan đối với tra cứu ảnh dựa vào nội dung là một lĩnh vực nghiên cứu tích cực trong mấy năm qua nhằm rút ngắn khoảng cách ngữ nghĩa. Một số nghiên cứu tốt theo cách tiếp cận này có thể tìm thấy trong [1; 3; 8; 10; 11; 13; 14; 16]. Hầu hết các hệ thống CBIR đã có biểu diễn các ảnh bằng các véctơ đặc trƣng sử dụng các đặc trƣng trực quan, trong đó hai véctơ đƣợc coi là gần nhau nếu hai ảnh tƣơng ứng với hai véctơ đó sẽ tƣơng tự nhau hơn. Khi các hệ thống CBIR đƣa ra một tập các ảnh đƣợc xem là tƣơng tự với một ảnh truy vấn đã cho, ngƣời dùng có thể lấy ra các ảnh liên quan nhất đối với truy vấn đã cho và hệ thống điều chỉnh lại truy vấn sử dụng các ảnh liên quan mà ngƣời dùng vừa chọn. Các kỹ thuật CBIR dựa vào phản hồi liên quan không yêu cầu ngƣời dùng cung cấp các truy vấn khởi tạo chính xác nhƣng yêu cầu ngƣời dùng xây dựng truy vấn lý tƣởng thông qua đánh giá các ảnh là liên quan hay không.Các cách tiếp cận đối với CBIR giả thiết rằng, về nguyên tắc các ảnh liên quan gần với ảnh truy vấn trong không gian đặc trƣng nào đó. Tuy nhiên, sự tƣơng tự giữa các ảnh mà con ngƣời nhận thức lại có sự khác biệt với khoảng cách giữa chúng trong không gian đặc trƣng. Tức là, các ảnh liên quan về mặt ngữ nghĩa có thể nằm phân tán trong toàn bộ không gian đặc trƣng và nằm rải rác ở một số cụm chứ không phải một cụm. Trong trƣờng hợp này, các cách t...
Đã có nhiều phương pháp tra cứu ảnh phản hồi liên quan sử dụng máy véctơ chỗ trợ (SVM). Tuy nhiên, các phương pháp này chưa quan tâm đến sự cân bằng của hai lớp trong quá trình phản hồi của người dùng dẫn đến độ chính xác thấp. Trong bài báo này, chúng tôi đề xuất một phương pháp tra cứu ảnh phản hồi liên quan hiệu quả, gọi là RFBC (Image retrieval using relevance feedback with balanced classes), cho phép nâng cao độ chính xác hệ thống tra cứu ảnh thông qua việc cân bằng số mẫu trong mỗi lớp của tập ví dụ huấn luyện. Phương pháp của chúng tôi tận dụng sự đánh giá của người dùng để xác định vị trí có thể thu được hai lớp có số lượng mẫu cân bằng. Chúng tôi cũng cung cấp các kết quả thực nghiệm trên cơ sở dữ liệu đặc trưng gồm 10800 ảnh để chỉ ra độ chính xác của phương pháp. Từ khóa: Tra cứu ảnh dựa vào nội dung, không gian đặc trưng, truy vấn tối ưu, phản hồi liên quan với các lớp cân bằng.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.