TÓM TẮT -Kỹ thuật phân rã ma trận (matrix factorization -MF) là một kỹ thuật được sử dụng phổ biến trong hệ thống gợi ý (Recommender Systems -RS). Hiện nay đã có rất nhiều thuật toán biến thể và hướng tiếp cận được phát triển dựa trên kỹ thuật này
I. GIỚI THIỆUHệ thống gợi ý (Recommender Systems -RS) đã được ứng dụng rất rộng rãi trong các hệ thống thông tin thuộc nhiều lĩnh vực khác nhau, nó giúp giải quyết được vấn đề quá tải về thông tin và giúp lựa chọn thông tin một cách nhanh chóng bằng cách trình bày nội dung gợi ý phù hợp với từng người dùng. Để cung cấp cho người dùng những thông tin gợi ý hiệu quả thì mỗi hệ thống gợi ý cần có một mô hình gợi ý có thể khai thác tốt được dữ liệu đã thu thập để đưa ra các gợi ý phù hợp cho từng người dùng, do đó việc lựa chọn thuật toán xây dựng mô hình gợi ý là rất quan trọng.Trong RS đã có rất nhiều giải thuật được đề xuất, tuy nhiên ta có thể gom chúng vào trong ba nhóm chính (xem Nhóm giải thuật lọc trên nội dung (Content-based Filtering): Thực hiện việc gợi ý các mục dữ liệu (item) dựa vào hồ sơ (profiles) của người dùng hoặc dựa vào thuộc tính (attributes) của những item tương tự như item mà người dùng đã chọn trong quá khứ. Nhóm giải thuật lọc cộng tác (Collaborative Filtering): Các giải thuật trong nhóm này chủ yếu dựa trên các kỹ thuật: phương pháp láng giềng (Neighborhood-based) là dựa vào dữ liệu quá khứ của những người dùng "tương tự" (user-based approach) hoặc dựa trên dữ liệu quá khứ của những item "tương tự" (item-based apprach); dựa trên mô hình (Model-based): nhóm này xây dựng các mô hình dự đoán dựa trên dữ liệu thu thập được trong quá khứ. Nhóm kết hợp cả 2 cách trên. Trong nhóm giải thuật lọc cộng tác dựa trên mô hình thì kỹ thuật phân rã ma trận (matrix factorization -MF) là một trong những phương pháp thành công nhất hiện nay (state-of-the-art) trong lĩnh vực dự đoán xếp hạng của RS [3], [4]. Tuy nhiên, đa số các giải thuật thuộc nhóm MF chỉ tập trung khai thác thông tin của một mối quan hệ đơn giữa người dùng (user) và mục dữ liệu (item) chẳng hạn quan hệ đánh giá (rating), do đó các giải thuật chưa tận dụng được hết các thông tin liên quan từ các mối quan hệ khác của user và item. Để tận dụng hết các thông tin, người ta đã đề xuất phương pháp phân rã ma trận đa quan hệ (multi-relational matrix factorization -MRMF) như trong [5], [6], mặc dù vậy trong các nghiên cứu này, công thức dùng cho dự đoán vẫn chưa bao gồm hết thông tin từ các ma trận nhân tố tiềm ẩn (sẽ được phân tích sau).Trong bài viết này, chúng tôi sẽ đề xuất một hướng tiếp cận đa quan hệ cho hệ thống gợi ý cho phép tận dụng được thông tin từ nhiều mối quan hệ khác nhau của user và item trong quá trình xây dựng mô hình và đưa ra gợi ý, từ đó xây dựng thuật toán cho hướng tiếp cận đã đề xuất. Chúng tôi đã thực nghiệm trên các tập dữ liệu chuẩn trong lĩnh vực Hệ thống gợi ý và cả lĩnh vực Hệ trợ giảng thông minh để đánh giá độ chính xác của mô hình thông qua chỉ số RMSE (Root Mean Squared Error). Kết quả cho thấy hướng tiếp cận được đề xuất rất có thể giúp cải thiện độ chính xác.
II. ...