Công tác lưu trữ hồ sơ tại các cơ quan, tổ chức có thẩm quyền là một vấn đề cần thiết trong việc quản lý và tổ chức bảo quản tài liệu. Tuy nhiên, hiện nay với số lượng hồ sơ lưu trữ ngày càng nhiều và có nhiều loại văn bản quy định lưu trữ khác nhau dẫn đến việc tình trạng quá tải tài liệu trong quá trình lưu trữ. Do đó, việc phân loại hồ sơ theo thời hạn bảo quản là một công đoạn rất quan trọng trong việc bảo quản, góp phần tối ưu hóa thành phần trong các phòng lưu trữ, tiết kiệm chi phí bảo quản tài liệu. Để góp phần giải quyết được vấn đề trên, trong bài báo này, chúng tôi trình bày nghiên cứu đánh giá sự hiệu quả của mô hình BERT so sánh với các thuật toán máy học truyền thống và mô hình học sâu trên các bộ dữ liệu thực tế hồ sơ lưu trữ theo thời hạn bảo quản ở các cơ quan. Kết quả nghiên cứu cho thấy rằng, mô hình BERT đạt kết quả tốt nhất với độ chính xác là 93,10%, độ phủ là 90,68% và độ đo F1 là 91,49%. Kết quả này cho thấy rằng, mô hình BERT có thể được áp dụng để xây dựng các hệ thống hỗ trợ phân loại hồ sơ theo thời hạn bảo quản là hoàn toàn khả thi.
Trong vài năm gần đây, các trường đại học thường khảo sát, thu thập ý kiến của sinh viên để nâng cao hiệu quả giảng dạy và cải thiện chất lượng đào tạo. Tuy nhiên việc phân tích một cách thủ công sẽ tốn nhiều chi phí về công sức và thời gian khi kích thước phản hồi lớn. Do đó, trong bài báo này, chúng tôi giới thiệu một bộ dữ liệu trên phản hồi của sinh viên cho bài toán phát hiện khía cạnh và phân loại cảm xúc theo khía cạnh. Bộ dữ liệu của chúng tôi bao gồm 5010 câu được gán nhãn theo 11 khía cạnh khác nhau (hành vi, kỹ năng giảng dạy…) và theo ba cảm xúc (tích cực, tiêu cực và trung tính) với độ đồng thuận là 88,95% và 80,52% tương ứng hai bài toán. Bên cạnh đó, chúng tôi cũng trình bày một chuỗi thí nghiệm dựa trên bộ dữ liệu dựa trên mô hình kết hợp BiLSTM-CNN so sánh với các mô hình máy học khác. Kết quả nghiên cứu cho thấy rằng phương pháp kết hợp BiLSTM-CNN đạt kết quả tốt hơn các phương pháp khác với chỉ số F1 là 78,93% và 73,78% tương ứng cho bài toán phát hiện khía cạnh và phân loại trạng thái cảm xúc theo khía cạnh. Kết quả thử nghiệm chứng minh tính hiệu quả của kiến trúc tổng thể của chúng tôi.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.