Abstract—Nowadays, machine learning and deep learning have been widely employed. User privacy is an issue to consider in problems such as medicine, and finance. Machine learning models not only require accurate predictions but also ensure the privacy and security of data for users. In this paper, we propose a method to ensure the privacy for training and using deep learning models that employs a homomorphic encryption scheme based on the conjugate search problem. This method implements encryption on the data before transferring them to a cloud server, which stores local deep learning models from participants to predict the encrypted data, then the encrypted prediction results are sent back to users, and they perform decryption to get the model’s prediction result. These results can also be assembled to create a new training dataset for a model from the client. It is evident that our proposed model on the MNIST dataset produces an accuracy over 98% with some very simple network architectures and approximates the accuracy of centralized complex models, which does not ensure privacy. Tóm tắt— Hiện nay, học máy và học sâu nói chung đã và đang được ứng dụng rất rộng rãi. Tuy nhiên, trong nhiều bài toán như y tế, tài chính, dữ liệu riêng tư của người dùng là một vấn đề cần xem xét. Các mô hình học máy không chỉ yêu cầu dự đoán chính xác mà còn cần đảm bảo được tính riêng tư và bảo mật của dữ liệu cho người dùng. Trong bài báo này, nhóm tác giả trình bày một phương pháp đảm bảo tính riêng tư cho việc huấn luyện và sử dụng các mô hình học máy đặc biệt là học sâu sử dụng hệ mã hóa đồng cấu dựa trên bài toán tìm kiếm liên hợp. Phương pháp pháp mã hóa đồng cấu này thực hiện mã hóa dữ liệu trước khi gửi lên các máy chủ đám mây, nơi lưu trữ mô hình học học sâu cục bộ của các bên tham gia để đưa ra các dự đoán tương ứng trên dữ liệu đầu vào ở dạng mã hóa, sau đó kết quả dự đoán sẽ được trả về người dùng và người dùng thực hiện giả mã để nhận được kết quả dự đoán của mô hình. Các kết quả này cũng có thể được xây dựng thành một bộ dữ liệu huấn luyện để thực hiện quá trình xây dựng và huấn luyện lại một mô hình cho máy khách. Nhóm tác giả chỉ ra rằng, mô hình đề xuất của nhóm tác giả trên bộ dữ liệu chuẩn MNIST cho độ chính xác lên tới gần 99% với kiến trúc mạng rất đơn giản và gần như có độ chính xác xấp xỉ với các mô hình phức tạp tập trung không đảm bảo tính riêng tư cho dữ liệu.
Abstract— Data mining has emerged as an important technology for obtaining knowledge from big data. However, there are growing concerns that the use of this technology is infringing on privacy. This work proposes a decision tree mining solution according to the ID3 algorithm that ensures privacy in the 2-Part Fully Distributed setting.Tóm tắt— Khai phá dữ liệu đã nổi lên như một công nghệ quan trọng để thu thập kiến thức từ lượng dữ liệu khổng lồ. Tuy nhiên, ngày càng có nhiều lo ngại rằng việc sử dụng công nghệ này đang vi phạm quyền riêng tư của cá nhân. Bài báo này đề xuất giải pháp khai phá cây quyết định theo thuật toán ID3 có đảm bảo tính riêng tư trong mô hình phân tán đầy đủ hai bên.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.