Tuổi phát triển của sâm (Cultivation ages of ginseng – CAG) là yếu tố quan trọng ảnh hưởng đến chất lượng và giá thành của sâm. Những tiến bộ gần đây trong khoa học dữ liệu đã tạo ra những lợi ích to lớn cho đa dạng các ứng dụng thực tế. Trong lĩnh vực khoa học dữ liệu, học máy đóng một vai trò quan trọng để khám phá thông tin chi tiết từ dữ liệu. Nghiên cứu này dựa trên cơ sở dữ liệu thực nghiêm thu thập được nhằm xây dựng và đánh giá hiệu suất của 3 mô hình máy học: Tăng cường độ dốc cực cao - Extreme Gradient Boosting (XGB), Tăng cường độ dốc nhẹ - Light Gradient Boosting (LGB) và Tăng cường độ dốc - Gradient Boosting (GB) trong việc dự đoán CAG. Các mô hình được phát triển dựa trên 106 mẫu dữ liệu với chín tham số đầu vào và một tham số đầu ra. Kỹ thuật xác thực chéo K-lần được sử dụng để nâng cao khả năng tổng quát hóa và hiệu suất dự đoán của mô hình. Quan trọng hơn, trong nghiên cứu này XGB mô hình được tối ưu hóa để chọn siêu tham số. Dự báo hiệu suất của tối ưu XGB mô hình được so sánh với 2 mô hình LGB và GB. Kết quả cho thấy XGB là mô hình tốt nhất với hiệu suất dự đoán rất cao (R2=0,964; RMSE=0,148 năm, MAE=0,107 năm). Ngoài ra, kỹ thuật tầm quan trọng của tính năng (Feature importance) được thực hiện để đánh giá ảnh hưởng của các biến đầu vào đối với CAG dự đoán.
Tuổi phát triển của sâm (Cultivation ages of ginseng – CAG) là yếu tố quan trọng ảnh hưởng đến chất lượng và giá thành của sâm. Những tiến bộ gần đây trong khoa học dữ liệu đã tạo ra những lợi ích to lớn cho đa dạng các ứng dụng thực tế. Trong lĩnh vực khoa học dữ liệu, học máy đóng một vai trò quan trọng để khám phá thông tin chi tiết từ dữ liệu. Nghiên cứu này dựa trên cơ sở dữ liệu thực nghiêm thu thập được nhằm xây dựng và đánh giá hiệu suất của 3 mô hình máy học: Tăng cường độ dốc cực cao - Extreme Gradient Boosting (XGB), Tăng cường độ dốc nhẹ - Light Gradient Boosting (LGB) và Tăng cường độ dốc - Gradient Boosting (GB) trong việc dự đoán CAG. Các mô hình được phát triển dựa trên 106 mẫu dữ liệu với chín tham số đầu vào và một tham số đầu ra. Kỹ thuật xác thực chéo K-lần được sử dụng để nâng cao khả năng tổng quát hóa và hiệu suất dự đoán của mô hình. Quan trọng hơn, trong nghiên cứu này XGB mô hình được tối ưu hóa để chọn siêu tham số. Dự báo hiệu suất của tối ưu XGB mô hình được so sánh với 2 mô hình LGB và GB. Kết quả cho thấy XGB là mô hình tốt nhất với hiệu suất dự đoán rất cao (R2=0,964; RMSE=0,148 năm, MAE=0,107 năm). Ngoài ra, kỹ thuật tầm quan trọng của tính năng (Feature importance) được thực hiện để đánh giá ảnh hưởng của các biến đầu vào đối với CAG dự đoán.
Tuổi phát triển của sâm (Cultivation ages of ginseng – CAG) là yếu tố quan trọng ảnh hưởng đến chất lượng và giá thành của sâm. Những tiến bộ gần đây trong khoa học dữ liệu đã tạo ra những lợi ích to lớn cho đa dạng các ứng dụng thực tế. Trong lĩnh vực khoa học dữ liệu, học máy đóng một vai trò quan trọng để khám phá thông tin chi tiết từ dữ liệu. Nghiên cứu này dựa trên cơ sở dữ liệu thực nghiêm thu thập được nhằm xây dựng và đánh giá hiệu suất của 3 mô hình máy học: Tăng cường độ dốc cực cao - Extreme Gradient Boosting (XGB), Tăng cường độ dốc nhẹ - Light Gradient Boosting (LGB) và Tăng cường độ dốc - Gradient Boosting (GB) trong việc dự đoán CAG. Các mô hình được phát triển dựa trên 106 mẫu dữ liệu với chín tham số đầu vào và một tham số đầu ra. Kỹ thuật xác thực chéo K-lần được sử dụng để nâng cao khả năng tổng quát hóa và hiệu suất dự đoán của mô hình. Quan trọng hơn, trong nghiên cứu này XGB mô hình được tối ưu hóa để chọn siêu tham số. Dự báo hiệu suất của tối ưu XGB mô hình được so sánh với 2 mô hình LGB và GB. Kết quả cho thấy XGB là mô hình tốt nhất với hiệu suất dự đoán rất cao (R2=0,964; RMSE=0,148 năm, MAE=0,107 năm). Ngoài ra, kỹ thuật tầm quan trọng của tính năng (Feature importance) được thực hiện để đánh giá ảnh hưởng của các biến đầu vào đối với CAG dự đoán.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.