“…Tuy vậy, chỉ ra rằng hoàn toàn có thể sử dụng phương pháp binning và đưa về dạng dữ liệu một chiều (One single Dimension, hay 1D) để cắt giảm lượng dữ liệu nhiễu nhờ một mô hình học không giám sát, hứa hẹn sẽ tiết kiệm bộ nhớ mà việc huấn luyện vẫn đạt được một hiệu quả nhất định (Lin, 2015). Bài viết này không đi mô tả chi tiết về toán bên dưới mà chỉ xem xét đề cập đến các bước làm để từ bộ dữ liệu mã gen với số lượng khổng lồ, đưa về dữ liệu thu gọn 1D, ở đây sẽ giới thiệu về mô hình tự động tế bào 1D-One-Dimensional Cellular Automaton (Umeo, Kamikawa, Nishioka, & Akiguchi, 2009). Cellata automaton là các mô hình rời rạc cho các hệ thống động, nó được giới thiệu dưới dạng một bài toán với một bảng hai chiều, với mỗi ô có mang một số lượng trạng thái nhất định, với mỗi lần lặp thì mỗi ô sẽ lan truyền sang "hàng xóm" với một quy tắc (chính xác là một hàm toán học) được định trước và sau một số lần lặp nhất định, bảng kết quả phản ánh được mức độ ảnh hưởng lẫn nhau của bộ dữ liệu.…”