Learning Deep Architectures for AI

Bengio, Yoshua

doi:10.1561/2200000006

Cited by 6,621 publications

(3,697 citation statements)

References 127 publications

Supporting

Mentioning

3,611

Contrasting

Unclassified

Order By: Relevance

“…Deep learning là một tập các thuật toán học máy với ý tưởng xây dựng mô hình dữ liệu có mức độ trừu tượng cao dựa trên các dữ liệu có mức độ trừu tượng hóa thấp hơn, bằng cách phân lớp dữ liệu và các biến đổi phi tuyến [3].…”

Section: Deep Learningunclassified

“…Các mô hình học sâu có kiến trúc tương tự mạng nơron nhưng dựa trên cách tiếp cận khác, với ý tưởng cơ bản là dữ liệu tại mỗi lớp sẽ có mức độ trừu tượng hóa (khái quát) cao hơn bằng cách tổ hợp các dữ liệu có mức trừu tượng hóa thấp ở lớp trước [3]. Hình 4 biểu diễn một mô hình học sâu tiêu biểu [9] sử dụng trong nhận dạng mặt người, trong đó dữ liệu đầu vào của mạng có thể là dữ liệu ở dạng thô nhất là các điểm ảnh RGB (thậm chí không cần qua tiền xử lý).…”

Section: Hình 5 Cấu Trúc Dnn 3 Lớp ẩN Cho Bài Toán Dự Báo Lượng Nướcunclassified

See 1 more Smart Citation

Deep Learning: Ứng Dụng Cho Dự Báo Lưu Lượng Nước Đến Hồ Chứa Hòa Bình

Nam¹,

Tùng²

2017

Fair - Nghiên Cứu Cơ Bản Và Ứng Dụng Công Nghệ Thông Tin - 2016

View full text Add to dashboard Cite

Từ khóa-Deep learning, mạng nơron, máy véctơ hỗ trợ, rừng ngẫu nhiên, LASSO, khai phá dữ liệu, học máy. I. ĐẶT VẤN ĐỀHồ chứa Hòa Bình là hồ chứa lớn nhất Việt Nam nằm trên dòng sông Đà, cách Hà Nội khoảng 70km, hệ thống thủy điện của hồ Hòa Bình được đưa vào vận hành từ năm 1990 giữ vai trò quan trọng trong kiểm soát lũ, hạn hán và cung cấp điện cho đồng bằng châu thổ sông Hồng. Dung tích hồ là 9.6*10 9 m 3 với khả năng xả lớn nhất đạt 2,400 m 3 /s. Điều tiết nước trong mùa lũ luôn là bài toán quan trọng trong vận hành hồ chứa, việc dự báo chính xác lưu lượng nước đổ về hồ chứa trước một khoảng thời gian chủ động luôn là thách thức lớn đối với nhà quản lý trong công tác vận hành tổ hợp công trình tại thủy điện Hòa Bình.Dự báo chính xác lưu lượng là yêu cầu chủ yếu trong việc xây dựng thành công một hệ thống quản lý và giảm nhẹ ảnh hưởng của lũ, an toàn hồ đập trong một lưu vực sông. Các phương pháp học máy tiếp cận bài toán dự báo lưu lượng nước đổ về hồ chứa đã được nghiên cứu và đạt được nhiều kết quả khả quan [17,18,19]. Mạng nơron (neural) nhân tạo (ANN) được chứng minh bằng thực nghiệm cho thấy là một trong các phương pháp hiệu quả nhất và được dùng nhiều trong tính toán dự báo dạng chuỗi thời gian đối với bài toán thuộc dạng này [18,[20][21][22][23][24]. Trong những năm gần đây, phương pháp Deep learning (Học sâu) dựa trên nền tảng mạng nơron nhân tạo đang phát triển rất nhanh và thu hút đông đảo cộng đồng nghiên cứu tham gia. Trong nghiên cứu này, phương pháp Deep learning được nghiên cứu để phân tích, dự báo trung hạn lưu lượng nước đổ về hồ Hòa Bình trước 10 ngày, từ đó trợ giúp công tác hỗ trợ ra quyết định trong điều hành hồ chứa; phương pháp Deep learning cũng có thể mở rộng với các bài toán dự báo lưu lượng tại các hồ chứa khác của Việt Nam phục vụ phòng, tránh và giảm nhẹ thiên tai.Bài toán dự báo lượng nước đổ về hồ Hòa Bình thường dựa trên vào các dữ liệu quan sát được trong quá khứ và các yếu tố tác động đến lưu lượng nước đổ về hồ. Dự báo lưu lượng nước sẽ chịu tác động của nhiều yếu tố ảnh hưởng đến kết quả dự báo như mưa, dòng chảy, địa hình, thảm phủ thực vật, độ ẩm, khí hậu và các tác động của con người trên lưu vực,… Trong những yếu tố đó thì mưa đóng vai trò quan trọng nhất, còn các yếu tố về địa chất, thổ nhưỡng, thảm phủ thực vật ít thay đổi, nghiên cứu này chưa xét đến yếu tố khí hậu và tác động của con người làm thay đổi lưu vực. Chúng tôi tập trung nghiên cứu vào xây dựng mô hình Deep learning cải thiện chất lượng bài toán dự báo lưu lượng nước đến hồ Hòa Bình dựa trên số liệu mưa quan trắc được và các quan sát lưu lượng nước về hồ trong quá khứ.Các số liệu quan trắc về lượng mưa là những yếu tố quan trọng ảnh hưởng trực tiếp đến chất lượng dự báo. Hình 1 mô tả quá trình thu thập số liệu quan trắc theo chuỗi thời gian, thông thường ta xét trong 1 khoảng thời gian cố định (cửa sổ trượt) có dữ liệu quan sát phản ánh đủ những kịch bản dự báo. Những dữ liệu này được gọi chung là tập dữ liệu huấn luyện hay dữ liệu để học mô hình dự báo. Ta ký hiệu tập dữ liệu đầu vào này là *( ) ( ) ( ), ...

show abstract

Section: Deep Learningunclassified

Section: Hình 5 Cấu Trúc Dnn 3 Lớp ẩN Cho Bài Toán Dự Báo Lượng Nướcunclassified

Deep Learning: Ứng Dụng Cho Dự Báo Lưu Lượng Nước Đến Hồ Chứa Hòa Bình

Nam¹,

Tùng²

2017

Fair - Nghiên Cứu Cơ Bản Và Ứng Dụng Công Nghệ Thông Tin - 2016

View full text Add to dashboard Cite

show abstract

“…Deep learning takes advantage of unlabeled data to learn a good representation of the features space [2] -each layer representing another abstraction of the features pre-trained from a previous layer. Layer-wise, bottom-up pre-training (one layer at a time) is possible by incorporating Restrictive Boltzman Machines (RBM) or Autoencoders (AE) [3].…”

Section: Unsupervised Feature Learningmentioning

confidence: 99%

Pre-Trained Deep Neural Network Using Sparse Autoencoders and Scattering Wavelet Transform for Musical Genre Recognition

Kle

Kor

2015

csci

View full text Add to dashboard Cite

Research described in this paper tries to combine the approach of Deep Neural Networks (DNN) with the novel audio features extracted using the Scattering Wavelet Transform (SWT) for classifying musical genres. The SWT uses a sequence of Wavelet Transforms to compute the modulation spectrum coefficients of multiple orders, which has already shown to be promising for this task. The DNN in this work uses pre-trained layers using Sparse Autoencoders (SAE). Data obtained from the Creative Commons website jamendo.com is used to boost the well-known GTZAN database, which is a standard benchmark for this task. The final classifier is tested using a 10-fold cross validation to achieve results similar to other state-of-the-art approaches.

show abstract

“…One hypothesis by Bengio et al [1,2] on why the greedy layer-wise pretraining helps in semi-supervised learning is that stacking of unsupervised neural networks disentangles factors of variations and that the untangled representations make discriminative learning easier. With only a linear mapping, followed by a non-linear transfer function, the complexity of the local recodings is limited, however.…”

Section: Unsupervised Pretraining and Supervised Finetuning Of Deep Mlpsmentioning

confidence: 99%

“…While networks with a single-possibly very widehidden layer suffice in principle, deep networks-having multiple hidden layers-can be much more efficient. Without proper initialization or regularization it is, however, difficult to achieve good generalization with deep MLPs (see, e.g., [1]). …”

Section: Introductionmentioning

confidence: 99%

Two-Layer Contractive Encodings with Shortcuts for Semi-supervised Learning

Schulz

Cho

Raiko

et al. 2013

Neural Information Processing

View full text Add to dashboard Cite

Abstract. Supervised training of multi-layer perceptrons (MLP) with only few labeled examples is prone to overfitting. Pretraining an MLP with unlabeled samples of the input distribution may achieve better generalization. Usually, pretraining is done in a layer-wise, greedy fashion which limits the complexity of the learnable features. To overcome this limitation, two-layer contractive encodings have been proposed recently-which pose a more difficult optimization problem, however. On the other hand, linear transformations of perceptrons have been proposed to make optimization of deep networks easier. In this paper, we propose to combine these two approaches. Experiments on handwritten digit recognition show the benefits of our combined approach to semi-supervised learning.

show abstract

Learning Deep Architectures for AI

Cited by 6,621 publications

References 127 publications

Deep Learning: Ứng Dụng Cho Dự Báo Lưu Lượng Nước Đến Hồ Chứa Hòa Bình

Deep Learning: Ứng Dụng Cho Dự Báo Lưu Lượng Nước Đến Hồ Chứa Hòa Bình

Pre-Trained Deep Neural Network Using Sparse Autoencoders and Scattering Wavelet Transform for Musical Genre Recognition

Two-Layer Contractive Encodings with Shortcuts for Semi-supervised Learning

Contact Info

Product

Resources

About