Mới đây, các nhà nghiên cứu đến từ dự án DeepMind của Google đã phối hợp cùng với trường Đại học Toronto với dự án AI mang tên "Dreamer" - nhằm thử nghiệm tính hiệu quả của phương thức học tăng cường (reinforcement learning) đối với trí tuệ nhân tạo. Thiết kế của Dreamer tập trung vào việc dựa vào những gì máy nghiên cứu và học được trong quá khứ để đưa ra những lựa chọn cho vấn đề dựa theo "suy đoán" về kết quả tương lai.
Dự án Dreamer cho thấy trí tuệ nhân tạo này đạt hiệu quả rất tốt trong việc xử lý dữ liệu.
Theo lời các nhà nghiên cứu, kết quả bước đầu của dự án Dreamer cho thấy trí tuệ nhân tạo này đạt hiệu quả rất tốt trong việc xử lý dữ liệu, cũng như có được hiệu năng khá tốt trong tính toán và xử lý - so với các phương pháp tiếp cận bằng AI trước đây.
Về cơ bản, Dreamer sử dụng mô hình hoạt động với cấu trúc nhiều phần phức tạp. Một phần của hệ thống đảm nhận việc mã hóa các quan sát cũng như hành động của hệ thống. Một phần khác sẽ dự đoán các trạng thái kết quả của vấn đề cần giải quyết. Phần thứ ba sẽ đưa ra giá trị đánh giá về các trạng thái của vấn đề, sau đó căn cứ vào kết quả này để đưa ra phương án học tập dành cho hệ thống - với mục tiêu là dự báo ra được các bước để giải quyết vấn đề. Hệ thống AI của Dreamer sẽ dựa trên những input có sẵn để "lên kế hoạch" và dự báo cho hệ thống trước về những kết quả có thể xảy ra, cùng với "phần thưởng" của từng kết quả.
Các bài tập mà AI Dreamer thực hiện.
Trong thí nghiệm của mình, các nhà nghiên cứu thử nghiệm hệ thống Dreamer trên 20 bài tập trong chương trình giả lập DeepMind Control Suite. Kết quả mà họ thu được là Dreamer mất trung bình 9 tiếng để đạt được kết quả 106 bước, bằng một nửa thời gian mà PlaNet - AI tiền nhiệm của dự án này - cần để có thể đạt được kết quả tương tự.
Theo như các nhà nghiên cứu, AI Dreamer hiệu quả trong việc sử dụng các mô hình có sẵn để dự báo chính xác những gì chúng cần phải làm để giải quyết các vấn đề - kể cả khi chúng chưa từng gặp phải những vấn đề này bao giờ. Không chỉ vậy, Dreamer cũng tỏ ra hiệu quả đối với các kế hoạch ngắn hạn, khi so sánh kết quả của 20 bài tập với những AI cũ, Dreamer hoàn thành nhanh hơn 16/20 bài tập, và đạt kết quả hòa ở 4 bài tập còn lại.
Nếu bạn là một nhà nghiên cứu AI và tò mò về dự án này, thì mã nguồn của Dreamer hiện đang được đăng tải công khai trên trang Github của dự án.