Tốc độ giải phương trình tăng 1.000 lần, mà tỷ lệ mắc lỗi giảm tới 30%.
Trừ khi bạn là nhà vật lý học hay một kỹ sư công nghệ, nếu không bạn chẳng cần phải biết đến phương trình vi phân riêng phần làm gì. Đến cả Karen Hao, phóng viên kỳ cựu mảng AI của MIT, người trực tiếp tiếp xúc với phương trình này hồi còn theo học ngành kỹ sư công nghệ và cũng là tác giả bài viết gốc trên MIT Technology Review, cũng chưa từng ứng dụng phương trình lạ trong đời thực.
Thế nhưng, phương trình vi phân riêng phần, hay gọi tắt là PDE - partial differential equation, vẫn tồn tại và vẫn là một loại ma thuật ít người điều khiển được. PDE là một phương trình toán học mô tả một cách hiệu quả những thay đổi diễn ra trong không gian và thời gian, vậy nên nhân loại vẫn dùng PDE để diễn tả những hiện tượng vật lý trong Vũ trụ. Ta có thể ứng dụng PDE vào rất nhiều các mô hình, từ cách thức hành tinh quay quanh quỹ đạo, sự dịch chuyển của mảng địa chất cho tới nhiễu động không khí quanh thân một chiếc máy bay đang trên không, nhằm dự đoán những sự kiện sẽ diễn ra đồng thời thiết kế máy bay sao cho an toàn.
PDE rất khó giải, để tôi lấy ví dụ để cắt nghĩa khái niệm "giải" trong trường hợp này. Mường tượng ra cảnh bạn đang tạo mô hình giả lập sự nhiễu động của không khí để thử mô hình máy bay mới. Ta có một phương trình PDE có tên Navier-Stokes để mô tả hoạt động của bất thứ dung dịch nào. "Giải" ra phương trình Naniver-Stokes, bạn sẽ có được một khuôn mẫu về chuyển động của không khí trong một thời điểm nhất định, rồi dựa vào đó dựng mô hình về cách thức dòng không khí sẽ chuyển động trong tương lai, hay cách thức gió thổi trong thời điểm trước đó.
Cựu Tổng thống Mỹ Barrack Obama cầm trên tay chiếc áo ghi dòng chữ nhắc tới cả phương trình Navier-Stokes và câu chuyện về nhà tiên tri Moses: "Rồi Moses nói: "phương trình Navier-Stokes". Và nước rẽ ra làm hai!".
Những phép tính này phức tạp và tốn tài nguyên tính toán, ấy là lý do ta dùng siêu máy tính để lập mô hình những quy tắc vốn cần nhiều phương trình PDE. Đây cũng là lý do ngành AI chú tâm nghiên cứu những phương trình này. Nếu ta có thể dùng deep learning để tăng tốc độ giải PDE, ta có thể đẩy nhanh tốc độ phát triển của khoa học và kỹ thuật.
Mới đây, các nhà nghiên cứu tại Caltech công bố một kỹ thuật deep learning mới cho phép máy tính giải PDE chính xác hơn nhiều những cách thức trước đây. Bản chất cách thức mới cũng tổng quát hơn, cho phép ta giải được cả bộ phương trình PDE - ví dụ như phương trình Navier-Stokes ứng dụng lên bất kỳ loại dung dịch nào - mà không cần phải huấn luyện lại AI với một bộ dữ liệu khác. Cuối cùng, tốc độ giải PDE nhanh hơn 1.000 lần so với cách thức trước đây, giúp các nhà nghiên cứu không còn phụ thuộc vào siêu máy tính, đồng thời giúp ta giải được những vấn đề phức tạp hơn.
Tưởng như không liên quan: Rapper huyền thoại lên tiếng chúc mừng
Trước khi tìm hiểu cách thức các nhà nghiên cứu giải PDE, bạn hãy choáng ngợp với kết quả mà nhóm đạt được. Trong tấm ảnh gif bên dưới, bạn có thể thấy mô tả những gì nhóm các nhà khoa học đạt được. Cột đầu tiên cho thấy chuyển động của dung dịch tại một điểm nhất định; cột thứ hai cho thấy quá trình dung dịch chuyển động thực tế, tịnh tiến theo dòng thời gian; cột thứ ba là dự đoán của mạng neural về chuyển động có thể có của dung dịch.
Bạn có thể nhìn ra những điểm tương đồng rõ ràng của cột 2 và cột 3; hệ thống trí tuệ nhân tạo đã dự đoán thành công cách thức dung dịch chuyển động.
Người dùng Twitter hồ hởi trước báo cáo nghiên cứu mới, thậm chí rapper, producer huyền thoại MC Hammer cũng đăng bài chúc mừng đội các nhà khoa học.
Đây là cách họ làm được điều đó
Điều cần hiểu đầu tiên: về cơ bản, một mạng neural là công cụ ước tính hàm cơ bản. Khi tiến hành huấn luyện hệ thống bằng một bộ dữ liệu của cặp đầu vào và đầu ra, thực chất các nhà nghiên cứu cố gắng tính toán ra hàm - một chuỗi các phép tính toán - có thể biến dữ liệu đầu vào thành đầu ra.
Ví dụ, ta có trong tay một cỗ máy nhận dạng mèo. Bạn sẽ huấn luyện mạng neural bằng cách đưa vào hệ thống hình ảnh mèo và những hình ảnh không liên quan - tất cả số dữ liệu này là "đầu vào", và đánh dấu chúng với hai ký tự 1 và 0 - đây là "đầu ra". Mạng neural sẽ tìm ra hàm hợp lý nhất có thể biến mỗi hình ảnh đầu vào thành giá trị "1", và tất cả những dữ liệu không liên quan thành "0". Bằng hàm chính hệ thống tìm ra, nó sẽ nhận ra được chủ thể mèo khi tiếp tục nhìn vào những hình ảnh mới. Nếu quá trình huấn luyện diễn ra trơn tru, hệ thống sẽ có tỷ lệ nhận dạng mèo chính xác cao.
Quá trình tìm ra hàm này là yếu tố quan trọng để các nhà nghiên cứu giải được phương trình PDE. Mục tiêu cuối cùng là tìm ra được một hàm mô tả chính xác nhất chuyển động của các hạt không khí trong không và thời gian.
Đây là điểm then chốt mà báo cáo khoa học nêu lên. Thông thường, mạng neural được dùng để tính xấp xỉ hàm chuyển đổi dữ liệu đầu vào thành đầu ra trong không gian Euclid - chính là đồ thị thông dụng với các trục x, y và z. Nhưng lần này, các nhà khoa học quyết định xác định giá trị đầu vào và đầu ra trong không gian Fourier, là biểu đồ thường được dùng trong mô tả tần số sóng. Nhờ có sự hậu thuẫn từ các nghiên cứu trong mảng khác, cho rằng chuyển động không khí có thể được mô tả là tập hợp của một loạt các tần số sóng, các nhà khoa học quyết định tách khỏi lối suy nghĩ cũ. Chuyển động thường thấy của gió ở mức vĩ mô sẽ tương tự với những sóng tần số thấp và dài, trong khi đó những cơn gió thoảng xuất hiện vi mô sẽ là những sóng có tần số cao, ngắn và nhanh.
Hình minh họa nhiễu động không khí.
Điểm quan trọng của những yếu tố này? Vì trong không gian Fourier, ta sẽ dễ ước tính hàm Fourier hơn là giải PDE trong không gian Euclid, nhờ đó ta đơn giản hóa được công việc mạng neural phải thực hiện. Bên cạnh tốc độ tính nhanh hơn, phương thức mới giải phương trình Navier-Stokes ra ít lỗi hơn khoảng 30% so với các phương pháp deep learning trước đây.
Cách thức giải này khéo léo tuyệt vời, mà lại có thể áp dụng đại trà hơn. Những phương pháp deep learning trước đây yêu cầu các nhà nghiên cứu sử dụng một bộ dữ liệu cho mỗi dung dịch khác nhau, còn hệ thống mới chỉ cần qua một lần huấn luyện để tìm ra chuyển động của tất cả các dung dịch. Dù rằng nhóm nghiên cứu chưa ứng dụng được lên nhiều thứ khác, khả năng hiện tại sẽ cho phép hệ thống giải được những phương trình PDE liên quan tới hoạt động địa chấn hoặc khả năng truyền nhiệt trong vật chất.
Một hệ thống siêu giả lập
Trưởng ban nghiên cứu, giáo sư Anima Anandkumar.
Nhóm nghiên cứu không viết báo cáo cho vui, họ muốn sử dụng AI vào nhiều khía cạnh khoa học hơn nữa. Nhờ có sự hợp tác từ khoa học khí hậu, khoa học địa chấn, khoa học vật chất mà trưởng ban nghiên cứu Anima Anandkumar và cộng sự dám thử giải phương trình PDE. Hiện tại, họ đang tiến hành ứng dụng mạng neural mới cùng các chuyên gia tới từ Caltech và Phòng thí nghiệm Quốc gia Lawrence Berkeley.
Giáo sư Anima Anandkumar rất hứng thú với nghiên cứu biến đổi khí hậu. Phương trình Navier-Stokes không chỉ dự đoán nhiễu động không khí tốt, nó còn dựng được mô hình biến động thời tiết.
"Rất khó để có được khả năng dự báo thời tiết tốt ở quy mô toàn cầu vẫn là khó khăn lớn. Ngay cả khi sử dụng siêu máy tính, ta cũng không thể tiến hành dự đoán ở quy mô lớn như vậy. Nếu chúng tôi có thể ứng dụng phương pháp này để tăng tốc toàn bộ quá trình, ảnh hưởng của nó sẽ rất lớn", cô Anandkumar nhận định, nhấn mạnh rằng đây vẫn chưa phải những ứng dụng duy nhất của cách thức giải hàm PDE mới.