Bốn ngàn năm trước, một nền văn minh đô thị đã tồn tại - ở đó người ta sống và buôn bán trên vùng biên giới giữa Pakistan và Ấn Độ ngày nay. Suốt thế kỉ qua, hàng ngàn đồ tạo tác mang chữ viết tượng hình do người tiền sử để lại đã được khai quật. Ngày nay, một nhóm nghiên cứu Ấn Độ và Hoa Kỳ đang sử dụng toán học cùng máy vi tính để chắp nối thông tin về hệ thống chữ viết bí mật này.
Nhóm nghiên cứu do một nhà khoa học thuộc trường đại học Washington dẫn đầu đã sử dụng máy vi tính để giải mã các kí hiệu trong hệ thống chữ Indus tượng hình cổ đại. Kết quả nghiên cứu được công bố trên tờ Proceedings of the National Academy of Sciences số ra tuần này, trong đó chỉ ra những kiểu sắp xếp các kí hiệu theo chuỗi và công bố mô hình thống kê cho thứ ngôn ngữ bí mật mà các nhà khoa học đã tạo lập được.
“Mô hình thống kê giúp hiểu rõ hơn về cấu trúc ngữ pháp của hệ thống chữ Indus,” Rajesh Rao, trưởng nhóm nghiên cứu, giảng viên khoa học máy tính trường đại học Washington, cho biết. “Một mô hình như vậy có thể sẽ rất hữu ích đối với việc giải mã, vì bất kì ý nghĩa nào được gán cho một kí hiệu đều phải phù hợp tổng thể văn cảnh cùng với các chữ đứng phía trước và sau nó.”
Đồng tác giả của nghiên cứu là các nhà khoa học Nisha Yadav và Mayank Vahia đến từ Viện Nghiên cứu cơ bản Tata và Trung tâm Nghiên cứu Khoa học Căn bản Mumbai; R. Adhikari đến từ Viện Toán học Chennai; và Iravatham Mahadevan đến từ Trung tâm Nghiên cứu Indus Chennai.
Bất chấp các nỗ lực trước nay, nhân loại chưa từng giải mã thành công hệ thống chữ Indus. Các kí tự thường xuất hiện trên những con dấu bé xíu, những phiến gỗ khắc hay tấm bùa hộ mạng tạo ra bởi cư dân sinh sống trong Thung lũng Indus cách đây 2.600 tới 1900 năm trước Công nguyên. Mỗi tạo tác này thường chứa một chuỗi gồm 5 hay 6 kí tự.
Một vài người thậm chí còn tự hỏi liệu thực sự những kí tự này có phải một thứ ngôn ngữ, hay nó chỉ đơn thuần là hình vẽ biểu trưng hay kí hiệu tôn giáo.
Các nhà nghiên cứu đã sử dụng máy vi tính để giải mã kiểu sắp xếp các kí tự tượng hình trong hệ thống chữ Indus cổ. (Ảnh: J. M. Kenoyer / harappa.com) |
Nghiên cứu mới tìm kiếm các kiểu sắp xếp mang tính toán học trong các chuỗi kí tự. Các tính toán cho thấy thứ tự kí tự ở đây là có nghĩa; nếu lấy ra một kí tự từ một chuỗi trên tạo tác và thay đổi vị trí của nó, chuỗi mới thu được rất ít khả năng có nghĩa trong hệ thống ngôn ngữ đang xem xét. Các tác giả cho rằng sự tồn tại của những quy luật sắp xếp kí tự này một lần nữa ủng hộ cho các phát hiện của nhóm đã công bố trên tờ Science hồi đầu năm, theo đó hệ thống kí hiệu Indus có thể thực sự là một thứ ngôn ngữ.
“Những kết quả này cho phép chúng tôi khẳng định có một logic rõ ràng trong hệ thống chữ viết Indus,” Vihia nói.
Các con dấu với những chuỗi kí tự Indus cũng được tìm thấy mãi tận Tây Á, trong vùng Mesopotamia thuộc Iraq ngày nay. Kết quả thống kê cho thấy những chuỗi Tây Á được sắp xếp thứ tự khác với những chuỗi trên các tạo tác tìm thấy ở thung lũng Indus. Điều này ủng hộ cho giả thuyết rằng hệ thống này có thể được sử dụng bởi các thương gia Indus ở vùng Tây Á có ý nghĩa diễn đạt khác với khi được dùng ở vùng Indus.
“Phát hiện ra hệ thống chữ Indus đủ linh hoạt để biểu đạt thêm một ý nghĩa khác ở vùng Tây Ấn là điều rất thú vị. Phát hiện này hoàn toàn đi ngược lại với ý kiến cho rằng hệ thống kí hiệu Indus thực ra chỉ là các biểu tượng chính trị hoặc tôn giáo,” Rao phát biểu.
Các nhà nghiên cứu đã sử dụng một mô hình Markov, phương pháp thống kê ước tính khả năng xảy ra một sự kiện tương lai ( tức viết ra một kí tự cụ thể) dựa trên kiểu sắp xếp đã biết trước đó. Phương pháp này được phát triển bởi nhà toán học người Nga Andrey Markov cách đây một thế kỉ và ngày càng được sử dụng rộng rãi trong kinh tế học, gen học, nhận diện giọng nói cùng nhiều lĩnh vực nghiên cứu khác.
“Một trong những mục đích chính của bài viết này là giới thiệu mô hình Markov, và các mô hình thống kê nói chung, với tư cách là những công cụ điện toán phục vụ cho khảo sát hệ thống chữ viết cổ,” Adhikari nói.
Một ứng dụng được miêu tả trong bài viết sử dụng mô hình thống kê để điền vào chỗ trống các kí tự còn thiếu trên vật khảo cổ. Những kí tự này có thể tăng cường cho hệ thống dữ liệu phục vụ việc giải mã hệ thống chữ viết Indus cổ đại, Rao cho biết.
Nghiên cứu được tài trợ kinh phí bởi Quỹ Packard, Quỹ Sir Jamsetji Tata, đại học Washington và Trung tâm Nghiên cứu Indus.