Trí tuệ nhân tạo giải mã bản ghi chép cổ đại

1.052

Thư viện Tu viện St. Gall ở Thụy Sĩ là nơi lưu giữ khoảng 160.000 tập bản thảo văn học và lịch sử có niên đại từ thế kỷ thứ 8.

Tất cả đều được viết tay trên giấy da và bằng những ngôn ngữ hiếm khi được sử dụng trong thời hiện đại.

Để lưu giữ những “báu vật lịch sử” này của nhân loại, hàng triệu văn bản như vậy đã được cất trong các thư viện và tu viện trên khắp thế giới. Phần lớn bộ sưu tập được chia sẻ tới công chúng thông qua hình ảnh kỹ thuật số. Tuy nhiên, các chuyên gia cho rằng, có một lượng tài liệu “phi thường” chưa từng được đọc, được viết bằng ngôn ngữ cổ.

Hệ thống tự động hóa phiên âm trang sách.

Giờ đây, các nhà nghiên cứu tại Đại học Notre Dame đang phát triển một mạng lưới thần kinh nhân tạo để đọc các chữ viết tay cổ phức tạp dựa trên nhận thức của con người. Walter Scheirer - Phó Giáo sư Khoa Khoa học và Kỹ thuật Máy tính tại Notre Dame, chia sẻ:

“Chúng tôi đang xử lý các tài liệu lịch sử có từ nhiều thế kỷ trước và bằng các ngôn ngữ như tiếng Latinh, hiếm khi được sử dụng ở hiện tại. Những gì chúng tôi đặt ra là tự động hóa phiên âm của trang sách, theo cách bắt chước nhận thức thông qua con mắt của người đọc chuyên nghiệp. Đồng thời, cung cấp khả năng đọc văn bản nhanh chóng, có thể tìm kiếm được”.

Trong nghiên cứu mới được công bố, Scheirer phác thảo cách nhóm của ông kết hợp các phương pháp học máy truyền thống với tâm sinh lý trực quan. Đây là một phương pháp đo lường mối liên hệ giữa các kích thích vật lý và hiện tượng tinh thần.

Ví dụ như khoảng thời gian cần thiết để một người đọc chuyên nghiệp nhận ra một ký tự cụ thể, đánh giá chất lượng của chữ viết tay hoặc xác định việc sử dụng các chữ viết tắt nhất định.

Nhóm của Scheirer đã nghiên cứu các bản viết tay bằng tiếng Latinh được số hóa. Bản này được viết bởi những người ghi chép ở Tu viện St. Gall vào thế kỷ thứ 9. Độc giả đã nhập các phiên âm thủ công của họ vào một giao diện phần mềm được thiết kế đặc biệt.

Sau đó, nhóm nghiên cứu đo thời gian phản ứng trong quá trình phiên âm để biết từ, ký tự và đoạn văn nào dễ hay khó. Ông Scheirer giải thích, phương pháp đó đã tạo ra một mạng lưới phù hợp hơn với hành vi của con người. Nhờ đó, giảm lỗi và cung cấp khả năng đọc văn bản chính xác, thực tế hơn.

“Đó là một chiến lược thường không được sử dụng trong học máy. Chúng tôi gắn nhãn dữ liệu thông qua các phép đo tâm sinh lý này. Chúng xuất phát trực tiếp từ các nghiên cứu tâm lý về nhận thức, bằng cách thực hiện các phép đo hành vi.

Sau đó, chúng tôi thông báo cho mạng lưới những khó khăn phổ biến và có thể sửa chữa dựa trên các phép đo đó”, ông Scheirer giải thích.

Tuy nhiên, theo Phó Giáo sư Scheirer, phương pháp này vẫn gặp nhiều thách thức. Nhóm của ông đang làm việc để cải thiện độ chính xác của các bản chép, đặc biệt là trong trường hợp tài liệu bị hỏng hoặc không đầy đủ. Đồng thời, tính toán các khía cạnh khác khi trang ghi chép có thể khiến hệ thống nhầm lẫn.

Tín hiệu đáng mừng là nhóm đã thành công điều chỉnh chương trình để phiên âm các văn bản tiếng Ethiopia. Sau đó, điều chỉnh nó sang một ngôn ngữ có bộ ký tự hoàn toàn khác. Đây được cho là bước đầu tiên để phát triển một chương trình có khả năng phiên âm và dịch thông tin cho người dùng.

Cập nhật: 06/08/2021 Theo GDTĐ