AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn!

Trước khi biết về công nghệ AI mới của Google, bạn hãy nghe kết quả dự án nghiên cứu trước.

Đây là một câu trong tiếng Tây Ban Nha.

Xem thêm

Vẫn là câu đó, được dịch sang tiếng Anh bằng hệ thống thông thường của Google. Các hệ thống dịch thuật khác cũng sẽ có kết quả tương tự, chỉ là giọng khác nhau thôi.

Dịch sang tiếng Anh, câu này có nghĩa là: “Tôi tự hỏi mình cảm thấy sao, và đó là lúc tôi bắt đầu khóc”.

Xem thêm

Đây là câu nói nguyên bản được dịch sang tiếng Anh, thông qua hệ thống dịch tự động mới. Nội dung câu nói giờ đã khác: "Larry hỏi tôi cảm thấy thế nào, và đó là lúc tôi bắt đầu khóc". 

Xem thêm

Kết quả chưa hoàn hảo, nhưng bạn có thể thấy ngữ điệu, âm sắc trầm bổng trong câu nói được giữ lại phần nhiều. Đây là hệ thống dịch lập tức mới của Google, có thể cho phép người dùng giữ lại chính giọng nói đó.

Đây chính là điểm khác biệt giữa hai hệ thống dịch thuật giọng nói cũ và mới. Trước thời điểm này, mọi câu nói đều được chuyển hóa thành dạng text, được dịch lại thành ngôn ngữ yêu cầu và được đọc lại bằng giọng nói máy móc. Việc này khiến cho ngữ điệu bị mất trong quá trình phiên dịch.

Hệ thống mới, được đặt cho cái tên Translatotron, bao gồm 3 thành phần; cả ba sẽ đều tập trung vào ảnh phổ - hình ảnh đại diện cho một phổ nhất định, rồi thực hiện ba công việc khác nhau.

Phần đầu tiên sẽ sử dụng mạng neural đã được huấn luyện phân tích phổ âm thanh, để tạo ra một phổ âm thanh của ngôn ngữ đầu ra.

Phần thứ hai sẽ chuyển phổ đó thành một sóng âm thanh có thể nghe được.

Phần thứ ba sẽ tách riêng những nét đặc trưng trong giọng nói nguyên bản, để gắn vào đoạn âm thanh cuối cùng.

Cách thức mới không chỉ giữ nguyên được những ngữ điệu (trong nhiều trường hợp là cả hàm ý) người nói trong sản phẩm cuối cùng, trên lyus thuyết, nó còn giảm được lỗi khi cắt bớt được những bước không cần thiết trong các hệ thống dịch thuật cũ.

Translatotron mới chỉ là sản phẩm mẫu mang tính chất chứng minh hệ thống hoạt động được. Trong quá trình thử, các nhà nghiên cứu mới chỉ tập trung vào dịch tiếng Tây Ban Nha sang tiếng Anh, “mới chỉ” có thế mà đã cần tới lượng dữ liệu huấn luyện AI khổng lồ. Nhưng nó hé cảnh cửa hẹp cho ta thấy tương lai có thể sẽ ra sao.

Cập nhật: 12/07/2019 Theo Genk
Danh mục

Công nghệ mới

Phần mềm hữu ích

Khoa học máy tính

Phát minh khoa học

AI - Trí tuệ nhân tạo

Khám phá khoa học

Sinh vật học

Khảo cổ học

Đại dương học

Thế giới động vật

Khoa học vũ trụ

Danh nhân thế giới

Ngày tận thế

1001 bí ẩn

Chinh phục sao Hỏa

Kỳ quan thế giới

Người ngoài hành tinh - UFO

Trắc nghiệm Khoa học

Khoa học quân sự

Lịch sử

Tại sao

Địa danh nổi tiếng

Hỏi đáp Khoa học

Y học - Sức khỏe

Môi trường

Bệnh Ung thư

Ứng dụng khoa học

Câu chuyện khoa học

Công trình khoa học

Sự kiện Khoa học

Thư viện ảnh

Video