App AI giúp người dùng tạo sách nói bằng giọng của chính mình

  •  
  • 139

Theo Cnet, người dùng app Speechify có thể nhập một giọng nói bất kỳ để trí tuệ nhân tạo (AI) "nhại theo", tạo ra sách nói với giọng đọc tùy thích.

Sách nói đang ngày càng thu hút nhiều người dùng. Theo Hiệp hội Nhà xuất bản Sách nói Mỹ (APA), năm 2023 đánh dấu năm thứ 12 liên tiếp thị trường sách nói ghi nhận tăng trưởng doanh số, với tổng doanh thu khoảng 2 tỷ đôla trong năm. Báo cáo của APA cũng cho biết rằng 52% người trưởng thành tại Mỹ đã từng nghe sách nói, tương đương khoảng 150 triệu người.

Sách nói đang ngày càng thu hút nhiều người dùng.
Sách nói đang ngày càng thu hút nhiều người dùng. 

AI tạo sinh đang ảnh hưởng không thể chối cãi trong hầu khắp các lĩnh vực, vô số doanh nghiệp nỗ lực khai thác công nghệ này. Công ty bảy năm tuổi Speechify đánh mạnh vào sử dụng giọng nói con người do AI tạo ra, lấy công cụ chuyển đổi văn bản thành giọng nói làm giải pháp thay thế cho sách nói truyền thống.

Từng mắc chứng khó đọc, ngày nhỏ CEO của Speechify Cliff Weitzman thường nhờ cha mẹ đọc sách cho nghe. Khi vào đại học, anh không tìm được bản sách nói của giáo trình.

Từ thôi thúc này, anh kết hợp phương pháp học máy sâu (deep learning) - kỹ thuật AI giúp dạy máy tính xử lý dữ liệu như não người và công cụ chuyển đổi văn bản thành giọng nói theo chuỗi (khai thác mẫu giọng ghi âm sẵn để tạo giọng nói) để tạo ra một chương trình đọc sách cho mình. Vốn là người nói tiếng Hebrew, Weitzman thêm vào tính năng chỉnh tốc độ để luyện nghe tiếng Anh.

Năm 2018, anh trai của Weitzman là Tyler đã tham gia với tư cách người đồng sáng lập Speechify và kể từ năm 2022 giữ chức vụ giám đốc AI kiêm chủ tịch. Tyler Weitzman đã giúp phát triển thuật toán mà về sau trở thành phiên bản đầu tiên của Speechify.

Thuật toán này được đào tạo trên 100.000 giờ âm thanh để giọng đọc nghe giống giọng người. Sau đó, công ty ký kết hợp tác với những người nổi tiếng để sử dụng giọng nói của họ.

Speechify có thể đọc sách, tài liệu và văn bản trên thiết bị di động. Người dùng có thể tải tệp PDF lên ứng dụng web, ứng dụng này sẽ thêm âm thanh vào app điện thoại. Ngoài ra, người dùng có thể tải tiện ích trên Chrome để nghe văn bản từ Google Drive, iCloud hoặc Dropbox.

Phiên bản Speechify miễn phí cung cấp 6 lựa chọn giọng nói và tốc độc đọ tối đa 1x. Speechify Premium, giá 11,67 đôla/tháng có hơn 250 giọng đọc và hơn 50 ngôn ngữ, tốc độ tối đa lên đến 4,5x.

Cliff Weitzman cho biết Speechify hiện có 40 triệu người dùng. Theo báo cáo, công ty khởi nghiệp này nhận được 4,5 triệu đôla từ vòng gọi vốn giai đoạn đầu vào năm 2020.

Cập nhật: 03/07/2024 Znews
  • 139