Thuật toán deep-learning mới có thể phát hiện chứng trầm cảm thông qua giọng nói

Các nhà nghiên cứu ở Trung Quốc gần đây đã phát triển một thuật toán deep-learning mới, có thể phát hiện các dấu hiệu trầm cảm từ lời nói của một người.

Công nghệ AI mới này là một bước quan trọng trong việc giảm số vụ tự tử và các biến chứng khác, giúp các chuyên gia y tế dễ dàng xác định những bệnh nhân cần hỗ trợ về sức khỏe tâm thần.

AI đã chứng minh vai trò trong nhiều lĩnh vực và giờ đây nó cũng đang tiến sâu vào lĩnh vực chăm sóc sức khỏe, bằng chứng là các nhà khoa học đang xem xét cách thức các công cụ này có thể phát hiện ra các dấu hiệu của bệnh tật về thể chất và tinh thần.

Thuật toán deep-learning mới có thể phát hiện chứng trầm cảm thông qua giọng nói. (Ảnh: Tech Times).

Một trong những rối loạn tâm thần phổ biến nhất là trầm cảm. Theo số liệu của Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh Mỹ (CDC), cứ 6 người trưởng thành thì có khoảng 1 người sẽ bị trầm cảm vào một thời điểm nào đó trong đời.

Ở Mỹ, mỗi năm có thêm khoảng 16 triệu người trưởng thành bị trầm cảm. Bất kỳ ai cũng có thể bị trầm cảm và nó có thể tấn công ở mọi lứa tuổi hoặc bất kỳ loại người nào.

WHO lưu ý rằng trầm cảm là một căn bệnh phổ biến trên toàn thế giới, ước tính ảnh hưởng đến khoảng 3,8% dân số, bao gồm 5,0% người trưởng thành và 5,7% người lớn trên 60 tuổi. Trầm cảm ảnh hưởng đến khoảng 280 triệu người trên toàn thế giới.

Như một câu trả lời cho thực tế nghiêm trọng này, các nhà nghiên cứu đã phát triển một thuật toán deep-learning mới có thể phát hiện các dấu hiệu trầm cảm từ giọng nói của con người.

Các nhà nghiên cứu đã sử dụng bộ dữ liệu DAIC-WOZ, một tập hợp âm thanh và biểu cảm khuôn mặt 3D của bệnh nhân mắc và không mắc chứng trầm cảm, để đào tạo mô hình deep-learning của họ.

Các nhà nghiên cứu Han Tian, Zhang Zhu và Xu Jing đã tuyên bố trong bài báo của họ rằng: "một mô hình thuật toán quyết định đa thông tin, được thiết lập bằng phương tiện nhận dạng cảm xúc". Mô hình này được sử dụng để phân tích dữ liệu đại diện của các đối tượng và giúp xác định xem các đối tượng có bị trầm cảm hay không.

Nhân viên y tế ảo sẽ hỏi một người về cuộc sống và tâm trạng của họ, đồng thời ghi lại giọng nói và nét mặt của họ khi họ trả lời các câu hỏi.

Sử dụng OpenSmile, một công cụ mã nguồn mở để diễn giải lời nói và âm nhạc, các nhà nghiên cứu đã lấy các phần quan trọng của bản ghi âm và đưa chúng vào phân tích thành phần chính.

Thuật toán deep-learning được chứng minh là hoạt động tốt trong các bài kiểm tra. Nó có thể phát hiện trầm cảm ở 87% bệnh nhân nam và 87,5% bệnh nhân nữ.

Kết quả đáng khích lệ này có thể đóng vai trò là chất xúc tác để tạo ra các công cụ AI tương tự để phát hiện các triệu chứng của các rối loạn tâm thần khác trong lời nói. Ngoài ra, nó cũng hứa hẹn trở thành bộ công cụ hỗ trợ cho bác sĩ tâm thần và chuyên gia y tế.

Việc tạo ra thuật toán deep-learning này có thể là một bước tiến lớn trong cuộc chiến chống trầm cảm. Bằng cách cho phép các bác sĩ chẩn đoán sớm hơn và chính xác hơn, công nghệ này có thể giúp những người trầm cảm vượt qua căn bệnh này, qua đó làm giảm số người tự sát vì trầm cảm.

Cập nhật: 14/02/2023 VietTimes