Công nghệ Deepfake: "Tôi đóng giả Nixon và thông báo về thảm họa Mặt trăng"

  • 420

Làm diễn viên deepfake không khác mấy so với diễn để làm kỹ xảo, nhưng tác động tâm lý thì khá lớn.

Francesca Panetta và Halsey Burgund có một ý tưởng lớn. Họ nhận thấy những video ghép mặt bằng trí tuệ nhân tạo, còn gọi là deepfake, đang ngày càng phổ biến với chất lượng cao hơn, nhưng vẫn chưa có thước phim nào thực sự gây ấn tượng hoàn chỉnh. Liệu họ có thể tạo ra một đoạn phim deepfake tận dụng đầy đủ những tiến bộ công nghệ mới nhất?

Sản xuất phim ghép mặt luôn là chủ đề gây tranh cãi. Do vậy, 2 nghệ sĩ chọn một đoạn phim có thật trong lịch sử nhưng chưa bao giờ diễn ra. Vào năm 1969, Tổng thống Mỹ khi đó là Richard Nixon đã chuẩn bị sẵn 2 đoạn phát biểu cho sự kiện con người đặt chân lên Mặt Trăng.

Đoạn phát biểu thứ hai, được đặt tên "Phòng khi thảm họa trên Mặt Trăng xảy ra", đã được soạn ra để thông báo việc phi hành gia Neil Armstrong và Edwin Aldrin phải bỏ mạng trên vệ tinh của Trái Đất. Trong thực tế Nixon đã lên hình để đọc bài phát biểu chúc mừng các phi hành gia của Mỹ.

Công nghệ deepfake giúp diễn viên trở thành một nhân vật có thật trong lịch sử
Công nghệ deepfake giúp diễn viên trở thành một nhân vật có thật trong lịch sử, và nói về những thứ chưa từng xảy ra.

Tuy vậy, Nixon dưới dạng deepfake vẫn có thể lên hình đọc đoạn văn bản chưa từng có. Để tạo nên đoạn video này, Panetta và Burgund, 2 nhà khoa học tại MIT đã liên hệ với 2 công ty AI để lo về mặt hình ảnh và âm thanh. Họ vẫn cần một mảnh ghép cuối cùng: diễn viên vào vai Nixon.

"Chúng tôi phải tìm người sẵn sàng làm việc này, vì thực sự là nó cũng hơi kỳ. Người đó phải có tư duy linh hoạt về nghề diễn xuất", Burgund nói với tạp chí MIT Technology Review.

"Bạn có muốn trở thành Nixon không"?

Deepfake vẫn là khái niệm khá mới. Những đoạn phim deepfake đầu tiên được dùng để ghép mặt diễn viên nổi tiếng vào những cảnh phim người lớn. Công nghệ càng tiến bộ, những nghệ sĩ và nhà làm phim càng nghĩ ra nhiều cách để đưa những đoạn ghép mặt chất lượng cao vào phim, quảng cáo, và họ cần diễn viên.

Mặc dù diễn viên trong một đoạn phim deepfake có thể chỉ cần diễn cảm xúc, đôi khi chỉ cần giọng nói, họ lại đối mặt với những câu hỏi về mặt đạo đức.

"Lĩnh vực này quá mới và đến giờ vẫn chưa có quy trình nào cả. Ý tôi là chúng ta đang tự vẽ ra những đoạn phim giả mà", Burgund chia sẻ.

Để có diễn viên vào vai Nixon trong đoạn phim deepfake, 2 nghệ sĩ không cần tới một người có diện mạo, tuổi tác hoặc ngoại hình giống với Nixon, bởi AI sẽ lo việc đó. Tuy nhiên, với phần âm thanh, họ sẽ cần diễn viên có giọng với những nét tương đồng cố tổng thống Mỹ.

"Bạn có muốn trở thành Nixon không", Panetta và Burgund đăng câu hỏi trên nhiều nhóm về diễn xuất. Cuối cùng, họ chọn được Lewis Wheeler, diễn viên sống tại thành phố Boston.

Diễn viên Lewis Wheeler trong phòng quay hình.
Diễn viên Lewis Wheeler trong phòng quay hình. Đây là người diễn hình ảnh của cố tổng thống Mỹ Richard Nixon.

Công việc vất vả nhất của Wheeler là thu âm. Anh phải nghe hàng trăm đoạn ghi âm ngắn của Nixon, mỗi đoạn chỉ vài giây, và "đôi khi còn chẳng đầy đủ từ", theo lời diễn viên này. Chúng được cắt từ nhiều bài phát biểu của ông, nhưng hầu hết là từ diễn văn từ chức. Nhóm sản xuất muốn có tông giọng với cảm xúc buồn, để tương xứng với thảm họa mà Nixon thông báo trước camera.

Wheeler sẽ phải ghi âm lại từng đoạn ngắn với nhịp và tông giọng giống nhất có thể với Nixon. Những đoạn ghi âm này sau đó sẽ được đưa vào thuật toán của hãng Respeecher để ghép thành bài phát biểu với giọng của cố tổng thống Mỹ.

"Công việc rất mệt mỏi và cần nhiều thời gian. Tuy vậy nó cũng khá là thú vị, khi tôi làm từng phần nhỏ nhất", Wheeler chia sẻ.

Phần hình ảnh thì đơn giản hơn. Nhóm nghiên cứu sử dụng chính đoạn phim công bố hạ cánh thành công lên Mặt Trăng, với hình ảnh ông Nixon nhìn thẳng vào camera và nói. Wheeler chỉ cần diễn tương tự, với đoạn diễn văn thứ hai, để nhóm ghi hình bắt các chuyển động phần miệng của anh ở đúng góc quay.

"Đây là phần khó nhất nhưng cũng thỏa mãn nhất. Để có đoạn phim này, tôi phải đặt mình vào nhân vật, và tư duy xem đoạn phát biểu này nói về cái gì, và sẽ phải nói với người Mỹ như thế nào về thảm họa vừa xảy ra", diễn viên này chia sẻ.

Quyền lực của deepfake

Zach Math, đạo diễn và nhà sản xuất tại Mỹ cũng có ý tưởng tương tự khi thực hiện video quảng cáo về bầu cử Mỹ. Ông quyết định chọn công nghệ deepfake để giả 2 nhà lãnh đạo của Nga là Vladimir Putin và Triều Tiên là Kim Jong Un để tạo hiệu ứng. Tuy nhiên, trong video của Math diễn viên sẽ phải có cơ thể tương đồng với 2 nguyên thủ này, đồng thời nói tiếng Anh với giọng Nga hoặc Triều Tiên.

Một thách thức khác với đoàn làm phim là tìm kiếm đoạn phim gốc với sự xuất hiện của 2 nguyên thủ. Có rất nhiều đoạn phim với sự xuất hiện của Tổng thống Nga Putin, và việc cung cấp dữ liệu cho máy khá đơn giản. Tuy nhiên, nhà lãnh đạo Triều Tiên Kim Jong Un lại thường đeo kính khi lên hình, gây khó khăn cho máy khi phân tích khuôn mặt của ông.

Nếu chỉ chọn những video Kim Jong Un không đeo kính thì dữ liệu lại quá ít. Kết quả là đoạn phim của Kim Jong Un trông giả hơn hẳn và không thể hiện được biểu cảm của diễn viên.

Đoạn video deepfake giả nhà lãnh đạo Triều Tiên Kim Jong Un.
Đoạn video deepfake giả nhà lãnh đạo Triều Tiên Kim Jong Un. (Ảnh cắt từ clip).

Khi đánh giá chất lượng của một đoạn phim deepfake, nhà làm phim Math cho rằng chất lượng hình ảnh không quan trọng bằng cảm xúc mà đoạn phim mang lại.

"Người xem thường ít quan tâm đến những chi tiết hình ảnh hơi sai. Họ quan tâm hơn đến việc thông điệp đem lại cảm xúc như thế nào", Math chia sẻ.

Đôi lúc deepfake cũng có thể làm một tấm chắn, bảo vệ cho diễn viên phía sau. Trong bộ phim tài liệu Welcome to Chechnya, nhóm làm phim muốn bảo vệ thân phận thật của những nhà hoạt động thuộc cộng đồng LGBTQ tại Nga. Để làm được điều này, đạo diễn David France đã ứng dụng deepfake để tạo ra khuôn mặt mới cho diễn viên, đồng thời giúp cho nhân vật vẫn giữ được cảm xúc hay giọng nói.

Ở phần giới thiệu mở đầu, France cũng không quên ghi chú rằng một số nhân vật đã được "chỉnh sửa số" để khuôn mặt khác đi. Những nhân vật này đều có một phần mờ xung quanh mặt để khán giả nhận biết.

"Chúng tôi không muốn giấu đi thân phận của một người mà không nói cho khán giả biết điều đó", Ryan Laney, người chịu trách nhiệm kỹ xảo của bộ phim chia sẻ.

Gương mặt thật của diễn viên Maxim Lapunov (trái) và bộ mặt deepfake
Gương mặt thật của diễn viên Maxim Lapunov (trái) và bộ mặt deepfake để che giấu thân phận thật của anh. (Ảnh: Teus Media).

Dù vậy, khía cạnh đạo đức của những đoạn phim deepfake vẫn gây tranh cãi. Nhiều nhân vật nổi tiếng như Thủ tướng Anh Boris Johnson hay Kim Kardashian đã trở thành chủ đề của những video deepfake gây cười. Nghệ sĩ người Anh Barnaby Francis từng gây tranh cãi khi tạo ra đoạn phim, trong đó CEO Facebook Mark Zuckerberg tuyên bố kiểm soát cuộc sống của hàng tỷ người vào năm 2019.

"Có rất nhiều người đang tham gia trào lưu này mà không để ý đến khía cạnh đạo đức, quan tâm người thuê họ là ai, đoạn phim sẽ xuất hiện ở đâu và trong hình thức nào", Barnaby Francis chia sẻ.

Dù vậy, nhiều nghệ sĩ và nhà làm phim tin rằng deepfake có thể được tận dụng ở ngành này trong tương lai. Nếu sử dụng đúng cách, công nghệ này sẽ loại bỏ nhiều giới hạn cho nghệ thuật.

"Nó sẽ khiến mọi người phải suy nghĩ. Đây là hình thức nghệ thuật hoàn hảo cho thời đại siêu thực của chúng ta", Francis nói thêm.

Cập nhật: 19/11/2020 Theo Zing
  • 420

Theo dõi cộng đồng KhoaHoc.tv trên facebook