The Finals, game FPS nhiều người chơi có thể phá hủy, kiếm tiền từ các nhà phát triển Battlefield trước đây, hiện đang trong giai đoạn thử nghiệm mở cho phép mọi người đến và xem qua lối chơi đập phá, đập phá và nạp tiền của nó. Bạn cũng có thể nghe – và bạn có thể nhận thấy điều gì đó hơi kỳ lạ về những người thông báo chương trình trò chơi trong trò chơi khi bạn làm vậy. Đúng vậy: họ là giọng nói do AI tạo ra, không phải diễn viên con người.
Andreas Almstrom, nhà thiết kế âm thanh tại Embark Studios, đã xác nhận quyết định sử dụng công nghệ AI chuyển văn bản thành giọng nói trong một tập podcast về quá trình thực hiện The Finals vào tháng 7. Được phát hiện gần đây bởi Gianni Matragrano. Bản thân Matragrano là một diễn viên trò chơi điện tử, từng xuất hiện trong Genshin Impact, Evil West, Trepang2, v.v.
“Vì vậy, đây là câu hỏi lớn: Người lồng tiếng đã làm gì?” Almstrom đã trả lời khi người dẫn chương trình podcast hỏi anh ai đã lồng tiếng cho trận chung kết. “Vấn đề là chúng tôi đã sử dụng AI với một số trường hợp ngoại lệ.”
“Tất cả các âm thanh của tay đua, như tiếng sủa, và cả hai người bình luận của chúng tôi đều chuyển văn bản thành giọng nói dựa trên AI,” Almstrom giải thích, với “những thứ mà chúng tôi gọi là giọng nói” – bao gồm cả những tiếng gầm gừ và càu nhàu mà nhân vật của người chơi tạo ra khi họ chạy , nhảy và nhảy. Nhảy – được trình bày bởi các nhà phát triển của Embark. Almstrom nói: “Không phải vì thiếu cố gắng: “Chúng tôi thực sự chưa thể khiến AI thực hiện được những loại nhiệm vụ này”.
Quản lý cài đặt cookie
Almstrom tuyên bố rằng quyết định sử dụng giọng nói do AI tạo ra xuất phát từ khả năng của công nghệ trong việc cung cấp giọng nói đủ gần với giọng nói của con người, đồng thời có thể tạo ra chúng trong thời gian tương đối ngắn so với việc có diễn viên con người trong gian hàng.
Almstrom cho biết: “Lý do chúng tôi đi theo con đường này là vì tính năng chuyển văn bản thành giọng nói của AI cuối cùng đã trở nên rất mạnh mẽ”. “Nó giúp chúng tôi tiến xa về mặt chất lượng và cho phép chúng tôi phản ứng tích cực với những ý tưởng mới và giữ cho mọi thứ thực sự mới mẻ.”
Mục tiêu đạt được “đủ xa” có thể được nghe khá rõ ràng trong một đoạn clip từ những người thông báo trận chung kết được Matragrano chia sẻ, với sự nhấn mạnh kỳ lạ vào một số từ nhất định và một dòng câu kỳ lạ – hãy nghe “Đội quyên góp đủ tiền trước tiên “ thắng” từ 0: 08 Trong đoạn clip bên dưới, việc thiếu khoảng dừng trong “những chiến thắng đầu tiên” gần như được gộp thành một từ. Chủ nghĩa anh hùng phi thực tế, điều này không phải vậy.
Almstrom nói thêm trên podcast: “Nếu nó nghe có vẻ hơi kỳ lạ thì nó vẫn kết hợp tốt với sự kỳ ảo của một game show ảo về mặt thẩm mỹ,” Almstrom nói thêm trên podcast, dường như tránh được những lời chỉ trích về hiệu suất giọng nói kỳ quặc của AI. Cá nhân tôi không bị thuyết phục – nó không giống một đài phát thanh ảo tương lai, chỉ là một chương trình chuyển văn bản thành giọng nói không biết cách xử lý những từ đơn giản như cách một người bình thường làm, chứ đừng nói đến một diễn viên chuyên nghiệp.
Vậy tôi đoán trận chung kết sẽ được diễn ra với giọng nói của AI…? pic.twitter.com/PIAbR43ZrT
– Gianni Matragrano (@GetGianni) Ngày 28 tháng 10 năm 2023
Quản lý cài đặt cookie
Matragrano phản bác tuyên bố của Almstrom rằng phải mất “hàng tháng” để ghi âm giọng nói cho chế độ trò chơi mới do nhà thiết kế tạo ra – điều mà Almstrom cho biết đã mất “hàng giờ” với AI – đáp lại, các diễn viên con người đã quen với việc ghi lại các phiên chất lượng cao trong một thời gian ngắn khoảng thời gian. Một hoặc hai ngày.
Tất nhiên, đó là chưa đề cập đến những lo ngại về mặt đạo đức rõ ràng xung quanh quá trình tạo ra trí tuệ nhân tạo và sử dụng nó thay cho các tác nhân được trả phí – điều vốn là điểm chính trong các cuộc đình công SAG-AFTRA gần đây, với việc liên minh bày tỏ lo ngại về các bản sao kỹ thuật số của các diễn viên đang được sử dụng mà không có sự đồng ý hoặc thanh toán phù hợp.
Matragrano cho biết: “Theo đúng nghĩa đen, bạn có thể có được một VO chuyên nghiệp với tổng chi phí chưa đến mức tổng cộng, thực hiện một vài phiên ghi âm và bạn sẽ có tất cả âm thanh mình cần”. “Chúng tôi thực sự làm cho nó rất dễ dàng. Sau đó, nó sẽ trông đẹp mắt và sẽ không phải là thứ mà ngay cả những người chơi không thực sự quan tâm đến đạo đức AI vẫn tiếp tục phàn nàn về nó.
Trong một trường hợp khác gần đây về việc AI được sử dụng trong trò chơi điện tử, CD Projekt Red đã sử dụng công nghệ này để tái tạo giọng nói của cố diễn viên người Ba Lan Miłogost Reczek – nhờ sự giúp đỡ của gia đình nam diễn viên – cho sự tái xuất hiện của cyberpunk 2077 ripperdoc Viktor Vektor trong năm nay. mở rộng Phantom Liberty. Ở những nơi khác, God of War Ragnarok đã sử dụng một kỹ thuật tương tự với đoạn hội thoại kỷ lục về độ tuổi do nam diễn viên Atreus Sunny Suljic ghi lại để phù hợp với giọng nói trước tuổi dậy thì của anh ấy.
Việc tái tạo giọng nói của diễn viên đã qua đời — ngay cả khi có sự cho phép của họ — và chuyển đổi đoạn hội thoại do con người thực hiện ban đầu vẫn nghe có vẻ khác biệt rõ rệt so với việc thay thế toàn bộ diễn viên là con người trong trò chơi của bạn, nhưng đó là tình huống mà ít nhất Almstrom mong đợi sẽ trở nên phổ biến hơn.
Nhà thiết kế âm thanh cho biết: “Chúng tôi thực sự đang tiến tới một bình minh mới khi nói đến âm thanh trò chơi điện tử.
Cho dù bạn nghĩ gì về giọng nói của AI trong The Finals, bằng cách này hay cách khác, dù tốt hay xấu, chắc chắn điều đó là đúng.
“Kẻ đam mê du lịch tồi tệ. Kẻ nghiện internet hèn hạ ghê tởm. Rượu vô cớ.