Vào thời điểm này năm ngoái, mạng xã hội đang bùng nổ với “Deep Nostalgia” của MyHeritage, người có phép thuật AI làm hoạt hình các bức ảnh gia đình cũ của chúng ta với chủ nghĩa hiện thực đáng lo ngại. Chà, nếu bạn cảm thấy lo lắng, hãy đợi cho đến khi bạn thấy tính năng mới mà tôi vừa gọi LiveStory.
Khoảng thời gian này, công nghệ của một công ty gia phả trực tuyến không phải là tạo ra một clip nhỏ gồm 10-20 clip dựa trên một bức ảnh cũ của người thân của bạn. Thay vào đó, LiveStory còn đi xa hơn bằng cách tạo một video hoạt hình dài hơn về tổ tiên của bạn kể câu chuyện về toàn bộ cuộc đời của ông, hoàn chỉnh với âm thanh đồng bộ hóa và trình chiếu các bức ảnh cũ.
Như trước đây, nó hoạt động bằng cách sử dụng công nghệ “tái hiện” do AI hỗ trợ để làm hoạt ảnh khuôn mặt của người thân của bạn. Nhưng lần này bạn cũng nhận được một giọng nói được tạo tự động từ cây gia đình MyHeritage hoặc do bạn nhập theo cách thủ công. Sau đó, công nghệ chuyển văn bản thành giọng nói làm cho câu chuyện trở nên sống động và giọng nói được đồng bộ hóa với người nói đang chuyển động của người thân của bạn.
Làm thế nào nó hoạt động?
Giống như công nghệ “Deep Nostalgia” năm ngoái, hình ảnh động của LiveStory được tạo bằng cách sử dụng một bộ sưu tập lớn các “video trình điều khiển”. Sau khi các thuật toán của dịch vụ phân tích hình ảnh bạn đã tải lên, các đặc điểm nổi bật của nó hoặc “các đặc điểm” trên khuôn mặt, sau đó sẽ được ánh xạ vào video của người lái xe để tạo ấn tượng về chuyển động. Các thuật toán cũng điền vào bất kỳ chi tiết nào còn thiếu. Trình tạo giọng nói tổng hợp cũng tạo tường thuật dựa trên thông tin trong hồ sơ của người đó hoặc bạn có thể tạo kịch bản của riêng mình từ đầu. Bạn cũng có thể tải lên bản ghi âm của riêng mình.
MyHeritage và D-ID, công ty Israel tạo ra và cấp phép công nghệ, cho biết kết quả cuối cùng là hoàn toàn có thể tùy chỉnh, cho bạn khả năng thay đổi tường thuật, hình ảnh và âm thanh trước khi gửi đến gia đình hoặc phương tiện truyền thông xã hội. LiveStory dường như cũng hỗ trợ 31 ngôn ngữ, hàng chục phương ngữ và hàng trăm ký tự giọng nói, cùng với các tùy chọn giọng nói nam và nữ khác nhau.
Bất chấp tất cả những điều đó, chắc chắn rằng công nghệ có một chút kinh dị và đưa chúng ta vào một cuộc hành trình thậm chí còn lớn hơn vào thung lũng kỳ lạ. Đối với một số người, việc thêm âm thanh có thể đưa mọi thứ đi quá xa và MyHeritage phải thêm một số tuyên bố từ chối trách nhiệm để đảm bảo công nghệ không bị lạm dụng. Nó nói rằng LiveStory “chỉ được sử dụng trên ảnh của những người đã qua đời, thường là tổ tiên của một người” và nó “không bao giờ được sử dụng trên ảnh của một người còn sống mà không có sự cho phép của họ.”
Tuy nhiên, nhiều người trên mạng xã hội nhận thấy rằng kỹ thuật “hoài niệm sâu sắc” năm ngoái là một cách an ủi hoặc thậm chí hâm nóng các mối quan hệ mà họ chưa từng thấy trong đời thực. Giống như tính năng này, LiveStory hiện có sẵn để dùng thử miễn phí trên máy tính để bàn và web di động (cả hai qua Trang web MyHeritage) và trong ứng dụng di động MyHeritage. Bạn có thể tạo một số LiveStories miễn phí, nhưng sau đó, bạn sẽ phải trả phí đăng ký (từ $ 119 / £ 89 mỗi năm).
Phân tích: Một bước đi táo bạo hơn vào thung lũng kỳ lạ
Cũng giống như “Deep Nostalgia” năm ngoái, chúng tôi có một chút lo lắng về tính năng “LiveStory” mới của MyHeritage. Không còn nghi ngờ gì nữa, công nghệ là tuyệt vời và thực tế là nó có thể tự động tạo tiểu sử video 90 giây từ một bức ảnh, cây gia đình và một số văn bản vừa ấn tượng vừa đáng sợ.
Tuy nhiên, chúng ta không thể không cảm thấy rằng một phần lớn thành công lan truyền trước đây của công nghệ (dẫn đến 100 triệu hình ảnh động) là do độ chính xác của nó. Những khuôn mặt chuyển động mà Deep Nostalgia tạo ra thỉnh thoảng sẽ chớp mắt hoặc nghiêng đầu, nhưng đó là trường hợp – và hạn chế này giúp tạo ra ảo ảnh đồng thời che đi những hạn chế của công nghệ.
Thêm âm thanh là một bước hợp lý và chắc chắn sẽ chứng minh là một công cụ phổ biến cho những người không bị ớn lạnh từ yếu tố rùng rợn không thể phủ nhận. Nhưng từ các ví dụ mà chúng ta đã thấy cho đến nay, ngữ điệu đôi khi được tự động hóa và thực tế là âm thanh không được lấy mẫu từ bản gốc khiến nó có phần giả tạo.
Hiện tại, LiveStory dường như phù hợp hơn với các viện bảo tàng hoặc giáo dục, nơi khả năng đưa các nhân vật lịch sử vào cuộc sống (thay vì các mối quan hệ cá nhân) có thể là một cách hữu ích để làm cho lịch sử trở nên hấp dẫn hơn đối với du khách và trẻ em.
Tất nhiên, cũng có khả năng bị lạm dụng, mặc dù D-ID (nhà sản xuất công nghệ) đã đặt ra một số rào cản để ngăn điều này xảy ra. Tất cả người dùng cần chấp nhận các điều khoản, bao gồm cả lời hứa rằng họ sẽ không sử dụng nó trên người đang sống, trước khi họ có thể tạo LiveStory. Ngoài ra còn có một thuật toán sửa đổi văn bản trên tàu để kiểm tra thông tin xúc phạm, phỉ báng hoặc sai lệch, mặc dù không rõ cách thức kiểm tra thông tin sau.
khi nào Chúng tôi đã nói chuyện với D-ID vào năm ngoái trong một cuộc phỏng vấn độc quyềnChúng tôi bị ấn tượng bởi cam kết của cô ấy trong việc đảm bảo rằng công nghệ AI của cô ấy không bị sử dụng theo những cách bất chính, nếu cũng hơi khó chịu bởi dự đoán của cô ấy rằng phần lớn phương tiện trực tuyến mà chúng ta thấy trên mạng sẽ là tổng hợp “trong vòng 5-10 năm”. LiveStory rõ ràng đã tiến thêm một bước nữa, ca khúc này, nếu không phải là bước chuyển mình, thì đây chính là bản hit đã trở thành “nỗi nhớ sâu sắc” vào năm ngoái.
“Kẻ đam mê du lịch tồi tệ. Kẻ nghiện internet hèn hạ ghê tởm. Rượu vô cớ.