Như thường lệ, Google I/O 2024 Đó thực sự là một cơn lốc tin tức và thông báo. Năm nay, thay vì tập trung vào phần cứng, Android hoặc Chrome, Google đã dành phần lớn hội nghị dành cho nhà phát triển để thuyết phục chúng tôi rằng Tính năng trí tuệ nhân tạo Nó xứng đáng được ưu tiên. Một dự án như vậy là Project Astra, một trợ lý AI đa phương tiện mà bạn có thể nói chuyện một phần và có thể đồng thời sử dụng máy ảnh để nhận dạng vật thể và con người.
Tôi nói “gần như” vì sau bản demo, tôi thấy rõ rằng phần này của Gemini vẫn còn ở giai đoạn sơ khai. Tôi đã dành vài phút ngắn ngủi với Project Astra tại Pixel 8 Pro Hãy xem nó hoạt động như thế nào trong thời gian thực. Tôi không có thời gian để kiểm tra nó một cách đầy đủ nhất hoặc cố gắng đánh lừa nó, nhưng tôi đã cảm nhận được tương lai sẽ như thế nào với tư cách là một người dùng Android.
Hỏi anh ấy hầu hết mọi thứ
Mục tiêu của Project Astra là giống như một trợ lý hướng dẫn bạn trong thế giới thực. Nó có thể trả lời các câu hỏi về môi trường của bạn bằng cách xác định các vật thể, khuôn mặt, tâm trạng và kết cấu. Nó cũng có thể giúp bạn nhớ nơi lần cuối bạn đặt thứ gì đó.
Có bốn bản demo khác nhau để lựa chọn cho Project Astra. Chúng bao gồm chế độ Người kể chuyện, yêu cầu Song Tử soạn một câu chuyện dựa trên các đầu vào khác nhau và chế độ Pictionary, về cơ bản là một trò chơi đoán hình vẽ nguệch ngoạc trên máy tính. Ngoài ra còn có một chế độ ám chỉ, trong đó AI thể hiện khả năng tìm kiếm các từ có cùng chữ cái bắt đầu và một hình thức miễn phí cho phép bạn trò chuyện qua lại.
Bản demo tôi nhận được là phiên bản Free-Form trên Pixel 8 Pro. Một nhà báo khác trong nhóm của tôi đã trực tiếp yêu cầu điều đó, vì vậy hầu hết các bản demo của chúng tôi đều tập trung vào việc sử dụng thiết bị và chế độ giống như Trợ lý này cùng nhau.
Bằng cách hướng máy ảnh vào một nhà báo khác, Pixel 8 Pro, Gemini có thể xác định rằng đối tượng là một người và chúng tôi đã nói rõ ràng với anh ấy rằng người này được xác định là đàn ông. Sau đó người ta xác định chính xác rằng anh ta đang cầm điện thoại của mình. Trong câu hỏi sau, tôi hỏi nhóm chúng tôi về quần áo của anh ấy. Cô ấy đưa ra câu trả lời chung chung rằng “anh ấy có vẻ ăn mặc giản dị.” Tiếp theo, chúng tôi hỏi anh ấy đang làm gì và Project Astra trả lời rằng có vẻ như anh ấy đang đeo kính râm (đúng như vậy) và tạo dáng bình thường.
Tôi đã cầm Pixel 8 Pro trong một phút ngắn ngủi. Bạn đã giúp Song Tử nhận diện chính xác chậu hoa nhân tạo. Chúng là hoa tulip. Song Tử nhận thấy rằng chúng cũng có nhiều màu sắc. Từ đó, tôi không biết phải làm gì khác, và rồi thời gian của tôi đã hết. Tôi rời đi với nhiều câu hỏi hơn tôi đã nhập.
Với AI của Google, điều đó có vẻ giống như một bước nhảy vọt về niềm tin. Tôi có thể thấy việc xác định danh tính và hành động của một người có thể trở thành một công cụ tiếp cận như thế nào để giúp người mù hoặc khiếm thị khi họ định hướng thế giới xung quanh. Nhưng đó không phải là mục đích của cuộc biểu tình này. Điều này nhằm thể hiện khả năng của Project Astra và cách chúng tôi sẽ tương tác với nó.
Câu hỏi lớn nhất của tôi là: Liệu thứ gì đó như Project Astra có thay thế Trợ lý Google trên thiết bị Android không? Rốt cuộc, AI này có thể nhớ nơi bạn đặt đồ đạc của mình và tiếp thu các sắc thái – ít nhất, đó là những gì bản demo đã truyền tải. Tôi không thể nhận được câu trả lời từ một số người mà tôi đã hỏi trên Google. Nhưng tôi có niềm tin mãnh liệt rằng tương lai của Android sẽ ít phụ thuộc hơn vào việc chạm để tương tác với điện thoại mà phụ thuộc nhiều hơn vào việc nói chuyện với nó.