Vào cuối I/O, hội nghị nhà phát triển thường niên của Google tại Shoreline Amphitheatre ở Mountain View, Giám đốc điều hành Google Sundar Pichai tiết lộ rằng công ty đã nói “AI” 121 lần. Về cơ bản, đây là nội dung chính trong bài phát biểu quan trọng kéo dài hai giờ của Google – đưa AI vào tất cả các ứng dụng và dịch vụ của Google được hơn hai tỷ người trên thế giới sử dụng. Dưới đây là tất cả các cập nhật lớn được Google công bố tại sự kiện.
Bản cập nhật Gemini 1.5 Flash và Gemini 1.5 Pro
Google vừa công bố một mô hình AI hoàn toàn mới có tên Gemini 1.5 Flash, được cho là được tối ưu hóa về tốc độ và hiệu quả. Flash nằm giữa Gemini 1.5 Pro và Gemini 1.5 Nano, mẫu nhỏ nhất của công ty chạy nguyên bản trên thiết bị. Google cho biết họ tạo ra Flash vì các nhà phát triển muốn có một mô hình nhẹ hơn, ít tốn kém hơn Gemini Pro để xây dựng các ứng dụng và dịch vụ được hỗ trợ bởi AI trong khi vẫn giữ lại một số thứ như cửa sổ ngữ cảnh dài hàng triệu token giúp Gemini Pro khác biệt so với các mô hình cạnh tranh. Cuối năm nay, Google sẽ tăng gấp đôi cửa sổ ngữ cảnh Gemini lên 2 triệu mã thông báo, nghĩa là nó sẽ có thể xử lý 2 giờ video, 22 giờ âm thanh và hơn 60.000 dòng mã hoặc hơn 1,4 triệu từ trong cùng một nhịp. . thời gian. .
Dự án Astra
Google đã giới thiệu Project Astra, phiên bản đầu tiên của trợ lý toàn cầu được hỗ trợ bởi AI, mà Demis Hassabis, Giám đốc điều hành DeepMind của Google, cho biết đây là phiên bản AI của Google “có thể hữu ích trong cuộc sống hàng ngày”.
Trong một video mà Google cho biết được quay trong một lần quay, một người dùng Astra di chuyển quanh văn phòng của Google ở London, cầm điện thoại và hướng máy ảnh vào những thứ khác nhau – một chiếc loa, một số mã trên bảng trắng, bên ngoài cửa sổ – và có một cuộc trò chuyện tự nhiên với ứng dụng về giao diện của nó. Và ở một trong những khoảnh khắc ấn tượng nhất của video, cô ấy đã nói chính xác cho người dùng biết nơi cô ấy để kính trước đây mà người dùng không hề nhấc kính lên.
Video kết thúc với sự ngạc nhiên – khi người dùng tìm thấy chiếc kính bị thiếu và đeo vào, chúng tôi biết rằng họ có hệ thống camera tích hợp và có thể sử dụng Project Astra để trò chuyện liền mạch với người dùng, điều này có thể gợi ý rằng Google có thể đang nghiên cứu đối thủ cạnh tranh với kính thông minh Ray Ban của Meta.
Hỏi Google Hình ảnh
Google Photos vốn đã thông minh khi tìm kiếm ảnh hoặc video cụ thể, nhưng với AI, Google đang đưa mọi thứ lên một tầm cao mới. Nếu là người đăng ký Google One ở Hoa Kỳ, bạn có thể hỏi Google Photos một câu hỏi phức tạp như “Cho tôi xem bức ảnh đẹp nhất từ mọi công viên quốc gia mà bạn đã ghé thăm” khi tính năng này được triển khai trong vài năm tới tháng. Google Photos sẽ sử dụng thông tin GPS của bạn cũng như đánh giá của riêng mình về điều gì là “tốt nhất” để cung cấp cho bạn các tùy chọn. Bạn cũng có thể yêu cầu Google Photos tạo chú thích để đăng ảnh lên mạng xã hội.
Xem và tưởng tượng 3
Các công cụ tạo phương tiện truyền thông mới được hỗ trợ bởi AI của Google được gọi là Veo và Imagine 3. Veo là câu trả lời của Google cho Sora của OpenAI. Google cho biết họ có thể tạo ra các video 1080p “chất lượng cao” có thời lượng “hơn một phút” và có thể hiểu các khái niệm điện ảnh như tua nhanh thời gian.
Trong khi đó, Imagen 3 là trình tạo văn bản thành hình ảnh mà Google tuyên bố xử lý văn bản tốt hơn so với người tiền nhiệm của nó, Imagen 2. Kết quả là mô hình chuyển văn bản thành hình ảnh có chất lượng cao nhất của công ty với “mức độ chi tiết đáng kinh ngạc” cho “thực tế”. , hình ảnh sống động như thật.” ” và ít hiện vật hơn – về cơ bản giúp nó chống lại DALLE-3 của OpenAI.
Cập nhật lớn cho Google Tìm kiếm
Google đang thực hiện những thay đổi lớn về cách hoạt động cơ bản của tìm kiếm. Hầu hết các bản cập nhật được công bố hôm nay đều giống như khả năng đặt những câu hỏi thực sự phức tạp (“Tìm các phòng tập yoga hoặc Pilates tốt nhất ở Boston và xem thông tin chi tiết về các dịch vụ cũng như thời gian đi bộ từ Beacon Hill.”) và sử dụng tìm kiếm để lên kế hoạch cho bữa ăn và kỳ nghỉ. Nó sẽ chỉ khả dụng nếu bạn đăng ký Search Labs, nền tảng của công ty cho phép mọi người dùng thử các tính năng beta.
Nhưng tính năng mới quan trọng mà Google gọi là Tổng quan về AI và tính năng mà công ty đã thử nghiệm trong một năm nay, cuối cùng cũng đã được tung ra cho hàng triệu người ở Hoa Kỳ. Theo mặc định, Google Tìm kiếm hiện sẽ hiển thị các câu trả lời do AI tạo ra ở đầu kết quả và công ty cho biết họ sẽ cung cấp tính năng này cho hơn một tỷ người dùng trên toàn thế giới vào cuối năm nay.
Song Tử trên Android
Google đang tích hợp Gemini trực tiếp vào Android. Khi Android 15 được phát hành vào cuối năm nay, Gemini sẽ biết bạn đang phát ứng dụng, ảnh hoặc video nào và họ sẽ có thể kéo ứng dụng, ảnh hoặc video đó dưới dạng lớp phủ và đặt câu hỏi theo ngữ cảnh cụ thể. Điều đó khiến Trợ lý Google đã thực hiện việc này ở đâu? Bạn biết ai! Google hoàn toàn không đề cập đến vấn đề này trong bài phát biểu quan trọng ngày hôm nay.
Ngoài ra còn có một loạt các cập nhật khác. Google cho biết họ sẽ thêm hình mờ kỹ thuật số vào video và văn bản do AI tạo ra, giúp Gemini có thể truy cập được trong bảng điều khiển bên trong Gmail và Docs, hỗ trợ đồng nghiệp ảo được hỗ trợ bởi AI trong Workspace, nghe các cuộc gọi điện thoại và phát hiện xem bạn có thực sự bị lừa đảo hay không. thời gian, và nhiều hơn nữa.
Theo dõi trực tiếp tất cả tin tức từ Google I/O 2024 đây!
“Kẻ đam mê du lịch tồi tệ. Kẻ nghiện internet hèn hạ ghê tởm. Rượu vô cớ.