Tại sự kiện Search On ngày hôm nay, Google đã giới thiệu một số tính năng mới, được kết hợp với nhau, nỗ lực mạnh mẽ nhất của hãng vẫn chưa giúp mọi người làm được nhiều việc hơn là nhập một vài từ vào hộp tìm kiếm. Bằng cách tận dụng công nghệ học máy mới cho Mô hình hợp nhất đa nhiệm (MUM) theo những cách nhỏ, công ty hy vọng sẽ bắt đầu một chu kỳ hiệu quả: Nó sẽ cung cấp các câu trả lời chi tiết hơn và giàu ngữ cảnh hơn, đồng thời hy vọng người dùng sẽ hỏi chi tiết và ngữ cảnh hơn – câu hỏi phong phú. Công ty hy vọng kết quả cuối cùng sẽ là trải nghiệm tìm kiếm phong phú và sâu sắc hơn.
Phó chủ tịch cấp cao của Google Prabhakar Raghavan giám sát hoạt động tìm kiếm cùng với Trợ lý, quảng cáo và các sản phẩm khác. Anh ấy thích nói – và anh ấy đã lặp lại trong một cuộc phỏng vấn vào Chủ nhật tuần trước – rằng “nghiên cứu không phải là một vấn đề đã được giải quyết”. Điều đó có thể đúng, nhưng những vấn đề mà anh ấy và nhóm của anh ấy đang cố gắng giải quyết bây giờ không phải là chuyện cãi vã trên web mà là việc thêm ngữ cảnh vào những gì họ tìm thấy ở đó.
Về phần mình, Google sẽ bắt đầu chứng tỏ khả năng nhận ra các nhóm chủ đề liên quan đến việc sử dụng máy học và trình bày chúng cho bạn một cách có tổ chức. Bản thiết kế lại sắp tới của Google Tìm kiếm sẽ bắt đầu hiển thị các hộp “Những điều cần biết” đưa bạn đến các chủ đề phụ khác nhau. Khi có một phần của video có liên quan đến chủ đề chung – ngay cả khi nó không phải là toàn bộ video – bạn sẽ được gửi đến đó. Kết quả mua sắm của bạn sẽ bắt đầu hiển thị hàng có sẵn trong các cửa hàng lân cận và thậm chí cả quần áo có kiểu dáng khác nhau được liên kết với tìm kiếm của bạn.
Về phần bạn, Google – mặc dù thuật ngữ “câu hỏi” có lẽ tốt hơn – cung cấp những cách mới để tìm kiếm ngoài hộp văn bản. Nó đang tạo ra một cú hích lớn để chuyển phần mềm nhận dạng hình ảnh Google Lens đến nhiều nơi hơn. Nó sẽ được đưa vào ứng dụng Google trên iOS cũng như trong trình duyệt web Chrome trên thiết bị máy tính để bàn. Và với MUM, Google hy vọng sẽ giúp người dùng làm được nhiều việc hơn là chỉ xác định hoa hoặc địa danh, mà thay vào đó là sử dụng Ống kính trực tiếp để đặt câu hỏi và mua sắm.
Raghavan nói: “Đó là một chu kỳ mà tôi nghĩ sẽ tiếp tục leo thang. “Nhiều công nghệ hơn dẫn đến khả năng chi trả của người dùng cao hơn, dẫn đến biểu hiện của người dùng tốt hơn và nó sẽ đòi hỏi nhiều hơn ở chúng ta về mặt kỹ thuật.”
Hai khía cạnh này của phương trình tìm kiếm nhằm khởi động giai đoạn tiếp theo của tìm kiếm Google, khi các thuật toán học máy trở nên nổi bật hơn trong quá trình này bằng cách tổ chức và trình bày thông tin trực tiếp. Về vấn đề này, nỗ lực của Google sẽ được giúp đỡ rất nhiều bởi những tiến bộ gần đây trong xử lý ngôn ngữ trí tuệ nhân tạo. Nhờ các hệ thống được gọi là Mô hình ngôn ngữ lớn (MUM là một trong những hệ thống này), việc học máy sẽ tốt hơn nhiều trong việc lập bản đồ các kết nối giữa các từ và chủ đề. Đó là những kỹ năng mà công ty tận dụng để làm cho nghiên cứu không chỉ chính xác hơn mà còn mang tính khám phá nhiều hơn và hy vọng sẽ hữu ích hơn.
Một ví dụ của Google rất hữu ích. Bạn có thể không có ý tưởng đầu tiên về tên của các bộ phận xe đạp của mình, nhưng nếu có gì đó bị hỏng, bạn sẽ cần biết. Google Lens có thể xác định trực quan derailleur (bộ phận chuyển số treo gần bánh sau) và thay vì chỉ cung cấp cho bạn một phần thông tin riêng biệt, nó sẽ cho phép bạn đặt câu hỏi trực tiếp về cách sửa lỗi đó và đưa bạn đến thông tin (trong trường hợp này là tuyệt vời) youtube hàng đầu kênh).
Thúc đẩy để có nhiều người dùng mở Google Lens thường xuyên hơn theo đúng nghĩa của nó, nhưng bức tranh lớn hơn (có thể nói) là Google đang cố gắng thu thập nhiều ngữ cảnh hơn xung quanh các truy vấn của bạn. Raghavan cho biết, các tìm kiếm đa phương tiện phức tạp hơn kết hợp văn bản và hình ảnh yêu cầu “một mức bối cảnh hoàn toàn khác mà nhà cung cấp của chúng tôi nên có, và do đó giúp chúng tôi rất nhiều trong việc nhận được nhiều ngữ cảnh nhất có thể”.
Chúng ta còn một chặng đường dài từ cái gọi là “10 liên kết xanh” của kết quả tìm kiếm mà Google cung cấp. Nó đã hiển thị hộp thông tin, kết quả hình ảnh và câu trả lời trực tiếp trong một thời gian dài. Quảng cáo ngày nay là một bước tiến xa hơn, vì thông tin Google cung cấp không chỉ là nhãn thông tin có liên quan, mà là bản tóm tắt những gì máy móc của nó hiểu được bằng cách tìm kiếm trên web.
Trong một số trường hợp – chẳng hạn như mua sắm – sự chắt lọc này có nghĩa là bạn có thể sẽ gửi nhiều lượt xem trang hơn cho Google. Đối với Lens, điều quan trọng là phải theo dõi xu hướng này: các tìm kiếm của Google ngày càng đẩy bạn đến các sản phẩm của chính Google. Nhưng có một mối nguy hiểm lớn hơn ở đây. Việc Google cho bạn biết nhiều thứ hơn trực tiếp làm tăng gánh nặng mà bạn luôn mang theo: nói với ít thành kiến hơn.
Bởi đó, tôi muốn nói đến sự thiên vị theo hai nghĩa khác nhau. Đầu tiên là kỹ thuật: Các mô hình học máy mà Google muốn sử dụng để cải thiện tìm kiếm có các vấn đề được ghi nhận rõ ràng về thành kiến chủng tộc và giới tính. Họ đã được đào tạo bằng cách đọc các phần lớn của trang web, và kết quả là họ có xu hướng nhận ra những cách nói kém. Các vấn đề của Google với nhóm đạo đức AI đã được ghi nhận đầy đủ vào thời điểm này – đó là Hai nhà nghiên cứu cấp cao bị sa thải Sau khi họ xuất bản một bài báo về chủ đề này. Với tư cách là Phó Chủ tịch phụ trách Tìm kiếm của Google, Pandu Nayak cho biết mép‘NS James Vincent trong bài viết của anh ấy về các thông báo MUM hôm nayGoogle hiểu rằng tất cả các mô hình ngôn ngữ đều có thành kiến, nhưng công ty tin rằng họ có thể tránh “đưa chúng ra cho mọi người sử dụng trực tiếp”.
Dù nó là gì (và rõ ràng là có thể không) nó tránh được một câu hỏi phụ thuộc khác và một dạng thiên vị khác. Khi Google bắt đầu trực tiếp cho bạn biết nhiều hơn về các kết hợp thông tin của riêng họ, bạn sẽ nói theo quan điểm nào? Là nhà báo, chúng tôi thường nói về cách mà cái gọi là “xem từ hư không” là một cách trình bày báo cáo của chúng tôi không phù hợp. Quan điểm của Google là gì? Đây là một vấn đề mà công ty đã phải đối mặt trong quá khứ, và đôi khi được gọi là vấn đề “một câu trả lời đúng”. Khi Google cố gắng cung cấp cho mọi người những câu trả lời ngắn gọn, dứt khoát bằng các hệ thống tự động, nó thường kết thúc Đăng thông tin xấu.
Khi giới thiệu câu hỏi này, Raghavan trả lời bằng cách chỉ ra sự phức tạp của các mô hình ngôn ngữ hiện đại. “Hầu hết tất cả các mô hình ngôn ngữ, nếu bạn nhìn vào chúng, đều là đám cưới trong không gian chiều cao. Một số phần của không gian này có xu hướng đáng tin cậy hơn và một số phần ít đáng tin cậy hơn. Chúng ta có thể đánh giá những điều này một cách máy móc khá dễ dàng. Thách thức là Raghavan nói. Làm thế nào để giới thiệu một số sự phức tạp đó cho người dùng mà không làm họ bối rối.
Nhưng tôi cảm thấy câu trả lời thực sự là, ít nhất bây giờ, Google đang làm những gì có thể để tránh đối mặt với câu hỏi về quan điểm của công cụ tìm kiếm bằng cách tránh các khu vực mà nó có thể bị cáo buộc, theo cách nói của Raghavan, “chỉnh sửa quá mức” . Thông thường, khi nói chuyện với các giám đốc điều hành của Google về những vấn đề thiên vị và lòng tin này, họ tập trung vào các phần dễ nhận biết của không gian chiều cao đó như “độ tin cậy”.
Ví dụ: các hộp “Những điều cần biết” mới của Google sẽ không xuất hiện khi ai đó tìm kiếm những thứ mà Google đã xác định là “đặc biệt có hại / nhạy cảm”, mặc dù người phát ngôn cho biết Google “không cho phép hoặc chặn một số danh mục được quy định”, nhưng hệ thống của chúng tôi có thể hiểu những chủ đề mà các loại tính năng này nên hoặc không nên hiển thị. ”
Tìm kiếm của Google, các đầu vào và đầu ra, các thuật toán và các mô hình ngôn ngữ của Google đã trở nên gần như phức tạp không thể tưởng tượng được. Khi Google cho chúng tôi biết bây giờ nó có thể hiểu nội dung của các video, chúng tôi cho rằng nó có các bộ phận tính toán để thực hiện điều đó – nhưng sự thật là ngay cả việc lập chỉ mục một bộ sưu tập khổng lồ như vậy cũng là một nhiệm vụ lớn so với nhiệm vụ lập chỉ mục web ban đầu. (Google chỉ lập chỉ mục các tập lệnh âm thanh cho một tập hợp con của YouTube, cho bản ghi, mặc dù với MUM, họ hướng đến việc lập chỉ mục trực quan và các nền tảng video khác trong tương lai.)
Thông thường, khi bạn nói chuyện với các nhà khoa học máy tính, vấn đề người bán rong sẽ xuất hiện. Đó là một câu đố nổi tiếng trong đó bạn cố gắng tính toán con đường ngắn nhất có thể giữa một số thành phố nhất định, nhưng nó cũng là một phép ẩn dụ phong phú để suy nghĩ về cách máy tính thực hiện các kế hoạch của chúng.
Raghavan nói: “Nếu bạn đưa cho tôi tất cả các máy móc trên thế giới, tôi có thể giải quyết những trường hợp khá lớn. Nhưng đối với nghiên cứu, anh ấy nói rằng nó chưa được giải quyết và có lẽ không thể giải quyết được một khi có thêm nhiều máy tính được ném vào anh ấy. Thay vào đó, Google cần đưa ra các phương pháp tiếp cận mới, chẳng hạn như MUM, để sử dụng tốt hơn các tài nguyên mà Google có thể tạo ra trên thực tế. “Nếu bạn đưa cho tôi tất cả các máy móc ngoài kia, tôi sẽ vẫn bị giới hạn bởi sự tò mò của con người và nhận thức của mình.”
Những cách hiểu thông tin mới của Google rất ấn tượng, nhưng thách thức là bạn sẽ làm gì với thông tin và cách bạn trình bày thông tin đó. Điều buồn cười trong vấn đề của nhân viên bán hàng lưu động là dường như không ai dừng lại và hỏi chính xác là trong trường hợp, anh ta đang cho tất cả khách hàng của mình xem điều gì khi anh ta đi từng cửa?