ChatGPT chatbot được sử dụng rộng rãi được thiết kế để tạo văn bản kỹ thuật số, mọi thứ từ thơ ca, tài liệu nghiên cứu cho đến chương trình máy tính. Nhưng khi một nhóm các nhà nghiên cứu trí tuệ nhân tạo tại công ty chip máy tính Nvidia chạm tay vào công nghệ cơ bản của chatbot, họ nhận ra rằng nó có thể làm được nhiều hơn thế.
Trong vòng vài tuần, họ đã dạy anh cách chơi Minecraft, một trong những trò chơi điện tử phổ biến nhất thế giới. Trong thế giới kỹ thuật số Minecraft, tôi học bơi, hái cây, săn lợn, khai thác vàng và xây nhà.
Linxi Fan, nhà nghiên cứu cấp cao tại Nvidia, hay còn gọi là Jim, cho biết: “Anh ấy có thể bước vào thế giới Minecraft và tự mình khám phá, thu thập tài liệu và cải thiện mọi loại kỹ năng”.
Dự án Đây là dấu hiệu ban đầu cho thấy các nhà nghiên cứu AI hàng đầu thế giới đang biến chatbot thành một loại hệ thống tự trị mới được gọi là tác nhân AI. Những đại lý này có thể làm được nhiều việc hơn là chỉ trò chuyện. Họ có thể sử dụng các ứng dụng phần mềm, trang web và các công cụ trực tuyến khác, bao gồm bảng tính, lịch trực tuyến, trang web du lịch, v.v.
Theo thời gian, nhiều nhà nghiên cứu cho biết, các tác nhân AI có thể trở nên phức tạp hơn nhiều, có thể thay thế nhân viên văn phòng và tự động hóa hầu hết mọi chức năng hành chính.
Jeff Clune, giáo sư khoa học máy tính tại Đại học British Columbia, người trước đây từng làm việc về loại công nghệ này với tư cách là nhà nghiên cứu tại OpenAI, một công ty khởi nghiệp ở San Francisco, cho biết: “Đó là một cơ hội kinh doanh khổng lồ, có khả năng trị giá hàng nghìn tỷ đô la”. công nghệ. Trò chuyệnGPT. “Điều này có một mặt trái rất lớn – và những hậu quả nghiêm trọng – đối với xã hội.”
Đại lý Nvidia đang chơi game. Các tác nhân tương tự có thể lên lịch cuộc họp, chỉnh sửa tệp, phân tích dữ liệu và tạo biểu đồ thanh nhiều màu. Ý tưởng là những hệ thống tự động này cuối cùng sẽ hoạt động như trợ lý cá nhân có khả năng xử lý nhiều nhiệm vụ trực tuyến.
Các đại lý ngày nay bị hạn chế và họ không thể tổ chức chính xác cuộc sống của bạn. ChatGPT có thể tìm kiếm trên trang web du lịch Expedia các chuyến bay đến New York, nhưng bạn vẫn phải tự mình đặt chỗ.
Công nghệ này, khi các nhà nghiên cứu cải tiến, có thể giúp nhân viên văn phòng và người tiêu dùng làm việc hiệu quả hơn. Nó cũng có thể thay đổi bản chất của trò chơi điện tử, cung cấp một làn sóng bot mới mà người chơi có thể chơi cùng và trò chuyện.
GPT-4, công nghệ hỗ trợ ChatGPT, được các nhà nghiên cứu gọi là mô hình ngôn ngữ lớn. Đó là một hệ thống trí tuệ nhân tạo học các kỹ năng bằng cách phân tích lượng dữ liệu khổng lồ.
Trong vài tháng qua, công nghệ này đã làm hàng trăm triệu người ngạc nhiên với cách nó tạo email, viết bài phát biểu và hát về hầu hết mọi chủ đề. Nhưng kỹ năng quan trọng nhất của anh ấy có thể là tài viết chương trình máy tính.
Anh ta có thể ngay lập tức tạo ra một chương trình vẽ một con kỳ lân hoặc thả những bông tuyết kỹ thuật số lên màn hình máy tính xách tay của mình. Các nhà phát triển phần mềm chuyên nghiệp có thể ủy thác mã mà họ có thể tích hợp vào các chương trình lớn hơn, bao gồm mọi thứ từ ứng dụng truyền thông xã hội đến công cụ tìm kiếm. Nhưng đây chỉ là một phần những gì công nghệ này có thể làm được. Nó cũng có thể tạo mã máy tính có thể được sử dụng trong các ứng dụng phần mềm và trang web khác.
Đây là cách Tiến sĩ Fan và các nhà nghiên cứu khác của Nvidia đã dạy GPT-4 cách chơi Minecraft. Tiến sĩ Fan nói: “Từ quan trọng nhất ở đây là mã. “Mã có thể hành động.”
Mọi người sử dụng các ứng dụng phần mềm và trang web bằng cách chạm vào các nút, menu và các công cụ đồ họa khác. Các tác nhân AI sử dụng các ứng dụng và trang web bằng cách truy cập vào giao diện lập trình ứng dụng hoặc API của chúng — mã phần mềm cơ bản cho phép chúng giao tiếp với các dịch vụ trực tuyến khác.
Ví dụ: nếu bạn yêu cầu một đại lý tải video lên Internet, họ có thể tạo mã được gọi là giao diện lập trình ứng dụng (API) do YouTube cung cấp. Selin Nayhin, nhà nghiên cứu giúp điều hành dự án tác nhân AI tự động AutoGPT, cho biết: “API chỉ là văn bản được sử dụng để giao tiếp với máy.
Về lý thuyết, một chatbot có thể viết mã để truy cập bất kỳ API nào trên Internet. Nhưng các chatbot ngày nay không đủ kỹ năng để làm được nhiều việc hơn ngoài những nhiệm vụ đơn giản. Ngay cả trong trường hợp đó, việc cho phép họ tự do chuyển vùng trực tuyến sẽ là một rủi ro bảo mật rất lớn. Vì vậy, các công ty bắt đầu nhỏ.
Vài tháng sau khi OpenAI công bố ChatGPT, họ đã lặng lẽ đưa ra một cách để chatbot có thể làm được nhiều việc hơn là chỉ tạo văn bản. Sau khi cài đặt một số plug-in — phần mềm nâng cao khả năng của bot — bạn có thể yêu cầu bot tìm kiếm các trang web du lịch như Expedia để biết các chuyến bay có sẵn, lấy bản đồ thành phố của bạn từ Google Earth hoặc thậm chí chuyển đổi bảng tính chi tiết chi tiêu hàng năm của bạn thành. .. Biểu đồ thanh nhiều màu.
Bởi vì nó đi kèm với một plugin được gọi là trình biên dịch mã, ChatGPT không chỉ có thể viết mã mà còn có thể chạy nó. Điều này cho phép công nghệ thực hiện ngay lập tức các tác vụ mà trước đây không thể thực hiện được, bao gồm chỉnh sửa bảng tính và chuyển đổi hình ảnh tĩnh thành video. Google, Microsoft và các công ty khác đang khám phá những công nghệ tương tự.
Ashley Lawrence, phó chủ tịch của Microsoft cho biết: “Đây là những dự án mà chúng tôi hình dung về cơ bản AI sẽ thay mặt bạn làm việc với các AI khác.
Các dự án độc lập như AutoGPT đang cố gắng tiến thêm một bước nữa. Ý tưởng là đưa ra các mục tiêu cho hệ thống như “thành lập công ty” hoặc “kiếm tiền”. Sau đó, nó sẽ tìm cách đạt được mục tiêu đó bằng cách tự đặt câu hỏi và kết nối với các dịch vụ Internet khác.
Hôm nay, điều này không hoạt động tốt lắm. Các hệ thống như AutoGPT có xu hướng bị mắc kẹt trong những vòng lặp vô tận. Nhưng các nhà nghiên cứu như Tiến sĩ Fan không ngừng nỗ lực cải tiến loại công nghệ này nhằm cố gắng làm cho nó hữu ích hơn và đáng tin cậy hơn.
Các nhà nghiên cứu khác đang xây dựng một loại tác nhân trí tuệ nhân tạo mới được thiết kế để sử dụng các công cụ phần mềm. Vào mùa hè năm 2022, Tiến sĩ Clune là thành viên của nhóm các nhà nghiên cứu tại OpenAI, người đã xây dựng một tác nhân có khả năng này Sử dụng các chương trình máy tính nhiều như mọi người – Click chuột nối tiếp click chuột, gõ phím nối tiếp phím bấm.
Tiến sĩ Clune và các đồng nghiệp của ông đã cung cấp cho hệ thống hàng giờ các video trực tuyến chiếu cảnh mọi người chơi Minecraft. Bằng cách phân tích cách mọi người sử dụng chuột và bàn phím để điều hướng trong thế giới kỹ thuật số của Minecraft, hệ thống đã học cách tự chạy trò chơi.
Các công ty khác đang xây dựng, bao gồm cả công ty khởi nghiệp có tên Adept Đại lý tương tự Sử dụng các trang web như Wikipedia, Redfin và Craigslist cũng như các ứng dụng văn phòng phổ biến của các công ty như Salesforce.
Tiến sĩ Clune cho biết loại tác nhân này cuối cùng sẽ cho phép AI sử dụng nhiều ứng dụng phần mềm và trang web hơn. Ông nói: Mọi người sẽ có quyền truy cập vào một trợ lý kỹ thuật số có thể làm hầu hết mọi việc trên Internet. Điều này sẽ làm cho cuộc sống dễ dàng hơn nhưng nó cũng có thể thay thế vô số công việc.
Ông nói: “Nếu AI có thể làm được bất cứ điều gì chúng ta có thể làm thì nó không chỉ thay thế những công việc nhàm chán. “Nó thay thế mọi nhiệm vụ.”
“Kẻ đam mê du lịch tồi tệ. Kẻ nghiện internet hèn hạ ghê tởm. Rượu vô cớ.