Mô hình AI mới của Microsoft có thể thách thức GPT-4 và Google Gemini

Phóng to / Mustafa Suleiman, đồng sáng lập và Giám đốc điều hành của Inflection AI UK Ltd., tại tòa thị chính vào ngày thứ hai của Diễn đàn Kinh tế Thế giới (WEF) ở Davos, Thụy Sĩ, vào Thứ Tư, ngày 17 tháng 1 năm 2024. Suleiman đã cùng Microsoft đi dạo.

Theo báo cáo từ Microsoft, Microsoft đang nghiên cứu một mô hình ngôn ngữ AI quy mô lớn mới có tên MAI-1, có thể cạnh tranh với các mô hình mới nhất của Google, Anthropic và OpenAI. thông tin. Đây là lần đầu tiên Microsoft phát triển một mô hình AI nội bộ ở quy mô này kể từ khi đầu tư hơn 10 tỷ USD vào OpenAI để có quyền tái sử dụng các mô hình AI của công ty khởi nghiệp này. GPT-4 của OpenAI không chỉ hỗ trợ ChatGPT mà còn cả Microsoft Copilot.

Sự phát triển của MAI-1 đang được dẫn dắt bởi Mustafa Soliman, cựu lãnh đạo AI của Google, người gần đây nhất giữ chức vụ Giám đốc điều hành của công ty khởi nghiệp AI Inflection trước khi Microsoft mua lại phần lớn nhân viên và tài sản trí tuệ của công ty khởi nghiệp này với giá 650 triệu USD vào tháng 3. Mặc dù MAI-1 có thể dựa trên các công nghệ do các cựu nhân viên Inflection mang đến, nhưng nó được cho là một mô hình ngôn ngữ lớn (LLM) hoàn toàn mới, như đã được xác nhận bởi hai nhân viên Microsoft quen thuộc với dự án.

READ  Kết xuất của Galaxy S23 Ultra mới cho thấy màn hình phẳng

Với gần 500 tỷ tham số, MAI-1 sẽ lớn hơn nhiều so với các mô hình nguồn mở trước đây của Microsoft (chẳng hạn như Phi-3 mà chúng tôi đã đề cập vào tháng trước), đòi hỏi nhiều sức mạnh tính toán và dữ liệu đào tạo hơn. Điều này được cho là đã đưa MAI-1 vào một đẳng cấp tương tự như GPT-4 của OpenAI, tức là… tin đồn Cho hơn một nghìn tỷ thông số (trong sự kết hợp của các chuyên gia) và cao hơn nhiều so với các mô hình nhỏ hơn như mô hình Meta và Mistral với 70 tỷ thông số.

Sự phát triển của MAI-1 báo hiệu một cách tiếp cận kép đối với AI trong Microsoft, tập trung vào các mô hình ngôn ngữ nhỏ chạy cục bộ cho thiết bị di động và các mô hình mới hơn, lớn hơn chạy trên nền tảng đám mây. Apple được cho là đang khám phá một cách tiếp cận tương tự. Nó cũng nêu bật mong muốn của công ty trong việc khám phá sự phát triển AI độc lập với OpenAI, công nghệ hiện đang hỗ trợ các tính năng AI đầy tham vọng nhất của Microsoft, bao gồm cả chatbot được tích hợp trong Windows.

Theo một nguồn thông tin, mục đích chính xác của MAI-1 vẫn chưa được xác định (ngay cả trong Microsoft) và việc sử dụng tối ưu nó sẽ phụ thuộc vào hiệu suất của nó. Để đào tạo mô hình, Microsoft đã dành riêng một cụm máy chủ lớn có GPU Nvidia và thu thập dữ liệu đào tạo từ nhiều nguồn khác nhau, bao gồm văn bản được tạo bởi GPT-4 của OpenAI và dữ liệu Internet công cộng.

READ  Bản demo Gex chưa được phát hành đã xuất hiện trực tuyến

Tùy thuộc vào tiến độ trong những tuần tới, thông tin cho thấy Microsoft có thể xem trước MAI-1 ngay tại hội nghị Nhà phát triển Xây dựng vào cuối tháng này, theo báo cáo của một trong những nguồn được bài đăng trích dẫn.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *