Thứ Tư Google Thông báo Một nhóm mô hình ngôn ngữ AI mới được gọi là Gemma, là các mô hình tự do có trọng lượng mở được xây dựng trên công nghệ tương tự như các mô hình Gemini mạnh mẽ hơn nhưng khép kín. Không giống như Gemini, các mẫu Gemma có thể chạy cục bộ trên máy tính để bàn hoặc máy tính xách tay. Đây là bản phát hành quan trọng đầu tiên của Mô hình ngôn ngữ lớn (LLM) mở của Google kể từ khi ChatGPT của OpenAI bắt đầu cơn sốt chatbot được hỗ trợ bởi AI vào năm 2022.
Mô hình Gemma có hai kích cỡ: Gemma 2B (2 tỷ tham số) và Gemma 7B (7 tỷ tham số), mỗi mô hình đều có sẵn ở các biến thể được đào tạo trước và điều chỉnh theo hướng dẫn. Trong AI, tham số là các giá trị trong mạng thần kinh xác định hành vi của mô hình AI và trọng số là tập hợp con của các tham số này được lưu trữ trong một tệp.
Được phát triển bởi Google DeepMind và các nhóm AI khác của Google, Gemma dựa trên các kỹ thuật đã học được khi phát triển Gemini, cái tên quen thuộc của những sinh viên LLM có năng lực nhất (đối mặt với công chúng) tại Google, bao gồm cả trợ lý hỗ trợ trợ lý Gemini AI của cô. Google cho biết tên này xuất phát từ tiếng Latin GemmaCó nghĩa là “đá quý”.
Trong khi Gemma là MBA mở lớn đầu tiên của Google kể từ khi ra mắt ChatGPT (phát hành Mô hình nghiên cứu nhỏ hơn Giống như FLAN-T5 trước đây), đây không phải là đóng góp đầu tiên của Google cho nghiên cứu AI mở. Công ty trích dẫn sự phát triển Kỹ thuật máy biến ápngoài các phiên bản như TensorFlow, Bert, T5Và Jax Là những đóng góp lớn, sẽ không có gì phải bàn cãi khi nói rằng đây là những đóng góp quan trọng trong lĩnh vực này.
Do công suất thấp hơn và tỷ lệ Kết hợp cao, các chương trình LLM nhỏ hơn với trọng lượng mở cho đến gần đây giống như các bản trình diễn kỹ thuật hơn, với một số chương trình lớn hơn bắt đầu phù hợp với mức hiệu suất GPT-3.5. Tuy nhiên, các chuyên gia cho rằng các mô hình AI nguồn mở và có trọng số là những bước cần thiết để đảm bảo tính minh bạch và quyền riêng tư trong chatbot. Tuy nhiên, Google Gemma không phải là “nguồn mở”, vì thuật ngữ đó thường đề cập đến một tệp Một loại giấy phép phần mềm cụ thể Với một số dây kèm theo.
Trên thực tế, Gemma có vẻ giống như một trò chơi rõ ràng để sánh ngang với Meta, vốn đã thành công rực rỡ khi tung ra các mô hình có tỷ trọng mở (chẳng hạn như LLaMA và Llama 2) kể từ tháng 2 năm ngoái. Công nghệ này trái ngược với các mô hình AI như GPT-4 Turbo của OpenAI, vốn chỉ khả dụng thông qua ứng dụng ChatGPT và API đám mây và không thể chạy cục bộ. Một báo cáo của Reuters Gemma tập trung vào góc độ Meta và dự đoán rằng Google hy vọng sẽ thu hút được nhiều nhà phát triển hơn vào đó Trí tuệ nhân tạo Vertex Nền tảng đám mây.
Chúng tôi chưa sử dụng Gemma; Tuy nhiên, Google tuyên bố rằng mô hình 7B vượt trội hơn các mô hình Llama 2 7B và 13B của Meta trên một số tiêu chí về toán học, tạo mã Python, kiến thức chung và các tác vụ suy luận logic. Nó có sẵn ngày hôm nay thông qua Kajalmột nền tảng cộng đồng dành cho học máy và Ôm mặt.
Trong một tin tức khác, Google đã ghép nối phiên bản Gemma với “Bộ công cụ AI sáng tạo có trách nhiệm”, mà Google hy vọng sẽ cung cấp hướng dẫn và công cụ để phát triển thứ mà công ty gọi là ứng dụng AI “an toàn và có trách nhiệm”.