OpenAI ra mắt phiên bản 3 của DALL-E

OpenAI đã công bố phiên bản thứ ba của nền tảng nghệ thuật thị giác được hỗ trợ bởi AI DALL-E, hiện cho phép người dùng sử dụng ChatGPT để tạo xác nhận quyền sở hữu và bao gồm nhiều tùy chọn bảo mật hơn.

DALL-E chuyển đổi lời nhắc văn bản thành hình ảnh. Nhưng ngay cả DALL-E 2 cũng mắc lỗi, thường bỏ qua một số từ ngữ nhất định. Các nhà nghiên cứu của OpenAI cho biết phiên bản mới nhất hiểu ngữ cảnh tốt hơn nhiều.

Một tính năng mới của DALL-E 3 là tích hợp với ChatGPT. Với ChatGPT, không ai phải tự mình đưa ra thông tin chi tiết Bộ định tuyến cho định tuyến DALL-E 3; Họ chỉ cần yêu cầu ChatGPT đưa ra lời nhắc và chatbot sẽ viết một đoạn văn (DALL-E hoạt động tốt nhất với các câu dài hơn) để DALL-E làm theo 3. Những người dùng khác vẫn có thể sử dụng lời nhắc của riêng mình nếu có ý tưởng cụ thể cho DALL-E.

Trong bản demo cho cái rìaAditya Ramesh, điều tra viên chính và lãnh đạo nhóm DALL-E, đã nhờ ChatGPT giúp anh ấy nghĩ ra logo cho một nhà hàng ramen trên núi. ChatGPT sau đó đã viết một lời nhắc dài hơn và DALL-E đưa ra bốn tùy chọn. Tôi thích nhất là hình vẽ một ngọn núi với những chiếc mũ tuyết đựng mì ramen, nước dùng chảy như thác nước và trứng muối trên mặt đất như những viên đá trong vườn – mặc dù nó trông giống hình minh họa về một số món ăn dễ thương hơn là logo nhà hàng truyền thống. OpenAI cho biết, kết nối này với chatbot cho phép nhiều người hơn tạo ra tác phẩm nghệ thuật AI vì họ không cần phải giỏi đưa ra lời nhắc.

READ  Độc quyền: Apple giải thích cách MacBook Air mới được thiết kế để đi du lịch

DALL-E được phát hành lần đầu tiên vào tháng 1 năm 2021, trước các nền tảng nghệ thuật AI chuyển văn bản thành hình ảnh khác của Stability AI và Midjourney. Vào thời điểm DALL-E 2 được phát hành vào năm 2022, OpenAI đã mở danh sách chờ để kiểm soát ai có thể sử dụng nền tảng này sau những lời chỉ trích rằng DALL-E có thể tạo ra hình ảnh rõ ràng, chân thực và thể hiện sự thiên vị khi tạo hình ảnh. Công ty đã xóa danh sách chờ vào tháng 9 năm ngoái và mở DALL-E 2 ra công chúng.

Phiên bản DALL-E mới này sẽ được phát hành đầu tiên cho người dùng ChatGPT Plus và ChatGPT Enterprise vào tháng 10, sau đó là Research Labs và dịch vụ API của nó vào mùa thu. OpenAI có kế hoạch hoãn phát hành DALL-E 3 nhưng chưa cam kết ngày phát hành cho phiên bản công khai miễn phí.

OpenAI tuyên bố đã tập trung rất nhiều công việc vào DALL-E 3 trong việc tạo ra các biện pháp bảo mật mạnh mẽ để ngăn chặn việc tạo ra các hình ảnh tục tĩu hoặc có khả năng bị phản đối. OpenAI cho biết họ đã làm việc với một nhóm đỏ bên ngoài – một nhóm cố tình phá vỡ hệ thống để kiểm tra tính toàn vẹn của nó – và dựa vào các bộ phân loại đầu vào, một phương pháp dạy mô hình ngôn ngữ bỏ qua một số từ nhất định để tránh những lời nhắc rõ ràng hoặc bạo lực. DALL-E 3 cũng sẽ không thể tạo lại hình ảnh của các nhân vật của công chúng – miễn là họ có đề cập cụ thể đến tên đó.

READ  Đoạn giới thiệu Fortnite bị rò rỉ tiết lộ Người Nhện và một hòn đảo mới cho Chương 3

Sandhini Agarwal, một nhà nghiên cứu chính sách của công ty, cho biết cô “rất tin tưởng” vào các biện pháp an toàn của công ty, nhưng giải thích rằng mô hình này không ngừng cải tiến và chưa hoàn hảo. Đại diện OpenAI cho biết trong một email rằng DALL-E 3 đã được đào tạo để từ chối tạo ra những hình ảnh theo phong cách của những nghệ sĩ sống. Không giống như DALL-E 2, khi được yêu cầu, có thể bắt chước nghệ thuật theo phong cách của một số nghệ sĩ nhất định.

OpenAI cũng sẽ, để tránh các vụ kiện, cho phép các nghệ sĩ chọn không tham gia tác phẩm nghệ thuật của họ trong các phiên bản tương lai của mô hình AI chuyển văn bản thành hình ảnh. Người sáng tạo có thể gửi hình ảnh mà họ sở hữu quyền và yêu cầu xóa hình ảnh đó theo biểu mẫu trên trang web của họ. Phiên bản tương lai của DALL-E có thể loại bỏ các kết quả trông giống với hình ảnh và phong cách của nghệ sĩ. Các nghệ sĩ đã kiện các đối thủ cạnh tranh của DALL-E Stability AI và Midjourney, cùng với trang nghệ thuật DeviantArt, vì bị cáo buộc sử dụng các tác phẩm có bản quyền của họ để đào tạo các mô hình chuyển văn bản thành hình ảnh.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *