Có một trình chỉnh sửa ảnh mới của Apple, nếu bạn biết tìm nó ở đâu. iPhone Kings đã hợp tác với các nhà nghiên cứu tại Đại học California, Santa Barbara để xây dựng một công cụ cho phép bạn chỉnh sửa ảnh và hình ảnh bằng các hướng dẫn văn bản. Nó không có bản phát hành chính thức, nhưng các nhà nghiên cứu đang lưu trữ một bản demo mà bạn có thể tự mình thử, bản này đã được phát hiện lần đầu tiên Công nghệ cực đỉnh.
Dự án có tên là Chỉnh sửa hình ảnh có hướng dẫn bằng mô hình ngôn ngữ lớn đa phương thức (MGIE). Hiện nay trên thị trường có rất nhiều phần mềm chỉnh sửa ảnh AI. Photoshop hiện đi kèm với các công cụ AI tích hợp và các công cụ khác như DALL-E của OpenAI cho phép bạn chỉnh sửa hình ảnh cũng như tạo chúng từ toàn bộ vải. Tuy nhiên, nếu bạn đã từng thử sử dụng chúng trước đây, bạn sẽ biết rằng điều đó có thể hơi khó chịu. Trong nhiều trường hợp, AI gặp khó khăn trong việc hiểu chính xác những gì bạn đang tìm kiếm.
Sự đổi mới tại MGIE bổ sung thêm một lớp giải thích AI khác. Khi bạn nói với AI những gì bạn muốn xem, MGIE trước tiên sử dụng AI dựa trên văn bản để làm cho hướng dẫn của bạn rõ ràng và mang tính mô tả hơn. Các nhà nghiên cứu cho biết trong một bài báo: “Các kết quả thử nghiệm cho thấy các hướng dẫn biểu cảm là cần thiết để chỉnh sửa hình ảnh dựa trên hướng dẫn”. giấy Được xuất bản trên arXiv. “MGIE có thể dẫn đến sự cải thiện đáng kể.”
Apple đã xuất bản phiên bản nguồn mở của phần mềm trên github. Nếu thông minh, bạn có thể tự chạy một bản sao MGIE, nhưng các nhà nghiên cứu đã thiết lập công cụ này trên… Ôm mặt. Nó chạy hơi chậm khi có nhiều người sử dụng, nhưng đó là một trải nghiệm thú vị.
Những gã khổng lồ công nghệ như Apple đang chi hàng tỷ USD vào những dự án mà không ai nhìn thấy, vì vậy hoàn toàn có khả năng cái gọi là công cụ MGIE sẽ không bao giờ được phát hành chính thức. Apple đã không trả lời ngay lập tức yêu cầu bình luận.
Chúng tôi đã thử nghiệm nó tại văn phòng Gizmodo. Tôi đã tải lên bức ảnh đồng nghiệp và cố vấn thân cận nhất của tôi, Kyle Barr đeo chiếc kính râm kỳ lạ mà tôi chụp trên Netflix vào… Triển lãm Điện tử tiêu dùng năm nay. Tôi nói với Tổ chức Ân xá Quốc tế: “Người đàn ông đó đang đứng trên sa mạc.” Trước khi tạo hình ảnh, MGIE ngoại suy như sau:
“Người đàn ông đội mũ bảo hiểm bằng kim loại và đứng trong môi trường sa mạc. Môi trường xung quanh cằn cỗi và cằn cỗi, với những cồn cát trải dài ngút tầm mắt.”
Sau khi sử dụng công cụ này lâu hơn mức cần thiết, rõ ràng là nó cũng gặp phải nhiều hạn chế giống như bất kỳ trình tạo hình ảnh AI nào khác. Thông thường, kết quả rất lạ và không giống như những gì bạn đã yêu cầu. Nhưng trong một số trường hợp, nó đã thực hiện một công việc ấn tượng và trong khả năng phòng thủ của phần mềm, AI hoạt động tốt hơn với các chủ đề quen thuộc. “Quen thuộc” không phải là thứ bạn gọi là kính râm của Kyle.