OpenAI ra mắt Dall-E 3, tích hợp với ChatGPT

Thứ 5, 21/09/2023 | 16:13:14 [GMT +7] A A

OpenAI vừa ra mắt phiên bản thứ ba của nền tảng AI tạo sinh Dall-E, cho phép người dùng sử dụng ChatGPT để sáng tác hình ảnh từ lời nhắc (prompt).

Dall-E là công cụ chuyển đổi prompt từ văn bản sang hình ảnh. Với phiên bản mới nhất, các nhà nghiên cứu của OpenAI cho biết công cụ hiểu bối cảnh tốt hơn, không bỏ qua những từ cụ thể như phiên bản trước.

Hình ảnh cho Dall-E 3 tạo ra. (Ảnh: OpenAI).

Một tính năng mới của Dall-E 3 là tích hợp với ChatGPT. Như vậy, khi sử dụng ChatGPT, người dùng không phải nghĩ ra lời nhắc chi tiết cho Dall-E 3 nữa mà chỉ cần yêu cầu ChatGPT đưa ra lời nhắc thay mình. Chatbot sau đó sẽ viết một đoạn văn (Dall-E làm tốt hơn với các câu dài) để Dall-E 3 làm theo. Người dùng vẫn có thể sử dụng lời nhắc riêng nếu họ có ý tưởng cụ thể cho Dall-E.

Trong phần demo với The Verge, Aditya Ramesh – nhà nghiên cứu chính và giám đốc nhóm Dall-E, nhắc ChatGPT giúp ông làm logo một nhà hàng ramen ở vùng núi. ChatGPT đã viết một lời nhắc dài và Dall-E 3 đưa ra bốn lựa chọn. Việc kết nối Dall-E với chatbot giúp nhiều người sáng tạo tác phẩm AI hơn vì họ không cần phải giỏi viết lời nhắc.

Dall-E ra mắt lần đầu vào tháng 1/2021, trước các nền tảng khác như Midjourney. Với phiên bản hai vào năm 2022, OpenAI mở danh sách chờ để kiểm soát những ai được sử dụng công cụ sau khi nhận chỉ trích Dall-E tạo ra hình ảnh có định kiến. Tháng 9 cùng năm, công ty bỏ danh sách chờ và mở Dall-E 2 cho công chúng.

Dall-E 3 sẽ phát hành cho người dùng ChatGPT Plus và ChatGPT Enterprise trước tiên vào tháng 10, sau đó là các phòng nghiên cứu và dịch vụ API. Chưa rõ khi nào phiên bản miễn phí cho mọi người được công bố.

OpenAI khẳng định đã bỏ nhiều công sức cho Dall-E 3 để tạo ra các biện pháp an toàn mạnh mẽ nhằm ngăn chặn việc tạo ra những hình ảnh thù địch. Công ty đã hợp tác với “quân đỏ” bên ngoài – những nhóm cố tình phá một hệ thống để kiểm tra tính an toàn – và dựa vào phân loại đầu vào (một cách để dạy mô hình ngôn ngữ bỏ qua những từ nhất định để tránh lời nhắc bạo lực, khiêu khích). Dall-E 3 cũng không thể tạo hình ảnh các nhân vật của công chúng nếu lời nhắc đề cập một cái tên cụ thể.

Sandhini Agarwal, nhà nghiên cứu chính sách của OpenAI, tự tin vào các biện pháp an toàn nhưng nói thêm mô hình còn tiếp tục cải thiện và không hoàn hảo.

Trong một email, đại diện OpenAI cho biết Dall-E 3 được đào tạo để không tạo hình ảnh mang phong cách của những nghệ sỹ còn sống, khác với Dall-E 2.

Ngoài ra, OpenAI cũng cho phép nghệ sỹ bảo vệ tác phẩm của mình trước các mô hình AI tạo sinh tương lai. Họ có thể nộp một hình ảnh đang nắm bản quyền và yêu cầu không được dùng để đào tạo AI. Các phiên bản Dall-E sắp tới sẽ chặn kết quả có vẻ giống hình ảnh và phong cách của nghệ sỹ đó.

Theo Vietnamnet