OpenAI 的 DALL・E 是一款强大的图像生成系统。它于 2021 年 1 月由美国人工智能非营利组织 OpenAI 推出。DALL・E 的名字来源于著名画家达利(Dalí)和机器人总动员(Wall-E),体现了将创造力与人工智能结合的理念。
DALL・E 可以根据用户提供的简单描述创建较为逼真和清晰的图像。它能够理解复杂的文本并生成对应的图像,通过接收文本和图像作为包含最多 1280 个标记的单个数据流,并使用最大似然进行训练,以逐个生成所有标记。该系统熟悉各种艺术风格,包括插画和风景等,还可以根据文字来制作建筑物上的标志,并分别制作同一场景的草图和全彩图像。
2022 年 4 月,OpenAI 推出了 DALL・E 的新版本 DALL・E 2。DALL・E 2 的精确度、写实度、画质都得到了大幅度升级,分辨率从 256×256 升至 1024×1024,且延迟变得更低。DALL・E 2 新增了两个二次创作功能,分别是以文本局部修改图片的 “图像修描”(inpainting)和生成不同风格图片的 “变体”(variations)。
2022 年 9 月 29 日,OpenAI 取消了访问其文本生成图像系统 DALL・E 2 的等待名单。2024 年 2 月 7 日,OpenAI 宣布其图像生成器 DALL・E 3 开始为所生成的图像添加来自内容来源和真实性联盟 (C2PA) 的水印。
DALL・E 3 在图像生成方面有了进一步的增强,如提示优化,详细的提示会带来更为准确的图片结果;清晰度可选择 standard 标准与 HD 高清两种;多尺寸,接受三种尺寸(1024px x 1024px、1792px x 1024px 和 1024px x 1792px);多风格,有 natural 自然和 vivid 生动两种。
DALL・E 支持多种语言的文本描述,但在某些情况下,可能需要用户提供准确的翻译或额外的上下文信息。同时,DALL・E 也有一些限制,不允许生成或促进生成色情或露骨的性内容、暴力或虐待内容、恶意内容、任何非法活动的内容、侵犯他人隐私的内容、未成年人形象以及侵犯版权或商标的图像等。
微软必应新上线了基于 DALL・E 的 AI 绘图功能,集成了 OpenAI 的 DALL・E,有必应账号就能使用。OpenAI 发布的 Point-E 被称为 “3D 建模版” DALL・E,可用于 3D 建模,是一种从复杂的文本提示生成 3D 点云的方法。
总的来说,OpenAI 的 DALL・E 系列在图像生成领域不断创新和发展,为用户提供了强大的图像创作工具。