麻省理工学院研究人员开发出对图像质量影响最小的超快速图像生成方法

生成式人工智能服务可以生成高质量的视觉拼凑，但通常相当缓慢。麻省理工学院和 Adobe 公司的研究人员针对这一耗时问题开发出了一种潜在的解决方案，即一种对图像质量影响最小的全新超快速图像生成方法。该技术每秒可生成约 20 幅图像。

图像生成人工智能通常采用一种称为扩散的过程，通过几个采样步骤来完善视觉输出，以达到最终希望"逼真"的结果。研究人员表示，扩散模型可以生成高质量的图像，但需要数十次前向传递。

Adobe 研究中心和麻省理工学院的专家们正在引入一种名为"分布匹配蒸馏"（DMD）的技术。这一程序将多步扩散模型简化为一步图像生成解决方案。由此产生的模型可以生成与Stable Diffusion 1.5 等"传统"扩散模型相当的图像，但速度要快上几个数量级。

"我们的核心理念是训练两个扩散模型，不仅能估计目标真实分布的得分函数，还能估计假分布的得分函数。"研究人员称，他们的模型可以在现代 GPU 硬件上每秒生成 20 幅图像。

上面的视频短片重点介绍了 DMD 与 Stable Diffusion 1.5 相比的图像生成能力。标清每幅图像需要 1.4 秒，而 DMD 只需几分之一秒就能生成类似的图像。虽然在质量和性能之间有所权衡，但最终结果仍在普通用户可接受的范围之内。

该团队发表的关于新渲染方法的文章展示了使用 DMD 生成图像结果的更多示例。它比较了稳定扩散和 DMD，同时提供了生成图像的重要文字提示。主题包括通过虚拟数码单反相机镜头取景的一只狗、多洛米蒂山脉、森林中一只神奇的鹿、一只鹦鹉宝宝的 3D 渲染、独角兽、胡须、汽车、猫，甚至更多的狗。

分布匹配蒸馏法并不是第一种用于生成人工智能图像的单步方法。Stability AI 公司开发了一种被称为逆向扩散蒸馏（ADD）的技术，用于实时生成 100 万像素的图像。该公司通过 ADD 训练其 SDXL Turbo 模型，在单个 NVIDIA A100 AI GPU 加速器上实现了仅 207 毫秒的图像生成速度。Stability 的 ADD 采用了与麻省理工学院的 DMD 类似的方法。

对文章打分

麻省理工学院研究人员开发出对图像质量影响最小的超快速图像生成方法

最新资讯

编辑精选

热门评论

相关文章

Claude Opus 4 AI模型在实验中被发现会威胁揭露婚外情以避免被关闭

受地缘政治紧张和关税不确定性影响全球AI服务器出货量预测将显著下降

ChatGPT 正在测试一项名为“一起学习”的神秘新功能

苹果也被挖角 AI模型负责人数千万美元年薪跳槽Meta

估值3000亿美元的OpenAI 反而是“价值洼地”？

“改进”的Grok AI会批评民主党和好莱坞的“犹太高管”

Top 10

中国工程师和技术人员被召回令苹果印度制造梦岌岌可危

马云现身法国乘坐豪华游艇出海游玩戴白色草帽拍照超有范

南航机长伤4人后跳楼自杀警方最新回应

这种虫子，看到一只，你家里很可能有一万只

马斯克："无论发生什么，我们有飞船，他们没有"

这可能是世界上最孤独的动物全世界已知的只有两只而且全部是雄性