Stability AI 推出SD3 Medium 提升文本转图像功能

作者： CBISMB

责任编辑：张金祥

来源： ISMB

时间： 2024-06-13 13:42

点赞： 51

收藏： 10

人工智能初创公司Stability AI Ltd.宣布了Stable Diffusion 3系列中的最新模型——Stable Diffusion 3 Medium，这款被称为“最先进”的文本转图像开源AI模型，将为用户带来前所未有的图像生成体验。

Stable Diffusion 3 Medium基于20亿个参数构建，不仅支持照片级逼真的图像制作，还能有效克服手部和面部的常见伪影。更重要的是，它能够精准地遵循复杂的用户文本提示和样式，确保生成的图像不仅符合用户要求，还能保持高度的文本理解准确性，不会出现拼写错误或语义混淆。

Stability AI特别强调了SD3 Medium在生成单词和正确拼写文本方面的能力。相较于之前的文本到图像生成器，SD3 Medium在创建清晰单词和句子方面取得了显著进步，这要归功于其先进的Diffusion Transformer Architecture。

SD3 Medium的微调功能也是一大亮点。用户可以通过小型数据集快速调整模型以定制输出，这使得它成为快速周转项目的理想选择。即使在没有大量特定图像示例的情况下，用户也能让模型针对特定主题或图片进行训练。

由于SD3 Medium的参数规模相对较小，它在资源利用率方面表现出色。与那些参数规模在8亿到80亿之间的重量级模型相比，SD3 Medium更为精简，可以优化以在配备消费级或游戏级图形处理单元的个人电脑上运行，而不会因VRAM占用空间较小而导致性能下降。

Stability AI与Nvidia Corp.和Advanced Micro Devices Inc.展开合作。通过利用Nvidia RTX GPU和TensorRT，配备TensorRT核心的Nvidia卡可将SD3 Medium的性能提高50%。同时，该模型也在AMD的设备上进行了优化，包括加速处理单元和消费者GPU。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

Stability AI 推出SD3 Medium 提升文本转图像功能

相关推荐

智库专家

解决方案