MobileDiffusion是什么?
MobileDiffusion是由谷歌开发的一种专为移动设备设计的轻量级潜在扩散模型。它能够在仅0.5秒的时间内,根据文本提示生成出分辨率为512x512的高质量图像。相较于其他文本到图像生成模型,MobileDiffusion的体型更加小巧,仅包含520M参数,因此非常适用于在手机等移动设备上进行部署和使用。
MobileDiffusion采用 DiffusionGAN 在推理过程中实现一步采样,它微调了预训练的扩散模型,同时利用 GAN 对去噪步骤进行建模,可以为各种领域生成高质量的多样化图像。
论文地址:https://arxiv.org/abs/2311.16567
官方博客:https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html