GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
程序员客栈 2023-05-27 10:40:09


(资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

2023-05-27

风范股份:5月26日融资买入145.87万元,融资融券余额1.85亿元

2023-05-27

DIY 可重复使用的织物 Swiffer 垫_姐送弟什么生日礼物最好

2023-05-27

指定交易指的是什么? 指定交易可以在周末下单吗?

2023-05-27

股票行情快报:晨鸣B(200488)5月26日游资资金净买入7.13万元

2023-05-27

世界观天下!看了郭麒麟的母亲,我才知道谁是世上最好的妈妈

2023-05-27

中国建筑:近期合计中标161.5亿元重大项目

2023-05-27

资讯推荐:美敦力再添新成员EOFlow,糖尿病管理更高效

2023-05-27

焦点短讯!60秒看“海上巨无霸”渤海首个千亿方大气田建造过程

2023-05-27

全球今热点:如何用qq发邮件_详细步骤介绍

2023-05-27

他为何要对着列车敬礼?

2023-05-27

脆柿子怎么吃好吃_脆柿子怎么吃-天天新要闻

2023-05-26

每日观点:深房中协:“买房负首付”违反国家相关金融信贷政策

2023-05-26

本赛季季后赛至今3次同队同场4人20+ 绿军&湖人&勇士各一次 天天快讯

2023-05-26

富信科技:收到客户已启动ABCs(为债权人利益之转让)程序通知|精选

2023-05-26

荣耀618超值福利来袭,多款爆款单品限时最高优惠500元

2023-05-26

广州到梵净山最佳线路(广州到梵净山旅游攻略)

2023-05-26

前沿热点:京东:3C数码消费首选

2023-05-26

天天实时:热评|严惩不贷 对性侵未成年人案件“零容忍”

2023-05-26

一汽丰田2023款亚洲龙 智极新境 旗舰“加新”

2023-05-26