首页 > 资讯

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型 世界快消息

东方财富Choice数据 2023-04-08 22:45:55


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
上一篇 下一篇
热文推荐 更多

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型 世界快消息

2023-04-08

环球热讯:广东队新消息,朱芳雨获千万赞助,曾繁日霸气回归,任骏飞被弃用

2023-04-08

国家能源集团准能哈尔乌素矿:创新科技 推广开采智能化

2023-04-08

一年一度!青海湖壮美开湖!

2023-04-08

【MLP】《夏日暮影》伤感 短篇小说

2023-04-08

微动态丨网红带货翻车!直播带货鸡爪出现蟑螂,带货厂家此前因违规使用添加剂被罚

2023-04-08

焦点资讯:锐捷网络03月30日被深股通减持17.53万股

2023-04-08

世界新资讯:发现真问题后,社会组织如何介入职业教育?丨圆桌

2023-04-08

环球简讯:北京旅游住宿哪里便宜_北京住宿哪里便宜

2023-04-08

巴基斯坦小伙哈比的巴中“丝”绪相牵 世界即时

2023-04-07

世界快资讯丨2023徐州妇幼保健院hpv疫苗预约时间(附预约入口)

2023-04-07

世界快资讯:苦笋已露尖尖角 挖笋吃笋正当时

2023-04-07

AC米兰vs恩波利前瞻:红黑分心欧冠 意甲争四需拼命 主场渴望3分

2023-04-07

合肥百货:2022年归母净利润下降7.3% 环球观察

2023-04-07

荣丰控股:公司及控股子公司的担保额度总金额为约3.89亿元

2023-04-07

【当前独家】光伏周报:上机数控50亿进军组件制造 双良节能再获48亿硅片大单

2023-04-07

资讯推荐:韩议员赴日本考察排污入海计划 在东电吃“闭门羹”

2023-04-07

马克龙在北京呼吁中方调停俄乌战争莫斯科也表态:仗还要继续打

2023-04-07

天津师范大学津沽学院专业现状 当前看点

2023-04-07

浙江一政法委书记落马,钱色交易成习,最终被判处11年却引发争议-天天热闻

2023-04-07