附录:
NüWA 在八大任务中的效果
图3:文本到图像任务 。 例如 , 给定文本“A wooden house sitting in a field”(一个小木屋坐落在田野间) 。 NüWA 创作了4种不同拍摄角度的小木屋 , 这些小木屋不仅朝向风格多样、而且真实性很好 。
图4:草图到图像任务 。 例如 , 给定一张公共汽车的草图(第一行第一列) , NüWA 创作了3种满足草图形状和位置的图像 , 包括窗户的反光也清晰可见 。
图5:图像补全任务 。 例如第1行 , 输入上方的塔尖(50%的原图) , NüWA 可以补全出塔下方的样子 , 圆柱甚至屋顶 。 对于第2行 , 当仅仅给5%的图像区域时 , NüWA 依然可以做到图像补全 。
图6:图像编辑 。 例如第1幅图 , 给定待编辑的图像、需要编辑的图像区域(红框)以及图像上方的文本“Beach and sky”(海滩和天空) , 第2幅图则给出了编辑后的结果 。
图7:图像到视频任务 。 NüWA 不仅可以依据常见的文本 “Play golf on grass”(在草地上玩高尔夫球)来生成视频 , 而且可以生成现实中不可能的视频 , 例如“Play golf on the swimming pool”(在泳池玩高尔夫球) 。
文章图片
文章图片
图8:视频草图到视频 。 输入视频草图 , NüWA 可以生成帧和帧连续的视频 。
文章图片
图9:视频预测 。 输入静止图像 , NüWA 可以输出将其“动”起来的视频 。
图10:视频编辑 。 输入编辑文本、视频 , NüWA 可以输出编辑之后的视频 。 例如 , 原视频潜水员在水平游动 , 经过第二幅图“The diver is swimming to the surface”(潜水员在向水面游去)的控制 , 生成的视频潜水员在向上游 。
关注微软中国MSDN
敲黑板啦——你为“微软中国 MSDN ”点亮小星星了吗?进入订阅号主页 , 点击“三个点” , 再选择“设为星标” , 每天第一时间获取微软最新技术资讯!如果你是我们的真爱粉儿 , 也请帮忙多多点击【分享、点赞、在看】一键三连
查看 NüWA 论文原文
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
