AI不仅会P图了，还能让照片“动起来”

无与伦比的美丽 · 发表于 2022-8-20 06:35:37

智东西（公众号：zhidxcom）

编译 | 剑腾

编辑 | 云鹏

智东西6月2日消息，近日北卡罗来纳州立大学的研究人员开发了一种新型AI技术，这一技术可以用来创建和修改图像，同时在上面添加新的数字和文本。此外，这一技术允许AI在保持图像主要特征的情况下，移动或更改图像中的元素。这一AI技术将广泛使用于智能机器人和人工智能训练领域

本研究由北卡罗来纳州电气与计算机工程系的助理教授吴天福（Tianfu Wu）领导，他于 2016 年 8 月加入北卡罗来纳州立大学，负责视觉叙事的校长卓越计划集群招聘。目前他领导着北卡罗来纳州视觉建模、计算和学习实验室。

一、快速生成场景，“p图”从未如此简单

目前该技术可以根据用户的需求，生成特定的图像。比如，当用户需要猫和狗的图像时，AI就会生成这些图像。此外，AI允许用户把生成的图像放在他们所指定的位置。比如，用户可以指定天空生成在屏幕上方，大树生成在屏幕下方，另外再设置一条溪流从二者之间横穿过去。

该项目的研究人员，吴天福说道：“AI能根据用户需求生成一组特定的图像，然后把特定形象添加到这一场景中。”例如，用户可以让 AI 创建一副雪山景象，然后通过AI把滑雪者和谐地添加到这座雪山中。

二、操纵图像，让你的照片动起来

这一AI除了使用简便外，似乎与Photoshop没有太大的差别。事实真的是这样吗？

这项AI技术不仅能生成场景并在其中添加图像，还能让用户操纵图像。用户可以让图像在保有本身特征的同时，产生他们所需要细微改变。例如，根据一张滑雪照片，AI可以微调滑雪者的动作，生成一组图片，显示滑雪者穿越雪山时的动态场景。

这种技术有什么用呢？“将该技术应用于智能机器人上，能让机器人更好地识别和区别图像中的物体，使它更好地处理现实世界中的任务。”吴天福说。“这一技术也能帮助研究者训练其他AI，它可以生成海量训练其他AI所需的图片，这样研究者就不需要自己寻找、制作所需要的图片。”

三、走出二维，可操纵图像的AI将运用于3D图像和视频

目前，研究人员正使用COCO-Stuff数据集和Visual Genome数据集对这一AI技术进行进一步的探索。这一探索过程需要耗费大量算力，研究人员专门为此建立了一个工作站。

“我们目前的计划是看看这一技术是否有望扩展到视频和3D图像上。”吴天福说。

结语：可操纵图像的AI是否会进入人类生活？

北卡罗来纳州立大学研发的AI技术目前已经能实现生成场景、添加图像、对图像进行微调等功能，未来它还可能被运用于3D图像和视频中。

自阿尔法狗打败李世石后，AI逐渐进入人类生活。目前北卡罗来纳州立大学正在研究的AI技术未来会有怎样的发展，会如何影响人们的生活？值得期待。

来源：Tech Xplore

声明：以上内容来源于网络，如有侵权请联系我们(123@shiyan.com)删除！

城市大秀场

[杂谈] AI不仅会P图了，还能让照片“动起来”

相关帖子

发表回复