OpenAI在GPT-4o的演示视频中,展示了其强大的实时视频通话与图像编辑功能,用户只需通过语音指令,如“让我的嘴动起来”,系统便能智能识别面部特征,无缝调整嘴唇形状和动作,实现自然的“嘴部P图”效果,该技术依托多模态交互能力,可同步处理语音、图像及文本输入,使修改过程流畅且精准,演示还呈现了动态光影适配、表情同步等细节优化,凸显了AI在实时图像处理上的突破,这一功能有望应用于视频会议、内容创作等场景,重新定义人机协作的交互体验。
OpenAI在2025年发布了GPT-4O的图像生成功能,这是目前最先进的图像生成技术,它不仅能生成图片,还能让你直接用说话的方式修改图片,就像“用嘴P图”一样简单,下面我们通过视频通话演示,来看看这个功能有多方便。
打开GPT-4O的视频通话功能,你可以直接对着屏幕说话,告诉它你想修改图片的哪些地方,你有一张照片,但背景有点乱,你可以说:“把背景换成海边。”GPT-4O会立刻处理,几秒钟后就能看到效果。
在演示中,我们测试了几种常见的修改需求,让人物的衣服换颜色,只需要说“把衣服改成红色”,系统就会自动调整,如果想给照片加上一些元素,在天空加一只飞鸟”,GPT-4O也能快速完成,甚至你可以调整照片的风格,把照片变成油画效果”,它也能做到。
这个功能特别适合不会用专业修图软件的人,以前P图需要学习复杂的操作,现在只要会说话就行,修改过程非常快,几乎实时就能看到结果。
GPT-4O还能理解更复杂的要求,比如你说“把左边的人去掉,但保留后面的风景”,它会精准地识别并处理,这在以前的修图工具里是很难做到的。
GPT-4O的图像生成功能让修图变得更简单、更智能,无论是日常拍照还是工作需求,它都能帮你快速搞定,如果你还没试过,不妨打开视频通话功能,亲身体验一下“用嘴P图”的乐趣吧!