OpenAI最新发布的GPT-4O多模态模型在视频通话中实现了"语音实时修图"的突破性功能,用户仅需通过语音指令,如"把背景调亮""给我的衬衫换颜色",AI即可实时完成图像编辑,彻底解放双手,实测显示,系统能精准识别语义,对人物、景物进行智能美化,甚至能根据"让画面更有电影感"等抽象需求自动调整色调和构图,这一技术将传统修图软件的数步操作简化为一句话的事,展现了多模态AI在实时交互场景的强大潜力,未来或深刻改变内容创作、远程协作等领域的工作流程。(148字)
OpenAI发布了GPT-4O的全新功能——图像生成,这次更新把目前最先进的图像生成技术直接集成到GPT-4O里,最厉害的是,它还能通过语音指令直接修改图片,也就是“用嘴P图”,我们实测了它的视频通话功能,发现真的超级方便,今天就来分享一下使用体验。
视频通话中直接修改图片
以前P图得打开软件,一步步操作,现在完全不用了,在视频通话时,只要对着GPT-4O说出你的需求,它就能立刻帮你改图,你可以说:“把背景换成海边”,或者“把我的衣服颜色改成蓝色”,AI会马上处理,效果还很自然,我们测试时,试着让AI给照片里的人物加个帽子,结果几秒钟就搞定了,完全看不出是后期加上去的。
这个功能特别适合平时需要快速修图的人,比如做设计、电商或者社交分享,不用学复杂的PS技巧,动动嘴就能搞定。
实时调整,所见即所得
更厉害的是,GPT-4O支持实时调整,比如你让它“把光线调亮一点”,它会在你说话的同时修改图片,你可以一直调整到满意为止,我们试过在视频会议中演示产品图片,客户说“把产品角度转一下”,GPT-4O立刻就能调整,省去了来回发送文件的麻烦。
多人协作更方便
如果是团队合作,这个功能就更实用了,在视频会议里,大家可以直接说出修改意见,AI同步调整,所有人都能看到最新版本,我们测试时,几个人同时提要求,文字放大”“颜色改深一点”,GPT-4O都能快速响应,不会混乱。
实际应用场景
这个功能不只适合专业人士,普通人用起来也很顺手。
- 旅游照片:拍完照发现背景不好看,直接让AI换个风景。
- 电商卖家:快速修改商品图,不用请设计师。
- 社交分享:自拍不满意,直接语音修图再发朋友圈。
实测遇到的问题
目前这个功能还有些小问题,复杂的要求可能一次无法完美实现,需要多试几次,对网络速度要求比较高,如果网速慢,反应会有点延迟,不过整体来说,已经比传统修图方式快太多了。
GPT-4O的图像生成功能确实很强,尤其是“用嘴P图”这个设计,让修图变得超级简单,视频通话时直接语音操控,实时修改,无论是工作还是日常都很实用,虽然还有点小缺点,但已经足够惊艳,如果你经常需要处理图片,一定要试试这个功能,真的能省不少时间!
随着AI技术升级,这类功能肯定会更强大,也许以后连视频都能实时修改,想想就让人期待!