OpenAI最新发布的GPT-4O模型带来突破性多模态交互体验,用户可通过语音指令直接编辑图片,实现"用嘴P图"的炫酷操作,该模型支持实时语音对话、跨语言即时翻译,甚至能根据文本生成富有情感的歌声,其图像理解能力显著提升,可分析截图、手写笔记等内容,并支持文件上传交互,响应速度较GPT-4 Turbo提升2倍,免费用户也可体验基础功能,但高阶使用仍需要订阅,这一更新标志着AI从文本交互向自然多模态交互的重要演进,有望重塑人机互动方式。(字数:148)
OpenAI在2025年发布了GPT-4O的重大更新,这次最让人惊喜的功能是图像生成,官方说,这是“将迄今最先进的图像生成器集成至GPT-4O”,就是你现在可以用嘴“P图”了!
以前修图得打开软件,一点点调整,但现在你只需要对GPT-4O说出你的要求,它就能立刻帮你改好,比如你说“把这张照片的背景换成海边”,或者“把我的衣服颜色改成红色”,它都能马上做到,这个功能特别适合不会用修图软件的人,也让P图变得更方便。
更厉害的是,GPT-4O这次还能“唱歌”,在发布会上,OpenAI演示了让GPT-4O根据文字描述生成一段旋律,甚至能模仿不同歌手的风格,比如你说“写一首快乐的流行歌”,它就能生成一段轻快的音乐,虽然现在还不能完全替代专业音乐人,但对普通人来说,这个功能已经足够有趣。
为什么GPT-4O能做到这些?因为它结合了最新的图像和语音技术,图像生成部分用了最先进的算法,能准确理解你的描述;而唱歌功能则是通过分析大量音乐数据,学会模仿不同的风格。
这些新功能也有一些限制,比如图像生成可能偶尔会出错,唱歌的音色还不够自然,但OpenAI表示会继续优化,未来可能会更强大。
GPT-4O这次的更新让AI变得更实用、更好玩,无论是P图还是唱歌,都能让普通人轻松体验到AI的便利,如果你还没试过,不妨去体验一下,说不定会有惊喜!