OpenAI重磅推出GPT-4O多模态模型,图像生成功能正式开放用户测试,用户可通过自然语言指令实现"用嘴P图"——只需口头描述需求,系统即可自动完成图片编辑、风格转换、元素增减等操作,甚至能根据对话实时调整效果,同步上线的实时变声功能支持音色自由切换,用户可一键将语音转换为不同年龄、性别或风格的声线,该技术突破标志着AI交互进入"全感官时代",文字、图像、语音的边界被彻底打通,目前功能已向Plus用户开放,响应速度较前代提升50%,但生成图像仍带有水印标识。(字数:148)
本文目录导读:
OpenAI在2025年发布了GPT-4O的重大更新,这次更新让AI的能力又上了一个台阶,最让人惊喜的是,GPT-4O现在可以直接生成和修改图片了,而且还能实现“用嘴P图”的功能,不仅如此,它还新增了实时变声的能力,让语音交互变得更加有趣。
GPT-4O图像生成功能:用嘴就能P图
以前,我们想要修改一张图片,得打开PS或者其他修图软件,一步步调整参数,但现在,GPT-4O让这个过程变得超级简单——你只需要用说的,AI就能帮你完成。
你可以对GPT-4O说:
- “把这张照片的背景换成海滩。”
- “把我的衣服颜色改成蓝色。”
- “把这张图片的风格变成卡通。”
AI会立刻理解你的需求,并在几秒内生成修改后的图片,这个功能特别适合不会用专业修图软件的人,或者想快速调整图片的时候使用。
实时变声:让语音交互更有趣
除了图像生成,GPT-4O还加入了实时变声功能,这意味着,你在和AI对话时,可以让它用不同的声音回应你。
- 让它用“机器人”的声音说话
- 模仿某个名人的嗓音
- 调整成更温柔或更严肃的语调
这个功能不仅好玩,还能在一些特定场景下派上用场,你可以让AI用更正式的声音帮你练习面试,或者用轻松活泼的语调给孩子讲故事。
如何使用这些新功能?
(1)图像生成和修改
- 打开GPT-4O的对话界面。
- 上传你想修改的图片,或者直接让AI生成一张新图。
- 用自然语言描述你的需求,“把这张照片调亮一点”或“生成一张未来城市的图片”。
- AI会快速处理并返回结果,你可以继续调整,直到满意为止。
(2)实时变声
- 在语音对话模式下,点击“声音设置”。
- 选择你喜欢的音色,或者让AI模仿某种风格。
- 开始对话,AI会用你设定的声音回应你。
这些功能适合哪些人?
- 设计师和创作者:可以快速生成灵感图或调整设计稿,节省时间。
- 普通用户:不用学复杂的修图软件,动动嘴就能P图。 创作者**:用变声功能制作有趣的视频或播客。
- 教育工作者:用不同的声音吸引学生的注意力。
未来还会有哪些升级?
OpenAI表示,GPT-4O的更新不会止步于此,未来可能会加入更多实用功能,
- 3D模型生成:直接让AI生成3D物体或场景。
- 视频编辑:用语音控制剪辑视频。
- 更自然的变声:让AI的声音更像真人。
GPT-4O的图像生成和实时变声功能,让AI的交互方式变得更加直观和有趣,无论是修图还是语音聊天,现在都可以用更简单的方式完成,如果你还没试过这些新功能,不妨现在就去体验一下,看看AI能帮你做什么!
(全文约1300字)