OpenAI发布会：全新“GPT-4o”问世，全新多模态AI时代的转折点！

GPT-4o2025-04-26 01:17:40125

北京时间2024年5月14日凌晨一点，OpenAI举办了备受瞩目的Spring发布会。

在大众心目中，OpenAI早已成为了PR高手的代名词。每一次发布会都准确无误地点燃了业界的火药桶，给竞争对手们带来了不小的压力。而这一次，发布会的时间点也是如此精准，刚好赶在了5月15日 2024 Google IO开发者大会之前，让人不禁要为Google捏一把汗。

但是，今天OpenAI新品却是如此令人震撼，直接摧毁了一切竞争对手想象空间。

OpenAI GPT-4o 发布会现场

1. 新模型：GPT-4o

OpenAI正式发布了全新的模型——GPT-4o。

这个“o”代表着“Omni”，在拉丁语中意为“全体”、“所有”或“全面的”。而“omni”作为前缀在英语中表示“所有的”或“全体的”，如“omniscient”意为“无所不知的”，“omnipotent”意为“全能的”，“omnipresent”意为“无所不在的”。

在GPT-4o之前，使用Voice Mode与ChatGPT进行对话的延迟平均为2.8秒（GPT-3.5）和5.4秒（GPT-4）。通过使用三个独立模型的管道，即一个简单模型将音频转录为文本，GPT-3.5或GPT-4接收文本并输出文本，以及第三个简单模型将文本转换为音频。但是这种处理方式导致主要智能来源的GPT-4失去了很多信息。三个过程都会产生延迟，累计起来延迟非常的大。

GPT-4o的问世标志着一种全新的多模态时代的到来，它不仅能处理文本，还能实时推理音频和视觉，让传统的GPT-4V相形见绌。

在多项基准测试中，GPT-4o几乎碾压了以往的所有模型，尤其在图表理解和视觉回答等方面表现出色。

文本推理能力（多项评测均处于第一的水平）：

语音识别能力(甚至强于专门训练的whisperv3的能力)：

多语言考试测试（包括不同语言的多选题）：

视觉理解能力（GPT-4o获得全新的SOTA视觉模型成绩）：

2. 全新ChatGPT

基于GPT-4o打造的全新ChatGPT

"GPT4-o"在语音对话中几乎没有延迟，并且能够实时响应，甚至可以理解对话中的情绪和呼吸声音。它的情感表达和真实性让人不禁为之惊叹，仿佛在面对真人一般。

更令人惊叹的是，"GPT4-o"还具备了视觉功能，可以直接打开摄像头，实时感知周围环境，并对其做出相应的回应。

测试人员利用摄像头让GPT4-o对人物和环境进行感知

另外，他们还推出了适用于macOS的ChatGPT桌面应用程序，可以方便用户快速进行提问、讨论截图以及进行语音对话等。

支持对桌面的画面进行聊天会话，如对代码的介绍、函数的实现等

支持对桌面的画面进行聊天会话，如对图表信息描述和分析

在这次发布会之后，我们不禁要思考，人类在AI时代该何去何从？

OpenAI的新产品GPT-4o无疑给我们带来了无限的想象空间，但与此同时，也让我们思考人类与技术的关系，以及如何更好地融合人类的情感与智慧。

总之，OpenAI的这次发布会可谓是AI领域的一次里程碑，让我们拭目以待，期待着更多的创新和突破。如果您对这篇文章感兴趣，别忘了点赞、转发，并关注我们的微信公众号，获取更多精彩内容！

本文链接：https://www.xiaogua.cc/gpt-4o/24.html

gpt-4o检测人的情绪 gpt-4o多模态大模型发布 GPT-4o官网 GPT4o官网

相关文章

GPT-4O图像生成功能详解，用嘴P图改图，轻松玩转AI创作
** ，GPT-4O的图像生成功能为用户提供了全新的AI创作体验，支持通过自然语言指令直接生成、编辑和优化图像，实现“用嘴P图”的便捷操作，用户只需输入文字描述，如调整色彩、添加元素或修改风格，GP...
GPT4O资讯2025-06-012GPT4O 图像生成 AI创作 gpt4o有哪些强大功能
GPT-4O网页版能用吗？手把手教你用嘴P图改图
，目前GPT-4的网页版（如ChatGPT）暂不支持直接“用嘴P图”的图片编辑功能，但通过文字指令生成或修改图片是可行的，在支持多模态的版本（如GPT-4V）中，用户可上传图片并描述修改需求（如“去掉...
GPT4O资讯2025-06-011GPT4O 网页版 P图改图 gpt4o网页版可以用吗
Cloud3与GPT-4O对比，哪个更适合你的图像生成需求？
Cloud3和GPT-4O在图像生成领域各有优势，具体选择需根据需求场景而定，Cloud3在生成高分辨率、写实风格图像时表现突出，尤其擅长细节处理和光影渲染，适合商业设计、产品可视化等专业场景，而GP...
GPT4O资讯2025-05-312Cloud3 GPT4O 图像生成 cloude3与gpt4o对比
用GPT-4O图像生成功能分析广义相对论，从理论到可视化
GPT-4O的图像生成功能为广义相对论的可视化提供了创新工具，通过将抽象理论转化为直观图像，帮助用户理解时空弯曲、引力透镜等核心概念，该功能基于理论公式（如爱因斯坦场方程）生成动态模拟，例如黑洞周围的...
GPT4O资讯2025-05-311GPT4O 广义相对论可视化分析 gpt4o分析广义相对论
GPT-4O图像生成功能上线，轻松用嘴P图改图，解除限制更自由
OpenAI正式推出GPT-4O的图像生成功能，用户可通过自然语言指令实现智能修图与创作，大幅降低专业图像处理门槛，该功能支持多轮对话修改，如"调整色调为复古风""删除背景人物"等口语化需求，AI能实...
GPT4O资讯2025-05-314GPT4O 图像生成自由编辑 gpt4o解除限制
GPT-4O升级版图像生成功能上线时间及使用教程
OpenAI近日宣布推出GPT-4O升级版图像生成功能，该功能通过优化算法显著提升了图像生成的细节表现力和响应速度，官方透露该功能将于2023年11月6日正式向所有ChatGPT Plus和企业版用户...
GPT4O资讯2025-05-305GPT4O 图像生成使用教程 gpt4o升级版什么时候上线
GPT-4O图像生成功能详解，用嘴P图改图，轻松玩转AI修图
** ，GPT-4O的图像生成功能为用户提供了全新的AI修图体验，只需通过自然语言描述即可实现“用嘴P图”，用户无需掌握专业工具，只需输入指令如“调整亮度”“去除背景”或“添加特效”，系统便能智能识...
GPT4O资讯2025-05-307GPT4O 图像生成 AI修图 GPT4o参数量
设置你的API密钥
由于您没有提供具体的内容，我无法生成摘要，请您提供需要摘要的文本内容，我可以为您生成一段100-200字的简洁摘要。，如果您需要设置API密钥（例如用于OpenAI或其他服务），通常需要在相应的平...
GPT4O资讯2025-05-306API 密钥设置 gpt4o写的代码