数数 OpenAI 春季发布会,带走多少初创厂商了? GPT-4o 直接免费!

GPT-4o2025-04-23 03:23:42138

今天 OpenAI 4-0 发布了,今日不讲情怀....什么 AI 牛逼改变世界,我们就一起看看到底发布了个啥

发布总结(省流:

  • 干死了至少有几十个 AI 厂商吧...比如搜索新贵, 什么老牌Gemini,Claude3

  • 兄弟们给我哭,更好更快更牛逼的 GPT-4o 竟然给我免费了...我对不起我再也不敢对 Sam 大声说话了

  • OpenAI 不玩虚的,每次都有新东西。

真的好期待迫不及待的其他 AI 大厂要怎么硬对(我没打错别字...

来看看今天的 OpenAI干掉几个创业公司

1. GPT-4o 干翻 Google Gemini 1.5 Pro

Google:我不是创业公司啊喂

几个月前 Gemini 发布史上最牛逼的最长姿势对多的大模型,那时候以经验的视频剪辑技术,让我们感受一点与 AI 实时交互的牛逼的人工智能...

后面大家发现,原来牛逼的不是技术哈,牛逼的是 PS 能力。

OpenAI的 GPT-4o 发布后:

我们来看下 GPT-4o 有啥能力?

GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

在 GPT-4o 之前,为了实现实现语音模式与 ChatGPT 对话,需要用到以下的三个模型:

步骤 1:一个简单模型将音频转录为文本。

步骤 2:GPT-3.5 或 GPT-4 接收文本并输出文本。

步骤 3:第三个简单模型将该文本转换回音频。

这串行的体验,意味着:

  • 平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

  • GPT3.5 或者 GPT4 失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

融合大模型将能直接与人类产生更简单,更直接的交互。当然OpenAI自然打开是语音的输入与输出,实时检测(这个对于 Token 的消耗会更小)而真正的视频视频输入是需要额外按钮。看这个视频就知道了,会有一个掩饰的发送的动作。

都是多模态,谷歌就能把产品设计的这么烂,以至于不得不用视频 PS。

OpenAI却是围绕着 Fast is all u need,让你感觉到更快,更自然,真正把基础痛点通杀满足了。

核心要点其实是:Fast is all u need,如果做不到快,不用视频剪辑,能看吗?

看看实际演示:

好消息是,估计Gemini Pro 1.5 的收费计划要泡汤(喜滋滋。

2. Perplexity AI

PerPlexity AI,作为搜索引擎 AI 的鼻祖,在 GPT的联网搜索面前其实是不够看的,毕竟付费用户,一开始就能联网搜索的,只是说效果有点糟糕,GPT 只要做点微微的调整,都是基于搜索引擎结果的,要啥好内容没有?

PerPlexity AI能起来,归根到底是免费的ChatGPT用户的不能使用联网搜索.... 因此被撬动了一个地球。

免费就好,其他要求不高的呢亲

3. Sider等第三方客户端与插件

大概是看到第三方的生产效率异军突起,比如 Sider,monica 等收割大量用户....

OpenAI 将 Touch 用户这个入口进一步提前,算是掀起了一场入口的新战争,国内只有智谱提供桌面版 APP,就此 OpenAI拉齐了生产效率的新战争开始了。。

然后可怜的 Sider 等第三方客户端,开始要退出历史舞台了...

微软的 Copilot...估计也悬了....

当然什么读PDF等有的没的各种简单的能力都已经集成好了,看看演示,ChatGPT 如何连接你和数据

打起来,打工仔的效能终于有救了

4.一众翻译软件...

得益于新的实时模型,基本实现了,语音 -> 文本 -> 推理 -> 语音输出。

自然交互状态下,能做到近似同声传译的水平,而一干翻译软件,无论基于 AI 与否,都基本要被干趴下了,还需要翻译吗?

答案:不需要....

真正的无国界的时代来了...

5.无数的新模型厂商...

之前就有预测 GPT4 免费使用,那么这个大招来,所有的用户都可以有免费的 GPT4额度,是会员版 25%,也就是我只要有 4 个 OpenAI 账号(实际上我有好多好多个)就可以等于一个会员账号。

这使得所有的新 AI 入局者会非常难受,如何烧钱,如何烧出亮点,是横在所有新 AI 的入局者的灵魂拷问...

甚至狠狠的影响了当前的格局,要知道虽然 Gemini 多模态牛逼,但是没用起来啊,OpenAI 真的是用起来的....这一用起来之后就形成了新的标准了...新的格局。

看看支持那些功能:

我们的使命包括为尽可能多的人提供先进的人工智能工具。每周都有超过一亿人使用 ChatGPT。我们将在未来几周内开始向 ChatGPT 免费用户推出更多智能和高级工具。

使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:

  • 体验GPT-4级AI 能力

  • 从模型和搜索引擎中获取回应(能联网)

  • 分析数据并创建图表(高级数据分析)

  • 聊聊你拍摄的照片(GPT-4V 的读图能力)

  • 上传文件以帮助总结、写作或分析(文件读取能力)

  • 发现并使用 GPTs..

我宣布:全世界免费的 GPT4 来了

Sam 从过去的一段时间就疯狂在暗示,创业不要围绕着ChatGPT的缺点疯狂开展,不然这头大象从头上过去,你就知道什么叫着飞来横祸了。

其他信息与细节吧

跑分重回第一宝座,嘿嘿嘿

注意细节:GPT-4o sets a new high-score of 88.7% on 0-shot COT MMLU (general knowledge questions).

吊打你们这些 5-shots的渣渣评分,段位碾压。

更便宜了

  • GPT-4o 速度提高 2 倍,价格降低一半。

  • 速率限制提高 5 倍。

当然再便宜也是很贵,嘿嘿 XD,我相信很多人还是会选择使用 DeepSeek 了。

市场策略是不是要进入 2.0 阶段了?大大方方的承认是 GPT 的平替,也不赖呀。

本文链接:https://www.xiaogua.cc/gpt-4o/32.html

gpt-4o多模态大模型发布GPT-4o官网GPT4o官网

相关文章