今天 OpenAI 4-0 发布了,今日不讲情怀....什么 AI 牛逼改变世界,我们就一起看看到底发布了个啥
发布总结(省流:
干死了至少有几十个 AI 厂商吧...比如搜索新贵, 什么老牌Gemini,Claude3
兄弟们给我哭,更好更快更牛逼的 GPT-4o 竟然给我免费了...我对不起我再也不敢对 Sam 大声说话了
OpenAI 不玩虚的,每次都有新东西。
真的好期待迫不及待的其他 AI 大厂要怎么硬对(我没打错别字...
来看看今天的 OpenAI干掉几个创业公司
1. GPT-4o 干翻 Google Gemini 1.5 Pro
Google:我不是创业公司啊喂
几个月前 Gemini 发布史上最牛逼的最长姿势对多的大模型,那时候以经验的视频剪辑技术,让我们感受一点与 AI 实时交互的牛逼的人工智能...
后面大家发现,原来牛逼的不是技术哈,牛逼的是 PS 能力。
OpenAI的 GPT-4o 发布后:
我们来看下 GPT-4o 有啥能力?
GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
在 GPT-4o 之前,为了实现实现语音模式与 ChatGPT 对话,需要用到以下的三个模型:
步骤 1:一个简单模型将音频转录为文本。
步骤 2:GPT-3.5 或 GPT-4 接收文本并输出文本。
步骤 3:第三个简单模型将该文本转换回音频。
这串行的体验,意味着:
平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。
GPT3.5 或者 GPT4 失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。
融合大模型将能直接与人类产生更简单,更直接的交互。当然OpenAI自然打开是语音的输入与输出,实时检测(这个对于 Token 的消耗会更小)而真正的视频视频输入是需要额外按钮。看这个视频就知道了,会有一个掩饰的发送的动作。
都是多模态,谷歌就能把产品设计的这么烂,以至于不得不用视频 PS。
OpenAI却是围绕着 Fast is all u need,让你感觉到更快,更自然,真正把基础痛点通杀满足了。
核心要点其实是:Fast is all u need,如果做不到快,不用视频剪辑,能看吗?
看看实际演示:
好消息是,估计Gemini Pro 1.5 的收费计划要泡汤(喜滋滋。
2. Perplexity AI
PerPlexity AI,作为搜索引擎 AI 的鼻祖,在 GPT的联网搜索面前其实是不够看的,毕竟付费用户,一开始就能联网搜索的,只是说效果有点糟糕,GPT 只要做点微微的调整,都是基于搜索引擎结果的,要啥好内容没有?
PerPlexity AI能起来,归根到底是免费的ChatGPT用户的不能使用联网搜索.... 因此被撬动了一个地球。
免费就好,其他要求不高的呢亲
3. Sider等第三方客户端与插件
大概是看到第三方的生产效率异军突起,比如 Sider,monica 等收割大量用户....
OpenAI 将 Touch 用户这个入口进一步提前,算是掀起了一场入口的新战争,国内只有智谱提供桌面版 APP,就此 OpenAI拉齐了生产效率的新战争开始了。。
然后可怜的 Sider 等第三方客户端,开始要退出历史舞台了...
微软的 Copilot...估计也悬了....
当然什么读PDF等有的没的各种简单的能力都已经集成好了,看看演示,ChatGPT 如何连接你和数据
打起来,打工仔的效能终于有救了
4.一众翻译软件...
得益于新的实时模型,基本实现了,语音 -> 文本 -> 推理 -> 语音输出。
自然交互状态下,能做到近似同声传译的水平,而一干翻译软件,无论基于 AI 与否,都基本要被干趴下了,还需要翻译吗?
答案:不需要....
真正的无国界的时代来了...
5.无数的新模型厂商...
之前就有预测 GPT4 免费使用,那么这个大招来,所有的用户都可以有免费的 GPT4额度,是会员版 25%,也就是我只要有 4 个 OpenAI 账号(实际上我有好多好多个)就可以等于一个会员账号。
这使得所有的新 AI 入局者会非常难受,如何烧钱,如何烧出亮点,是横在所有新 AI 的入局者的灵魂拷问...
甚至狠狠的影响了当前的格局,要知道虽然 Gemini 多模态牛逼,但是没用起来啊,OpenAI 真的是用起来的....这一用起来之后就形成了新的标准了...新的格局。
看看支持那些功能:
我们的使命包括为尽可能多的人提供先进的人工智能工具。每周都有超过一亿人使用 ChatGPT。我们将在未来几周内开始向 ChatGPT 免费用户推出更多智能和高级工具。
使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:
体验GPT-4级AI 能力
从模型和搜索引擎中获取回应(能联网)
分析数据并创建图表(高级数据分析)
聊聊你拍摄的照片(GPT-4V 的读图能力)
上传文件以帮助总结、写作或分析(文件读取能力)
发现并使用 GPTs..
我宣布:全世界免费的 GPT4 来了
Sam 从过去的一段时间就疯狂在暗示,创业不要围绕着ChatGPT的缺点疯狂开展,不然这头大象从头上过去,你就知道什么叫着飞来横祸了。
其他信息与细节吧
跑分重回第一宝座,嘿嘿嘿
注意细节:GPT-4o sets a new high-score of 88.7% on 0-shot COT MMLU (general knowledge questions).
吊打你们这些 5-shots的渣渣评分,段位碾压。
更便宜了
GPT-4o 速度提高 2 倍,价格降低一半。
速率限制提高 5 倍。
当然再便宜也是很贵,嘿嘿 XD,我相信很多人还是会选择使用 DeepSeek 了。
市场策略是不是要进入 2.0 阶段了?大大方方的承认是 GPT 的平替,也不赖呀。