牛了,GPT4o官宣后的第二次官方演示

GPT-4o2025-05-01 12:58:21123

@aiDotEngineer 闭幕主题演讲,由@Romain Huet(title为Head of Developer Experience @OpenAI.) 使用未发布版本的 ChatGPT Desktop 进行了 GPT-4o 的现场演示,热度很高,算是上是 GPT-4o 发布后第二次备受瞩目的公开演示。

演示从 7:15:50 开始,地址如下

https://www.youtube.com/live/vaIiNZoXymg?t=26153s

展示的能力包括

  • 低延迟语音生成
  • 将音调调节为耳语(甚至更安静的耳语)的介绍
  • 打断
  • ChatGPT Desktop 的摄像头模式 - 不断将视频传输到 GPT4o
  • 与语音理解配合使用时,无需使用“发送”或“上传”按钮
  • 快速 OCR:随机挑选一个页码,然后展示该页面 - 它基本上立即读取该页面!不幸的是,OCR 有点失败 - 它误读了“Coca Cola”,但现场演示的条件并不好。
  • 与 ChatGPT 进行屏幕共享:与 ChatGPT 交谈以描述他的编程问题并从视觉上下文中理解它
  • 读取剪贴板:复制代码,要求代码的“一行概述”(此功能目前存在于 ChatGPT Desktop)

  • 与 ChatGPT 讨论代码:来回讨论代码中的 Tailwind 类,依靠视觉(不是剪贴板)

演讲的其余部分讨论了 OpenAI 的 4 个“投资领域”:

  • 文本智能(ppt使用的依然是“GPT Next”而不是“GPT5”...)
  • 效率/成本
  • 型号定制

  • Multimodal Agents: 包括 Sora 和语音引擎演示

本文链接:https://www.xiaogua.cc/gpt-4o/61.html

GPT-40gpt4o的buggpt4o api 图片GPT-4o上手体验GPT-40评测gpt4oopenai推出gpt4oOpenAI发布GPT40gpt4o免费次数gpt4o实测

相关文章