@aiDotEngineer 闭幕主题演讲,由@Romain Huet(title为Head of Developer Experience @OpenAI.) 使用未发布版本的 ChatGPT Desktop 进行了 GPT-4o 的现场演示,热度很高,算是上是 GPT-4o 发布后第二次备受瞩目的公开演示。
演示从 7:15:50 开始,地址如下
https://www.youtube.com/live/vaIiNZoXymg?t=26153s
展示的能力包括
低延迟语音生成 将音调调节为耳语(甚至更安静的耳语)的介绍 打断 ChatGPT Desktop 的摄像头模式 - 不断将视频传输到 GPT4o 与语音理解配合使用时,无需使用“发送”或“上传”按钮 快速 OCR:随机挑选一个页码,然后展示该页面 - 它基本上立即读取该页面!不幸的是,OCR 有点失败 - 它误读了“Coca Cola”,但现场演示的条件并不好。
与 ChatGPT 进行屏幕共享:与 ChatGPT 交谈以描述他的编程问题并从视觉上下文中理解它
读取剪贴板:复制代码,要求代码的“一行概述”(此功能目前存在于 ChatGPT Desktop)
与 ChatGPT 讨论代码:来回讨论代码中的 Tailwind 类,依靠视觉(不是剪贴板)
演讲的其余部分讨论了 OpenAI 的 4 个“投资领域”:
文本智能(ppt使用的依然是“GPT Next”而不是“GPT5”...)
效率/成本
型号定制
Multimodal Agents: 包括 Sora 和语音引擎演示
本文链接:https://www.xiaogua.cc/gpt-4o/61.html
GPT-40gpt4o的buggpt4o api 图片GPT-4o上手体验GPT-40评测gpt4oopenai推出gpt4oOpenAI发布GPT40gpt4o免费次数gpt4o实测