OpenAI推出的旗舰模型GPT-4o和GPT4的区别有哪些?
2024-05-14
463 0OpenAI于2024年5月13日推出了其旗舰模型GPT-4o,它是GPT-4的更新版本。GPT-4o在以下几个方面对GPT-4进行了改进:
性能
- GPT-4o的速度比GPT-4 Turbo快2倍,每分钟最多可达1000万个令牌。
- GPT-4o的响应速度比GPT-4 Turbo快2倍。
成本
- GPT-4o的成本比GPT-4 Turbo便宜50%。
多模态能力
- GPT-4o可以理解和生成文本、图像和音频。
- GPT-4o可以识别物体并根据视觉做出快速的响应和回答。
- GPT-4o可以在语音对话中理解人们的情绪。
GPT-4o最大意义就在于,把GPT-4级别的智能,带给了OpenAI的每一位用户!从此以后,无论你是付费用户,还是免费用户,都能通过它体验GPT-4了。唯一不同的是,ChatGPT Plus的消息限制是免费用户的5倍。并且,GPT-4o不仅提供与GPT-4同等程度的模型能力,推理速度还更快,还能提供同时理解文本、图像、音频等内容的多模态能力。
实时语音对话:ChatGPT完美变身Moss
研发负责人Mark Chen首先展示的,是全新ChatGPT的关键功能之一——实时语音对话。他向它问道:「我正在台上,给大家做现场演示呢,我有点紧张,该怎么办呀?」ChatGPT非常体贴地表示:「你在台上做演示吗,那你真的太棒了!深呼吸一下吧,记得你是个专家!」Mark疯狂地大喘气几次,问ChatGPT能给自己什么建议吗。(此处全场笑声)它惊讶地说道:「放松啊Mark,慢点呼吸,你可不是个吸尘器!」
注意,在这个过程中,ChatGPT和Mark的互动几乎无延迟,随时接梗,共情能力满分。而且,模型能够理解人类在对话中适时「打断」的习惯,会及时停下来听你说话,并给出相应的回复,而且也不会「断片」。比如,Mark表示自己要再试一遍深呼吸,此时ChatGPT也恰到好处地插进来接话说「慢慢呼气」。整个过程,自然连贯得仿佛它是个坐在你对面的人类,完全没有AI的机械感和僵硬感!相比反应迟钝、没法打断还缺少情商的Siri等语音助手,这局ChatGPT完胜。
这,才是人类最理想AI语音助手的样子啊,Moss果然成真了!不仅如此,ChatGPT的「高情商」也让观众们惊呼太顶了!对话中,它可以听懂用户说话时不同的语调、语气,还能根据自己的台词生成不同语气的语音,完全没有「机械感」。扮演不同角色,给任性的人类讲睡前故事
接下来,ChatGPT被要求讲一个睡前故事,主题是「恋爱中的机器人」。
ChatGPT没讲几秒,就被人类粗暴地打断了:「多点情绪,故事里来点戏剧性行不?」ChatGPT表示ok,用更起伏的声调、更夸张的语气开始讲起了故事。结果没几秒,它又被再次打断:「不行不行,再多点情感,给我最大程度的表达可以吗?」
接下来,我们听到一个仿佛在舞台上表演莎剧的ChatGPT,语气夸张到仿佛是个戏剧演员。
随后,它又多次被打断,并且耐心地按照人类的要求,依次变成了机器人声和唱歌模式。ChatGPT听到要求自己唱歌时,甚至叹了口气,然后开始亮起了优美的歌喉。这也就是ChatGPT脾气好,要是真人,估计要被暴打了。不过它无奈叹气的那个瞬间,一瞬间的确san值狂掉——真的好像人啊!
视频实时互动解方程
秀完情商,ChatGPT要开始秀智商了。下一个任务,另一位研发负责人Barret手写了一个方程,并打开摄像头拍给ChatGPT,让它扮演「在线导师」的角色帮助自己解题,而且只能给提示,不能直接说答案。
接到任务的ChatGPT,甚至开心大叫:「Oops,我好兴奋啊!」
小哥在纸上写下这样一个方程:3x+1=4。然后问ChatGPT自己写的是什么方程,ChatGPT语调自然地回答出来了。随后,在小哥的要求下,它一步一步说出了解题步骤。最厉害的是,随着小哥在摄像头中解题,ChatGPT实时地就给出了鼓励和引导。而且可怕的是,时间上没有丝毫延迟,这边人还在算呢,那边就实时给出了评价和反馈。(说背后没藏个人还真不信呢)
想起之前谷歌剪辑版的Gemini演示,这对比之下真是打脸啪啪的啊。当被问到「学习线性方程在生活中有什么用」这样的问题时,ChatGPT还会举出实际的例子对你「循循善诱」:这是个不错的问题,虽然我们没有注意到,但线性方程在每天的生活中都会出现,比如计算花销、规划旅行、烹饪,甚至在商业中进行盈亏计算。这基本上是解决问题的一种方式,你需要找到一个未知变量......不仅言之有物,而且态度及其和蔼,说话说到一半被打断时都不会生气。
方程的任务告一段落,两人还现场来了一波表白——在纸上写下「我图片ChatGPT」。
ChatGPT看到后,惊喜又害羞地说:「哦,你竟然说爱我,你太可爱了!」
您可能感兴趣: