科技 - May 14 by Lin

OpenAI 正式发布 GPT-4o,向所有用户免费开放

打通任何文本、音频和图像的输入。

今天凌晨,OpenAI 正式发布 GPT-4o,其中「o」代表「omni」,即全面、全能的意思。这个模型同时具备文本、图片、视频和语音方面的能力,可打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换,并且语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。重要的是,GPT-4o 将向所有用户免费开放,未来几周内先向 ChatGPT Plus 推送。

来源OpenAI