智谱Realtime、4V、Air新模型发布,上线bigmodel.cn

发布时间:2025-01-20

1月16日,智谱发布全新端到端模型GLM-Realtime,并同步升级已有模型GLM-4-Air和GLM-4V-Plus,所有模型 API 已上线 bigmodel.cn,具体内容如下:

一、新模型GLM-Realtime,限时免费

GLM-Realtime在视频通话上具备2分钟的内容记忆能力。在语音交互方面,尤其创新性地实现了清唱功能,首次让大模型具备在对话中的歌唱能力。 

Realtime API已集成到智能眼镜和陪伴娃娃中,使用户体验到近乎实时的智能助手交互,为AI硬件发展奠定智能基础。Realtime进一步支持Function Call功能,不仅能够依靠自身的知识和能力,还能灵活调用外部知识和工具,从而能够拓展到更广泛的商业场景。

API已经上线智谱开放平台bigmodel.cn,现阶段可以免费调用。

二、极致性能:GLM-4-Air /GLM-4V-Plus

通过优化训练数据和流程,GLM-4-Air 升级为 GLM-4-Air-0111,在部分维度性能接近 GLM-4-Plus,价格降为原来的 50%,再次降低大模型应用门槛。

GLM-4V-Plus全面升级后,在多个公开榜单效果提升显著,支持变分辨率功能,能适应不同尺寸的图像输入,小图场景下可降低token消耗,能无损识别4K超清及极致长宽比图像,具备2小时视频理解能力,为长视频理解和分析提供更加高效精准的解决方案。

三、全免费:Flash 系列普惠模型

为推动大模型普惠,智谱设置了针对全社会免费开放 Flash 系列普惠模型 API,是行业首个全模态免费系列模型,开发者可免费调用语言、多模态理解、多模态生成功能。

近期将全面升级Flash系列,包括语言模型 GLM-4-Flash、图像理解模型 GLM-4V-Flash、图像生成模型 CogView-3-Flash、视频生成模型 CogVideoX-Flash 等。

https://mp.weixin.qq.com/s/jpwClxbl2514AzSfgYVEeA

来源:智谱