5月22日消息,智谱今日宣布面向部分企业客户开放GLM-5.1高速版API,接口名称为"GLM-5.1-highspeed",该模型输出速度达到400 tokens/s,刷新当前全球大模型厂商API的速度上限。

GLM-5.1高速版API“GLM-5.1-highspeed”由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化:
GLM-5.1高速版目前面向智谱MaaS平台部分企业客户开放,定位为对响应延迟要求较高的场景,包括AI编程、实时交互、实时语音和商业决策等。官方暂未公布面向更广泛用户开放的时间计划。
