就在刚刚艳照,智谱衔接上线并开源了三大类最新的 GLM 模子:
千里想模子 GLM-Z1-Rumination
推理模子 GLM-Z1-Air
基座模子 GLM-4-Air-0414
若所以模子大小(9B 和 32B)来隔离,更是不错细分为六款。
最初是两个 9B 大小的模子:
GLM-4-9B-0414:主攻对话,序列长度介于 32K 到 128K 之间
GLM-Z1-9B-0414:主攻推理,序列长度介于 32K 到 128K 之间
还有四个 32B 大小的模子,它们分别是:
GLM-4-32B-Base-0414:基座模子,序列长度介于 32K 到 128K 之间
GLM-4-32B-0414:主攻对话,序列长度介于 32K 到 128K 之间
GLM-Z1-32B-0414:主攻推理,序列长度介于 32K 到 128K 之间
GLM-Z1-32B-Rumination-0414:主攻推理,序列长度为 128K
而跟着一系列模子的开源,智谱也解锁了一项行业之最——
推理模子 GLM-Z1-32B-0414 作念到了性能与 DeepSeek-R1 等顶尖模子相忘形的同期,实测推理速率可达200 tokens/ 秒。
如斯速率,果决是现时国内交易模子中速率最快,况且它的高性价比版块价钱也仅为 DeepSeek-R1 的1/30。
值得一提的是,本次开源的统共模子均弃取宽松的 MIT 许可条约。
这就意味着上述的统共模子都不错免用度于交易用途、摆脱分发,为建设者提供了极大的使用和建设摆脱度。
那么这些开源模子的效用又怎样?
(PS:文末有彩蛋)
先看性能
最初来看下GLM-4-32B-0414。
它是一款领有 320 亿参数的基座大模子,其性能足以并列国表里范畴更大的主流模子。
据了解,这个模子基于 15T 高质地数据进行预检修,其中极端融入了大批推理类合成数据,为后续强化学习膨大提供了坚实基础。
在后检修阶段,智谱团队不仅完成了对话场景的东谈主类偏好对王人,还利用拒却采样和强化学习等先进技艺,重心提高了模子在请示清爽、工程代码生成、函数调用等关节任务上的才略,从而权臣增强了智能体推论任务的中枢教学。
本体测试标明,GLM-4-32B-0414 在工程代码编写、Artifacts 生成、函数调用、搜索问答及阐明撰写等多个应用场景均展现出色推崇。
部分基准测试筹办已达到或杰出 GPT-4o、DeepSeek-V3-0324(671B)等更大范畴模子的水平。
从实测效用来看,GLM-4-32B-0414 进一步提高了代码生成才略,可处理并生成结构更复杂的单文献代码。
举例来上这样一段 Prompt:
用 HTML 模拟太阳系的行星剖判。
再如:
联想一个相沿自界说函数绘制的绘制板,不错添加和删除自界说函数,并为函数指定颜料。
以及联想一个小游戏亦然不在话下:
用 HTML 网页竣事 2048 小游戏。
再来看下GLM-Z1-32B-0414的性能,一款专为深度推理优化的模子。
这个模子在 GLM-4-32B-0414 的基础上,弃取了冷运转聚积膨大强化学习的计策,并针对数学推导、代码生成、逻辑推理等高难度任务进行了专项优化,权臣提高了复杂问题的处置才略。
此外,它还通过引入基于对战排序反映的通用强化学习(RLHF),模子的泛化才略赢得进一步强化。
尽管仅领有 32B 参数,GLM-Z1-32B-0414 在部分任务上的推崇已可忘形 671B 参数的 DeepSeek-R1。
在 AIME 24/25、LiveCodeBench、GPQA 等泰斗基准测试中,该模子展现出超卓的数理推理才略,概况高效搪塞更平时、更具挑战性的复杂任务。
接下来,是更小范畴的GLM-Z1-9B-0414,在技艺上是沿用了上述模子的措施。
固然只须 9B 大小,但它在数学推理及通用任务上展现出杰出参数范畴的超卓性能,概述推崇稳居同量级开源模子前线。
尤其值得宥恕的是,在资源受限的应用场景中,该模子概况高效均衡计较效用与推理质地,为轻量化 AI 部署提供了极具竞争力的处置有筹办。
临了,再来看下千里想模子GLM-Z1-Rumination-32B-0414。
这个模子不错说是智谱对 AGI 昔时花式的一个探索。
千里想模子弃取与传统推理模子人大不同的责任范式,通过多步深度想考机制灵验搪塞高度绽放性和复杂性问题。
其中枢冲突体当今三个方面:
在深度推理过程中智能调用搜索用具处理复杂子任务;
改进性地引入多维度规章奖励体系,竣事端到端强化学习的精确请示与膨大;
竣工相沿"问题发现→信息检索→逻辑分析→任务处置"的商议闭环系统。
这些技艺改进使该模子在学术写稿、深度商议等需要复杂贯通才略的任务上展现出权臣上风。
举例让它回话一个科学假定推演问题:
av天堂快播若是东谈主类在火星地下发现液态湖泊中存在同样地球古菌的微生物,请臆测:
( 1 ) 这些微生物可能怎样恰当顶点环境?
( 2 ) 这一发现对‘生命发祥泛种论’的相沿 / 反驳把柄有哪些?
( 3 ) 联想一个可考据这些假说的空间执行有筹办(预算限定 5 亿好意思元)。
再看价钱
除模子开源外,基座、推理两类模子也已同步上线智谱 MaaS 绽放平台(bigmodel.cn),面向企业与建设者提供 API 处事。
本次上线的基座模子提供两个版块:GLM-4-Air-250414 和 GLM-4-Flash-250414,其中 GLM-4-Flash-250414 透澈免费。
上线的推理模子分为三个版块,分一名心不同场景需求:
GLM-Z1-AirX(极速版):定位国内最快推理模子,推理速率可达 200 tokens/ 秒,比老例快 8 倍;
GLM-Z1-Air(高性价比版):价钱仅为 DeepSeek-R1 的 1/30,得当高频调用场景;
GLM-Z1-Flash(免费版):相沿免费使用,旨在进一步镌汰模子使用门槛。
为了愈加一目了然,价钱表如下:
至于设立方面,32B 基础模子、32B 推理模子、32B 千里想模子(裸模子)的条目如下:
1 张 H100 / A100 或者更先进的 NVIDIA 旗舰显卡
4 张 4090/5090/3090
One More Thing
除了上述内容以外,智谱此次还有一个亮点的作为——
拿下一个顶级域名 Z.ai!
现时仍是上线了底下三款模子:
况且官方还亮出了一个比拟有酷爱酷爱的 slogan:
临了,纵不雅智谱在大模子期间的发展,不得不感叹其更新迭代以及开源的速率。
这样难怪它能成为第一家平稳运转 IPO 进程的"大模子六小龙"。
体验地址:
z.ai
一键三连「点赞」「转发」「阻碍心」
接待在研讨区留住你的见解!
— 完 —
不到一周!中国 AIGC 产业峰会不雅众正在火热报名中 � � ♀️
全部嘉宾已就位 � � 百度、华为、AWS、MSRA、无问芯穹、数势科技、面壁智能、生数科技等十数位 AI 规模创变者将王人聚峰会,让更多东谈主用上 AI、用好 AI,与 AI 一同加快成长~
4 月 16 日周三,就在北京,沿路来深度求索 AI 怎样用 � �
� � 一键星标 � �
科技前沿进展逐日见艳照