找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 67|回复: 0

智谱AI正式发布GLM-5大模型,参数规模从355亿扩展到744亿,预训练数据量增至28.5万亿token。

[复制链接]

6

主题

0

回帖

28

积分

新手上路

积分
28
发表于 2026-2-12 11:51:00 | 显示全部楼层 |阅读模式
智谱AI正式发布GLM-5大模型,参数规模从355亿扩展到744亿,预训练数据量增至28.5万亿token。该模型集成了DeepSeek稀疏注意力机制,在保持长文本处理能力的同时降低部署成本。GLM-5在编程任务性能上提升20%,能完整完成项目开发全流程,接近ClaudeOpus4.5水平。


在VendingBench2测试中,GLM-5模拟经营自动售货机一年获得4432美元收益,展现强大的长期规划能力。模型已开源并支持商用,可在Z.ai平台免费体验。GLM-5标志着AI从聊天工具向实际工作伙伴的转变,特别适合程序员、创业者和内容创作者使用。

技术细节:他们做对了什么?
如果你对技术感兴趣,这里有几个值得关注的点:
稀疏注意力机制

:GLM-5 集成了 DeepSeek 稀疏注意力机制,在降低部署成本的同时保持了长文本处理能力 Futu News。通俗点说,就是"省钱又好用"。

强化学习基础设施 "slime"

:他们开发了一套新的训练系统,能更高效地让模型"学习"——这是为什么 GLM-5 能在推理、编码、智能体任务上表现这么好的原因之一。

开源 + 商用友好

:模型权重以 MIT 许可证发布,意味着你可以免费用,甚至可以商用。这在国内大模型里算是比较良心的。#人工智能##智谱清言##GLM-5#














本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-23 21:37 , Processed in 0.090952 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表