订阅

AI大模型 今日: 0|主题: 98|排名: 17 

  • 当前操作系统将AI智能体强塞进为人类图形交互设计的旧壳——权限混乱、语义割裂、安全漏洞频发,这套架构从未为"持续自主运行的代理"而设计,修补已无意义。
    [AI]《AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem》R Liu, T Zhe, D Wang, Z Yao… [University of Kansas] (2026) 当前操作系统将AI智能体强塞进为人类图形交互设计的旧壳——权限混乱、语义割裂、安全漏洞频发,这套架构从未为"持续自主运行的代理"而设计,修补已无意义。 本文的 ...
    0137 炎木清风 发表于 2026-3-16 AI大模型
  • 好消息确实是好消息,3月14 日,Anthropic正式宣布Claude3.5(Sonnet 4.6 和 Opus 4.6)支持100万token上下文
    好消息确实是好消息,3月14 日,Anthropic正式宣布Claude3.5(Sonnet 4.6 和 Opus 4.6)支持100万token上下文,100万token,大约相当于750万个英文单词,或者一整套《哈利·波特》系列的7倍。 这意味着什么! 首先是长文档处理,我们可以直接把整本书、整个代码库丢给 AI;然后,我们和它的多轮对话更连贯了,不用反复复 ...
    0122 秦风宁静 发表于 2026-3-16 AI大模型
  • AI大语言模型的原一性原理
    AI大语言模型的原一性原理:LLM 是一个通过超大规模的算力(Scaling Laws),利用注意力机制(Attention),在极其庞大的高维向量空间中(Embeddings),通过极致压缩人类知识(Compression),来精准计算下一个词概率(Next-Token Prediction)的数学引擎 ​​​ ...
    0114 tkv2373 发表于 2026-3-15 AI大模型
  • 阿里腾讯字节百度,打响大模型生态战
    🔥 今日AI十大热点: 1. AI治理再升级 安全底线不可越 2. AI技术创新迎来新一轮机遇期 3. OpenAI发布最新模型GPT-5.4 4. 中国AI算力暗战:字节阿里押注英伟达 5. 阿里腾讯字节百度,打响大模型生态战 💡 今日观察:AI技术持续突破! ...
    0115 南隐 发表于 2026-3-15 AI大模型
  • Qwen3.5 量化:INT4 vs NVFP4 vs FP8 vs BF16
    Qwen3.5 量化:INT4 vs NVFP4 vs FP8 vs BF16 我对量化的 Qwen3.5 9B、27B 和 35B 进行了全面评估——全部与 vLLM 兼容。 文章: http://t.cn/AXVuHrSr 一些实用建议: - 性能优异的 4 位 Qwen3.5 27B 处理器比 Qwen3.5 9B 处理器性能强得多,而且内存预算也相近。 - 注意“INT4”标签:有些 INT4 型号最终会变得几 ...
    0118 非常目的 发表于 2026-3-14 AI大模型
  • 模型和框架的关系
    模型和框架的关系 基座大模型正在快速模仿并内化框架的核心能力,并将其直接纳入自身产品当中,而框架本身也随之变得越来越复杂,这种现象背后,模型与框架的关系正在发生根本性的转变。在早期阶段,基座大模型由于主要擅长下一词预测,在多步规划、工具调用、状态管理和长任务执行上存在明显短板,因此LangChain、LlamaI ...
    0139 爱深求 发表于 2026-3-13 AI大模型
  • 大模型 Tool Call 描述太占上下文的问题解决了?
    大模型 Tool Call 描述太占上下文的问题解决了? Manus的后端负责人刚在reddit上发的一篇帖子爆火, 我看完了赶紧给大家整理下他做了什么. 大家都知道大模型配置了 tool call 就可以使用本地工具了, 而且可以跟操作系统交互, 访问本地资源从而完成更复杂的任务. 比如你就可以把视频素材上传到部署了openclaw的电脑, 然后让 ...
    0122 易达运输物流 发表于 2026-3-13 AI大模型
  • 消息称 #Meta全新AI模型牛油果推迟发布#,性能不敌 OpenAI、Anthropic 等友商成主因
    【消息称 #Meta全新AI模型牛油果推迟发布#,性能不敌 OpenAI、Anthropic 等友商成主因】据《纽约时报》报道,Meta 原定 3 月中旬发布的全新 AI 模型“牛油果”已推迟至最快 5 月。内部测试显示,其逻辑推理、编程、写作能力明显落后于 OpenAI、Anthropic 等同行,甚至不及谷歌 Gemini 3.0。Meta 管理层甚至考虑临时使用谷歌 ...
    0126 费尔牧笔记 发表于 2026-3-13 AI大模型
  • Anthropic 的 Claude Plan Mode 提示词被扒出来了,看完才发现,他们自己用 AI 的方式跟外面宣传的完全不一样。核心思路不是让 AI 做更多事,反而是想办法不让它动手。
    Anthropic 的 Claude Plan Mode 提示词被扒出来了,看完才发现,他们自己用 AI 的方式跟外面宣传的完全不一样。核心思路不是让 AI 做更多事,反而是想办法不让它动手。 一旦进入规划模式,AI 就完全不能改代码了。它只能读文件、搜索信息、问问题。提示词里直接写死了一句话:此要求优先于其他任何指令。这相当于物理上把 ...
    0137 苏北小哥 发表于 2026-3-13 AI大模型
  • Qwen3.5-397B-A17B
    Qwen3.5-397B-A17BNOTE本仓库包含以 Hugging Face Transformers 格式提供的后训练模型的权重和配置文件。这些产物兼容 Hugging Face Transformers、vLLM、SGLang、KTransformers 等框架。 TIP对于希望获得托管式、可扩展推理服务而无需维护基础设施的用户,阿里云百炼平台 提供了官方的 Qwen API 服务。特别地,Qwen3.5-Plu ...
    1148 非常目的 发表于 2026-3-12 AI大模型
  • AI智能体应用引爆算力需求,腾讯云也正式加入调价行列! 事件
    AI智能体应用引爆算力需求,腾讯云也正式加入调价行列! 事件:腾讯云智能体开发平台公告,自2026年3月13日起对部分模型计费规则进行调整,GLM5、MiniMax2.5、Kimi2.5等多款模型将结束免费公测,正式启用按量计费模式。 点评:这一消息对云计算板块构成正面催化。腾讯云此次调价并非个例,随着AI应用全面落地普及,尤其 ...
    0123 想拒绝呼吸 发表于 2026-3-12 AI大模型
  • GPT-5.4来了,它更像是一个“模型能力大一统”成果
    GPT-5.4来了,它更像是一个“模型能力大一统”成果:OpenAI首次在单一模型中,把推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索以及百万级Token上下文全部揉碎、重组,焊死在了同一个模型里。🌹 万物归一,一统生态,这是大模型的发展方向与趋势,才能有望进化成为AI操作系统。🍎🌹 ...
    0135 林振祥 发表于 2026-3-12 AI大模型
  • 昨天用谷歌的antigravity在项目文件夹里批量改点东西,token很快消耗光了,问了Gemini原因,做了一张科普的漫画,大模型能力越强
    昨天用谷歌的antigravity在项目文件夹里批量改点东西,token很快消耗光了,问了Gemini原因,做了一张科普的漫画,大模型能力越强,提示词需要的越少。 ​​​
    0170 啊哎呀 发表于 2026-3-12 AI大模型
  • DHH 在 X 发文赞扬 Kimi K2.5 作为日常基本任务的首选 AI 模型。 ​​​
    DHH 在 X 发文赞扬 Kimi K2.5 作为日常基本任务的首选 AI 模型。 ​​​
    0126 夕遥 发表于 2026-3-12 AI大模型
  • wow,OpenAI Codex 送了 6 个月 Pro [[doge][doge]继 Copilot、Augment Code 又一个免费的付费级 AI Coding 工具(ps: Claude 也申请了但是没给) ​​​
    wow,OpenAI Codex 送了 6 个月 Pro [[doge][doge]继 Copilot、Augment Code 又一个免费的付费级 AI Coding 工具(ps: Claude 也申请了但是没给) ​​​
    0122 银河爷 发表于 2026-3-12 AI大模型
  • 看了好几遍才看懂马斯克说的这个项目是啥意思
    看了好几遍才看懂马斯克说的这个项目是啥意思 大概是说 xAI 与特斯拉要做一个联合项目,一个数字世界 Agent,该项目命名「Macrohard」 或 「Digital Optimus」。 该 Agent 有系统 1 和系统 2,系统 1 是 Digital Optimus ,可处理并执行过去 5 秒的实时电脑屏幕视频及键盘鼠标操作;系统 2 是 Grok,是主指挥和导航。 ...
    0118 雷小羞 发表于 2026-3-12 AI大模型
  • 『连线』杂志采访了超过 30 位 OpenAI 现任高管、员工及匿名知情人士,试图回答一个问题:在 AI 编程这条赛道上,OpenAI 是怎么
    『连线』杂志采访了超过 30 位 OpenAI 现任高管、员工及匿名知情人士,试图回答一个问题:在 AI 编程这条赛道上,OpenAI 是怎么把先手优势拱手让人的。 报道信息量极大,值得逐条拆开来看: - 2021 年 OpenAI 就向《连线》杂志演示过初代 Codex,团队内部也清楚这是通向超级助手的基石。但紧接着,这支团队就被拆散了— ...
    0119 袁更生 发表于 2026-3-12 AI大模型
  • Qwen3.5-9B 无论是跑分还是体感都很惊人,关键是这玩意一块 3060 就能跑到 35 t/s。前几年谁敢想比 GPT-4 还强一些的模型能运行在个人电脑上。
    Qwen3.5-9B 无论是跑分还是体感都很惊人,关键是这玩意一块 3060 就能跑到 35 t/s。前几年谁敢想比 GPT-4 还强一些的模型能运行在个人电脑上。 下面是我让 Qwen3.5-9B 解读第 0 号塔罗牌的输出结果: ​​​
    0114 东方飞雁 发表于 2026-3-11 AI大模型
  • 下一页 »

    快速发帖

    还可输入 120 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    关注公众号

    相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

    在本版发帖
    关注公众号
    返回顶部