AI大模型一起港湾

🚀MiniMax-M2.7 上线 Ollama Cloud：88% 自进化胜率，SWE-Pro 56.22% 直逼 Opus

🚀MiniMax-M2.7 上线 Ollama Cloud：88% 自进化胜率，SWE-Pro 56.22% 直逼 Opus 3 月 18 日，Ollama 官方宣布 MiniMax-M2.7 已正式上线 Ollama Cloud，定位“专为 coding 和 agentic tasks 打造”。这不是本地权重，而是云端托管模型，开发者零门槛即可调用。核心亮点（MiniMax 官方发布） 1、首款深度参与自身进化的 ...

0240

attribt 发表于 2026-3-19 AI大模型

刚刚小米在mimo官网正式公开了mimo-v2大模型系列的新成员，有Pro，omni和tts。

刚刚小米在mimo官网正式公开了mimo-v2大模型系列的新成员，有Pro，omni和tts。其中mimo-v2-pro是一个1t参数大模型，激活了42b，水平基本上在国际第二梯队，国内第一梯队。同时小米也承认，一周前悄悄上线的匿名大模型Hunter Alpha就是mimo-v2-pro的早期测试版本。这个匿名模型刚上线不久，就成了open router的token消 ...

0209

果如发表于 2026-3-19 AI大模型

试了一下智谱刚出的 GLM-5-Turbo 模型，挺牛逼啊，太强了，又快又好！

试了一下智谱刚出的 GLM-5-Turbo 模型，挺牛逼啊，太强了，又快又好！这个模型是专门用来面向 OpenClaw 这种 Agent 的场景深度优化的。输出速度非常快。它的提示遵循和工具链调用很稳定，在前端的表现上也不错。据他们自己说，这个模型在以下核心能力上都变得非常强，并做了专项的迭代：工具调用、指令遵循、定时和 ...

0212

此生不忘发表于 2026-3-17 AI大模型

3月16日上午消息，今日，智谱发布首个专为龙虾场景深度优化的通用大模型GLM-5-Turbo，并在发布时同步上调了GLM-5-Turbo的API价格，幅度为20%。

3月16日上午消息，今日，智谱发布首个专为龙虾场景深度优化的通用大模型GLM-5-Turbo，并在发布时同步上调了GLM-5-Turbo的API价格，幅度为20%。根据端到端龙虾评测基准ZClawBench评测结果，GLM-5-Turbo在OpenClaw场景中的表现相比GLM-5提升显著，在多项关键任务上整体领先于多家主流模型。值得一提的是，伴随这款“龙虾专供 ...

0213

春春欲动发表于 2026-3-16 AI大模型

AI 大佬 Sebastian Raschka 搞了一份全球 LLM 大模型的架构图合集。

AI 大佬 Sebastian Raschka 搞了一份全球 LLM 大模型的架构图合集。图片非常精美，再也不用到处找图了。传送门：sebastianraschka.com/llm-architecture-gallery/ ##

0224

老高—深圳代理发表于 2026-3-16 AI大模型

当前操作系统将AI智能体强塞进为人类图形交互设计的旧壳——权限混乱、语义割裂、安全漏洞频发，这套架构从未为"持续自主运行的代理"而设计，修补已无意义。

[AI]《AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem》R Liu, T Zhe, D Wang, Z Yao… [University of Kansas] (2026) 当前操作系统将AI智能体强塞进为人类图形交互设计的旧壳——权限混乱、语义割裂、安全漏洞频发，这套架构从未为"持续自主运行的代理"而设计，修补已无意义。本文的 ...

0235

炎木清风发表于 2026-3-16 AI大模型

好消息确实是好消息，3月14 日，Anthropic正式宣布Claude3.5（Sonnet 4.6 和 Opus 4.6）支持100万token上下文

好消息确实是好消息，3月14 日，Anthropic正式宣布Claude3.5（Sonnet 4.6 和 Opus 4.6）支持100万token上下文，100万token，大约相当于750万个英文单词，或者一整套《哈利·波特》系列的7倍。这意味着什么！首先是长文档处理，我们可以直接把整本书、整个代码库丢给 AI；然后，我们和它的多轮对话更连贯了，不用反复复 ...

0223

秦风宁静发表于 2026-3-16 AI大模型

AI大语言模型的原一性原理

AI大语言模型的原一性原理：LLM 是一个通过超大规模的算力（Scaling Laws），利用注意力机制（Attention），在极其庞大的高维向量空间中（Embeddings），通过极致压缩人类知识（Compression），来精准计算下一个词概率（Next-Token Prediction）的数学引擎 ...

0213

tkv2373 发表于 2026-3-15 AI大模型

阿里腾讯字节百度,打响大模型生态战

🔥 今日AI十大热点： 1. AI治理再升级安全底线不可越 2. AI技术创新迎来新一轮机遇期 3. OpenAI发布最新模型GPT-5.4 4. 中国AI算力暗战:字节阿里押注英伟达 5. 阿里腾讯字节百度,打响大模型生态战 💡 今日观察：AI技术持续突破！ ...

0210

南隐发表于 2026-3-15 AI大模型

Qwen3.5 量化：INT4 vs NVFP4 vs FP8 vs BF16

Qwen3.5 量化：INT4 vs NVFP4 vs FP8 vs BF16 我对量化的 Qwen3.5 9B、27B 和 35B 进行了全面评估——全部与 vLLM 兼容。文章： http://t.cn/AXVuHrSr 一些实用建议： - 性能优异的 4 位 Qwen3.5 27B 处理器比 Qwen3.5 9B 处理器性能强得多，而且内存预算也相近。 - 注意“INT4”标签：有些 INT4 型号最终会变得几 ...

0224

非常目的发表于 2026-3-14 AI大模型

模型和框架的关系

模型和框架的关系基座大模型正在快速模仿并内化框架的核心能力，并将其直接纳入自身产品当中，而框架本身也随之变得越来越复杂，这种现象背后，模型与框架的关系正在发生根本性的转变。在早期阶段，基座大模型由于主要擅长下一词预测，在多步规划、工具调用、状态管理和长任务执行上存在明显短板，因此LangChain、LlamaI ...

0244

爱深求发表于 2026-3-13 AI大模型

大模型 Tool Call 描述太占上下文的问题解决了?

大模型 Tool Call 描述太占上下文的问题解决了? Manus的后端负责人刚在reddit上发的一篇帖子爆火, 我看完了赶紧给大家整理下他做了什么. 大家都知道大模型配置了 tool call 就可以使用本地工具了, 而且可以跟操作系统交互, 访问本地资源从而完成更复杂的任务. 比如你就可以把视频素材上传到部署了openclaw的电脑, 然后让 ...

0217

易达运输物流发表于 2026-3-13 AI大模型

消息称 #Meta全新AI模型牛油果推迟发布#，性能不敌 OpenAI、Anthropic 等友商成主因

【消息称 #Meta全新AI模型牛油果推迟发布#，性能不敌 OpenAI、Anthropic 等友商成主因】据《纽约时报》报道，Meta 原定 3 月中旬发布的全新 AI 模型“牛油果”已推迟至最快 5 月。内部测试显示，其逻辑推理、编程、写作能力明显落后于 OpenAI、Anthropic 等同行，甚至不及谷歌 Gemini 3.0。Meta 管理层甚至考虑临时使用谷歌 ...

0212

费尔牧笔记发表于 2026-3-13 AI大模型

Anthropic 的 Claude Plan Mode 提示词被扒出来了，看完才发现，他们自己用 AI 的方式跟外面宣传的完全不一样。核心思路不是让 AI 做更多事，反而是想办法不让它动手。

Anthropic 的 Claude Plan Mode 提示词被扒出来了，看完才发现，他们自己用 AI 的方式跟外面宣传的完全不一样。核心思路不是让 AI 做更多事，反而是想办法不让它动手。一旦进入规划模式，AI 就完全不能改代码了。它只能读文件、搜索信息、问问题。提示词里直接写死了一句话：此要求优先于其他任何指令。这相当于物理上把 ...

0236

苏北小哥发表于 2026-3-13 AI大模型

Qwen3.5-397B-A17B

Qwen3.5-397B-A17BNOTE本仓库包含以 Hugging Face Transformers 格式提供的后训练模型的权重和配置文件。这些产物兼容 Hugging Face Transformers、vLLM、SGLang、KTransformers 等框架。 TIP对于希望获得托管式、可扩展推理服务而无需维护基础设施的用户，阿里云百炼平台提供了官方的 Qwen API 服务。特别地，Qwen3.5-Plu ...

1242

非常目的发表于 2026-3-12 AI大模型

AI智能体应用引爆算力需求，腾讯云也正式加入调价行列！事件

AI智能体应用引爆算力需求，腾讯云也正式加入调价行列！事件：腾讯云智能体开发平台公告，自2026年3月13日起对部分模型计费规则进行调整，GLM5、MiniMax2.5、Kimi2.5等多款模型将结束免费公测，正式启用按量计费模式。点评：这一消息对云计算板块构成正面催化。腾讯云此次调价并非个例，随着AI应用全面落地普及，尤其 ...

0218

想拒绝呼吸发表于 2026-3-12 AI大模型

GPT-5.4来了，它更像是一个“模型能力大一统”成果

GPT-5.4来了，它更像是一个“模型能力大一统”成果：OpenAI首次在单一模型中，把推理（Reasoning）、编程（Coding）、计算机原生交互（Computer Use）、深度网页搜索以及百万级Token上下文全部揉碎、重组，焊死在了同一个模型里。🌹 万物归一，一统生态，这是大模型的发展方向与趋势，才能有望进化成为AI操作系统。🍎🌹 ...

0230