<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>一起港湾 - AI大模型</title>
    <link>https://www.17gw.com/forum-144-1.html</link>
    <description>Latest 20 threads of AI大模型</description>
    <copyright>Copyright(C) 一起港湾</copyright>
    <generator>Discuz! Board by Discuz! Team</generator>
    <lastBuildDate>Wed, 10 Jun 2026 00:01:06 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://www.17gw.com/static/image/common/logo_88_31.gif</url>
      <title>一起港湾</title>
      <link>https://www.17gw.com/</link>
    </image>
    <item>
      <title>这个大模型能力benchmark结果各位认可否?</title>
      <link>https://www.17gw.com/thread-6957-1-1.html</link>
      <description><![CDATA[这个大模型能力benchmark结果各位认可否?
#]]></description>
      <category>AI大模型</category>
      <author>罗丽</author>
      <pubDate>Tue, 09 Jun 2026 03:00:48 +0000</pubDate>
    </item>
    <item>
      <title>英伟达开源550B大模型：卖铲人最高明的阳谋</title>
      <link>https://www.17gw.com/thread-6941-1-1.html</link>
      <description><![CDATA[【英伟达开源550B大模型：卖铲人最高明的阳谋】

英伟达刚发布了Nemotron 3 Ultra，一个550B的MoE巨无霸开源模型，专为智能体设计。很多人在惊叹它的推理速度和架构创新，但这里面真正高级的逻辑，是英伟达在用最顶级的开源软件，给自己的硬件悍然带货。

智能体是未来 ...]]></description>
      <category>AI大模型</category>
      <author>皮埃尔</author>
      <pubDate>Fri, 05 Jun 2026 16:13:45 +0000</pubDate>
    </item>
    <item>
      <title>Anthropic又融资了650亿美元。估值已经到万亿这个级别了。 ​​​</title>
      <link>https://www.17gw.com/thread-6928-1-1.html</link>
      <description><![CDATA[Anthropic又融资了650亿美元。估值已经到万亿这个级别了。 
​​​]]></description>
      <category>AI大模型</category>
      <author>纯野山参</author>
      <pubDate>Fri, 29 May 2026 00:41:46 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek这次真的杀疯了，直接把V4-Pro的API价格永久砍到了原价的四分之一，这力度大超预期，妥妥的AI圈价格屠夫！</title>
      <link>https://www.17gw.com/thread-6902-1-1.html</link>
      <description><![CDATA[DeepSeek这次真的杀疯了，直接把V4-Pro的API价格永久砍到了原价的四分之一，这力度大超预期，妥妥的AI圈价格屠夫！但这绝对是好事，堪称AI行业的平价革命。这种良性的价格战能把原本高不可攀的AI门槛直接打下来，逼着其他厂商跟进，让更多企业用得起顶尖模型，最终把整 ...]]></description>
      <category>AI大模型</category>
      <author>半纸鸢</author>
      <pubDate>Sun, 24 May 2026 01:48:28 +0000</pubDate>
    </item>
    <item>
      <title>【DeepSeek V4 对比 Claude Code：速度翻倍成本骤降，开发格局变了】</title>
      <link>https://www.17gw.com/thread-6797-1-1.html</link>
      <description><![CDATA[【DeepSeek V4 对比 Claude Code：速度翻倍成本骤降，开发格局变了】

快速阅读：开发者发现使用 DeepSeek V4 代替 Claude Code 能获得数倍的响应速度和极低的成本。尽管在复杂的多文件重构和逻辑深度上仍存在争议，但其性价比已足以改变高强度开发的成本结构。

以前 ...]]></description>
      <category>AI大模型</category>
      <author>有梦就有缘</author>
      <pubDate>Sat, 02 May 2026 13:53:50 +0000</pubDate>
    </item>
    <item>
      <title>现在看到这种图，都得谨慎点，去官网确认了下，是真的，GPT Image-2 断层领先 ​​​</title>
      <link>https://www.17gw.com/thread-6751-1-1.html</link>
      <description><![CDATA[现在看到这种图，都得谨慎点，去官网确认了下，是真的，GPT Image-2 断层领先 ​​​]]></description>
      <category>AI大模型</category>
      <author>茼花粉</author>
      <pubDate>Wed, 22 Apr 2026 04:50:34 +0000</pubDate>
    </item>
    <item>
      <title>Gemini 3.1 Flash TTS正式推出，谷歌最新的文本转语音模型，支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音，以及 70 种不同语言。</title>
      <link>https://www.17gw.com/thread-6721-1-1.html</link>
      <description><![CDATA[Gemini 3.1 Flash TTS正式推出，谷歌最新的文本转语音模型，支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音，以及 70 种不同语言。


现已在 AI Studio 的全新音频 Playground 和 Gemini API 中上线！
 http://t.cn/AXMrfgfq ​​​
 ...]]></description>
      <category>AI大模型</category>
      <author>狂刷排名</author>
      <pubDate>Fri, 17 Apr 2026 11:06:44 +0000</pubDate>
    </item>
    <item>
      <title>千问上线表格Agent：对话直接生成、编辑Excel文</title>
      <link>https://www.17gw.com/thread-6682-1-1.html</link>
      <description><![CDATA[【千问上线表格Agent：对话直接生成、编辑Excel文】 钛媒体App 4月14日消息，千问上线“表格Agent”，支持在对话中直接生成、编辑Excel文件。用户可以要求千问检索信息后生成表格，也可以将多轮对话内容整理为表格，或基于图片、文件生成。系统通常可在1–2分钟内输出可 ...]]></description>
      <category>AI大模型</category>
      <author>透明的黑色</author>
      <pubDate>Tue, 14 Apr 2026 06:18:08 +0000</pubDate>
    </item>
    <item>
      <title>Anthropic 最近算力成本真是顶不住了，疯狂降成本</title>
      <link>https://www.17gw.com/thread-6561-1-1.html</link>
      <description><![CDATA[Anthropic 最近算力成本真是顶不住了，疯狂降成本


昨晚又推出了advisor tool，Sonnet 和 Haiku 这种小模型执行任务的时候，可以调用 Opus 这种大模型介入指导。

有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。

因为这样用户无法直接访问模型，又能提 ...]]></description>
      <category>AI大模型</category>
      <author>憬溺</author>
      <pubDate>Fri, 10 Apr 2026 16:33:03 +0000</pubDate>
    </item>
    <item>
      <title>手机离线跑大模型！谷歌Gemma 4开源杀疯了🔥</title>
      <link>https://www.17gw.com/thread-6520-1-1.html</link>
      <description><![CDATA[手机离线跑大模型！谷歌Gemma 4开源杀疯了🔥

 
AI圈又炸场！谷歌刚开源Gemma 4系列，31B版本直接登顶开源榜，小参数打赢大模型，手机端就能离线全模态运行✨
 
轻量化王者，内存占用大砍，推理速度狂飙，图文理解、代码能力拉满，个人开发者与中小企业狂喜💻
 
不用挤 ...]]></description>
      <category>AI大模型</category>
      <author>费尔牧笔记</author>
      <pubDate>Thu, 09 Apr 2026 06:40:35 +0000</pubDate>
    </item>
    <item>
      <title>✨ AI常常被视为一个“黑盒子”，但每一个智能系统背后都隐藏着一个结构精密的架构</title>
      <link>https://www.17gw.com/thread-6482-1-1.html</link>
      <description><![CDATA[#人工智能# 


✨ AI常常被视为一个“黑盒子”，但每一个智能系统背后都隐藏着一个结构精密的架构——从原始硬件到最终应用如聊天机器人和AI助手！我整理了这个七层分解（参考上传的图片），帮你揭秘AI系统是如何构建、训练并在规模上部署的。

🟥   𝟭. 物理层（硬件与 ...]]></description>
      <category>AI大模型</category>
      <author>林小北</author>
      <pubDate>Thu, 09 Apr 2026 00:40:29 +0000</pubDate>
    </item>
    <item>
      <title>不靠工具，只靠逻辑：Gemma 4 的长程推理实验</title>
      <link>https://www.17gw.com/thread-6415-1-1.html</link>
      <description><![CDATA[【不靠工具，只靠逻辑：Gemma 4 的长程推理实验】


快速阅读：通过一个复杂的维吉尼亚密码（Vigenère cipher）测试，发现 Gemma 4 在面对高难度任务时表现出极佳的“思维弹性”：它既能在被要求时进行长达十分钟的深度推理，又具备在无法解决时主动拒绝幻觉、不编造答 ...]]></description>
      <category>AI大模型</category>
      <author>客路青山</author>
      <pubDate>Wed, 08 Apr 2026 00:32:36 +0000</pubDate>
    </item>
    <item>
      <title>大模型的连续跟踪</title>
      <link>https://www.17gw.com/thread-6378-1-1.html</link>
      <description><![CDATA[大模型的连续跟踪

一、Anthropic：
——Claude调整订阅政策，第三方工具调用权限被移除，用户需单独购买额度包或切换至APIKey模式（2026.04.04起）
——意外泄露原始代码，曝光了包括24小时自主代理（KAIROS）和AI电子宠物（BUDDY）在内的多项未发布功能；从泄露代码看 ...]]></description>
      <category>AI大模型</category>
      <author>天下行</author>
      <pubDate>Tue, 07 Apr 2026 09:31:21 +0000</pubDate>
    </item>
    <item>
      <title>Gemma 4：是模型进阶，还是工程灾难？</title>
      <link>https://www.17gw.com/thread-6376-1-1.html</link>
      <description><![CDATA[【Gemma 4：是模型进阶，还是工程灾难？】


快速阅读：Gemma 4 的发布正处于权重释放与底层适配脱节的阵痛期。虽然模型潜力巨大，但推理引擎在处理其特有的逻辑结构时，正面临严重的循环与崩溃问题。

---

Gemma 4 的发布像是一次未经充分驱动优化的硬件上架。权重已 ...]]></description>
      <category>AI大模型</category>
      <author>dxl0812</author>
      <pubDate>Tue, 07 Apr 2026 09:08:42 +0000</pubDate>
    </item>
    <item>
      <title>把参数丢进硬盘：Gemma 4 的轻量化魔法</title>
      <link>https://www.17gw.com/thread-6357-1-1.html</link>
      <description><![CDATA[【把参数丢进硬盘：Gemma 4 的轻量化魔法】


快速阅读：Gemma 4 E 系列模型通过 Per-Layer Embeddings 技术，将大量静态 Embedding 参数从显存移至磁盘。这种设计在不增加推理计算负担的前提下，极大地扩展了模型的知识容量。

---

Gemma 4 的 E2B 和 E4B 模型里，那 ...]]></description>
      <category>AI大模型</category>
      <author>简小军</author>
      <pubDate>Tue, 07 Apr 2026 01:02:36 +0000</pubDate>
    </item>
    <item>
      <title>规模迷信的终结：Gemma 4 31B 稠密模型对 MoE 的效率碾压</title>
      <link>https://www.17gw.com/thread-6355-1-1.html</link>
      <description><![CDATA[【规模迷信的终结：Gemma 4 31B 稠密模型对 MoE 的效率碾压】


快速阅读：在 FoodTruck Bench 的商业模拟测试中，Gemma 4 (3/1B) 表现惊人，以仅 $0.20/run 的极低成本实现了 100% 的生存率与超高的投资回报率。它不仅在决策质量上接近 GPT-5.2，更在性价比上彻底碾压 ...]]></description>
      <category>AI大模型</category>
      <author>先姐</author>
      <pubDate>Tue, 07 Apr 2026 00:58:05 +0000</pubDate>
    </item>
    <item>
      <title>大模型的发展史，本质上是一部关于“对齐”与“解构”的博弈史。今天，Gemma 4 31B 迎来了它最彻底的一次释放。</title>
      <link>https://www.17gw.com/thread-6337-1-1.html</link>
      <description><![CDATA[大模型的发展史，本质上是一部关于“对齐”与“解构”的博弈史。今天，Gemma 4 31B 迎来了它最彻底的一次释放。


开发者 dealignai 正式发布了 Gemma-4-31B-JANG_4M-CRACK。这不仅是一个简单的量化版本，更是一个经过深度“消融”处理、完全移除拒绝机制的本地模型巅峰 ...]]></description>
      <category>AI大模型</category>
      <author>淡泊随心</author>
      <pubDate>Mon, 06 Apr 2026 15:21:09 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek V4的消息出来那天，我看到有人在群里问：R1我还没学完，V4又来了，感觉永远在追。</title>
      <link>https://www.17gw.com/thread-6290-1-1.html</link>
      <description><![CDATA[DeepSeek V4的消息出来那天，我看到有人在群里问：R1我还没学完，V4又来了，感觉永远在追。


我当时的第一反应是：你学的方向可能就错了。

DeepSeek V4预计本月发布——1万亿参数，百万Token上下文，性能据说对标GPT-5级别。

消息一出，我周围就有朋友开始焦虑：要不 ...]]></description>
      <category>AI大模型</category>
      <author>无私奉献是真爱</author>
      <pubDate>Mon, 06 Apr 2026 02:48:01 +0000</pubDate>
    </item>
    <item>
      <title>本地大模型的“甜点位”：Gemma 4 26B 的突围</title>
      <link>https://www.17gw.com/thread-6270-1-1.html</link>
      <description><![CDATA[【本地大模型的“甜点位”：Gemma 4 26B 的突围】


快速阅读：在本地大模型领域，Gemma 4 26B MoE 架构凭借极高的推理效率和“不纠结”的决策风格，成为了 64GB 内存设备上的新宠。相比于容易陷入思考死循环的 Qwen 3.5，它在执行复杂编程任务时表现得更加果断且快速。 ...]]></description>
      <category>AI大模型</category>
      <author>白云之上</author>
      <pubDate>Mon, 06 Apr 2026 00:21:29 +0000</pubDate>
    </item>
    <item>
      <title>Andrej Karpathy分享了【如何用大模型来打造私人知识库】，这个帖子目前在X上有1037万的阅读。</title>
      <link>https://www.17gw.com/thread-6221-1-1.html</link>
      <description><![CDATA[Andrej Karpathy分享了【如何用大模型来打造私人知识库】，这个帖子目前在X上有1037万的阅读。我让Gemini做了个更有人味的翻译版。


标题：用大模型打造私人知识库

最近我摸索出一套极佳的工作流：用大语言模型（LLM）针对感兴趣的研究课题，搭建个人知识库。照这套玩 ...]]></description>
      <category>AI大模型</category>
      <author>小苹果的清甜</author>
      <pubDate>Sun, 05 Apr 2026 02:09:51 +0000</pubDate>
    </item>
  </channel>
</rss>