AI大模型一起港湾

隐藏置顶帖置顶一起港湾 (17GW.com) 论坛发帖须知

欢迎来到一起港湾 (17GW) 社区！这里是 AI 技术爱好者、数码极客和生活分享者的精神家园。为了维护港湾的纯净秩序与技术氛围，请在开启您的分享之旅前，仔细阅读并遵守以下发帖规范。一、核心发帖准则 [*]主题契合，精准归类：请确保内容与所属版块（如 AI 技术、数码维修、资源分享等）相关。标题应简明扼要，避免“ ...

1557

teanzhong 发表于 2026-3-29 服务

OpenAI Codex 上线了 Record & Replay 功能：在 Mac 上把一个重复性操作演示一遍，Codex 会观察你的操作过程，自动生成一个可复用的 Skill。下次遇到同样的任务，换一组输入参数，Codex 就能替你重新执行。

OpenAI Codex 上线了 Record & Replay 功能：在 Mac 上把一个重复性操作演示一遍，Codex 会观察你的操作过程，自动生成一个可复用的 Skill。下次遇到同样的任务，换一组输入参数，Codex 就能替你重新执行。目前仅限 macOS，欧盟地区暂不可用，使用前需要先开启 Computer Use。这个功能解决的问题很具体。很多日常工作流 ...

0200

j15023105c 发表于 2026-6-19 AI大模型

Google 发新的开源多模态模型了，16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来？🤔

Google 发新的开源多模态模型了，16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来？🤔 Gemma 4 12B，Google 把本地多模态模型推到 16GB 设备档位 Google 发布 Gemma 4 12B，定位在边缘小模型 E4B 和 26B MoE 之间：参数规模更轻，但保留接近 26B 模型的推理能力，目标是让多模态 agent 能直接在笔记本上跑 ...

0210

登黑不得善终发表于 2026-6-13 AI大模型

这个大模型能力benchmark结果各位认可否?

这个大模型能力benchmark结果各位认可否? #

0241

罗丽发表于 2026-6-9 AI大模型

英伟达开源550B大模型：卖铲人最高明的阳谋

【英伟达开源550B大模型：卖铲人最高明的阳谋】英伟达刚发布了Nemotron 3 Ultra，一个550B的MoE巨无霸开源模型，专为智能体设计。很多人在惊叹它的推理速度和架构创新，但这里面真正高级的逻辑，是英伟达在用最顶级的开源软件，给自己的硬件悍然带货。智能体是未来的趋势，需要极多的推理循环和算力消耗。英伟达把如此 ...

0210

皮埃尔发表于 2026-6-6 AI大模型

Anthropic又融资了650亿美元。估值已经到万亿这个级别了。

0227

纯野山参发表于 2026-5-29 AI大模型

DeepSeek这次真的杀疯了，直接把V4-Pro的API价格永久砍到了原价的四分之一，这力度大超预期，妥妥的AI圈价格屠夫！

DeepSeek这次真的杀疯了，直接把V4-Pro的API价格永久砍到了原价的四分之一，这力度大超预期，妥妥的AI圈价格屠夫！但这绝对是好事，堪称AI行业的平价革命。这种良性的价格战能把原本高不可攀的AI门槛直接打下来，逼着其他厂商跟进，让更多企业用得起顶尖模型，最终把整个行业的蛋糕越做越大。对A股市场来说，这波操作主要 ...

0204

半纸鸢发表于 2026-5-24 AI大模型

【DeepSeek V4 对比 Claude Code：速度翻倍成本骤降，开发格局变了】

【DeepSeek V4 对比 Claude Code：速度翻倍成本骤降，开发格局变了】快速阅读：开发者发现使用 DeepSeek V4 代替 Claude Code 能获得数倍的响应速度和极低的成本。尽管在复杂的多文件重构和逻辑深度上仍存在争议，但其性价比已足以改变高强度开发的成本结构。以前总觉得 Claude Code 是不可逾越的。但现在，DeepSeek ...

0223

有梦就有缘发表于 2026-5-2 AI大模型

现在看到这种图，都得谨慎点，去官网确认了下，是真的，GPT Image-2 断层领先

0255

茼花粉发表于 2026-4-22 AI大模型

Gemini 3.1 Flash TTS正式推出，谷歌最新的文本转语音模型，支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音，以及 70 种不同语言。

Gemini 3.1 Flash TTS正式推出，谷歌最新的文本转语音模型，支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音，以及 70 种不同语言。现已在 AI Studio 的全新音频 Playground 和 Gemini API 中上线！ http://t.cn/AXMrfgfq ...

0229

狂刷排名发表于 2026-4-17 AI大模型

千问上线表格Agent：对话直接生成、编辑Excel文

【千问上线表格Agent：对话直接生成、编辑Excel文】钛媒体App 4月14日消息，千问上线“表格Agent”，支持在对话中直接生成、编辑Excel文件。用户可以要求千问检索信息后生成表格，也可以将多轮对话内容整理为表格，或基于图片、文件生成。系统通常可在1–2分钟内输出可下载的Excel文件，无需二次复制粘贴，并支持通过自然 ...

0252

透明的黑色发表于 2026-4-14 AI大模型

Anthropic 最近算力成本真是顶不住了，疯狂降成本

Anthropic 最近算力成本真是顶不住了，疯狂降成本昨晚又推出了advisor tool，Sonnet 和 Haiku 这种小模型执行任务的时候，可以调用 Opus 这种大模型介入指导。有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。因为这样用户无法直接访问模型，又能提高现有模型的能力水平。既能大幅提高 Sonnet 和 Hai ...

0232

憬溺发表于 2026-4-11 AI大模型

手机离线跑大模型！谷歌Gemma 4开源杀疯了🔥

手机离线跑大模型！谷歌Gemma 4开源杀疯了🔥 AI圈又炸场！谷歌刚开源Gemma 4系列，31B版本直接登顶开源榜，小参数打赢大模型，手机端就能离线全模态运行✨ 轻量化王者，内存占用大砍，推理速度狂飙，图文理解、代码能力拉满，个人开发者与中小企业狂喜💻 不用挤云端、不用高算力，本地就能玩转强AI，彻底打破参数内 ...

0273

费尔牧笔记发表于 2026-4-9 AI大模型

✨ AI常常被视为一个“黑盒子”，但每一个智能系统背后都隐藏着一个结构精密的架构

#人工智能# ✨ AI常常被视为一个“黑盒子”，但每一个智能系统背后都隐藏着一个结构精密的架构——从原始硬件到最终应用如聊天机器人和AI助手！我整理了这个七层分解（参考上传的图片），帮你揭秘AI系统是如何构建、训练并在规模上部署的。 🟥 𝟭. 物理层（硬件与基础设施） AI执行的基础——使用GPU（如NVIDIA、AM ...

0259

林小北发表于 2026-4-9 AI大模型

不靠工具，只靠逻辑：Gemma 4 的长程推理实验

【不靠工具，只靠逻辑：Gemma 4 的长程推理实验】快速阅读：通过一个复杂的维吉尼亚密码（Vigenère cipher）测试，发现 Gemma 4 在面对高难度任务时表现出极佳的“思维弹性”：它既能在被要求时进行长达十分钟的深度推理，又具备在无法解决时主动拒绝幻觉、不编造答案的诚实度。 --- 最近在测试 Gemma 4 时，有一个很 ...

0227

客路青山发表于 2026-4-8 AI大模型

大模型的连续跟踪

大模型的连续跟踪一、Anthropic： ——Claude调整订阅政策，第三方工具调用权限被移除，用户需单独购买额度包或切换至APIKey模式（2026.04.04起） ——意外泄露原始代码，曝光了包括24小时自主代理（KAIROS）和AI电子宠物（BUDDY）在内的多项未发布功能；从泄露代码看，融合了当下业界热切讨论的PromptEngineering、Conte ...

0208

天下行发表于 2026-4-7 AI大模型

Gemma 4：是模型进阶，还是工程灾难？

【Gemma 4：是模型进阶，还是工程灾难？】快速阅读：Gemma 4 的发布正处于权重释放与底层适配脱节的阵痛期。虽然模型潜力巨大，但推理引擎在处理其特有的逻辑结构时，正面临严重的循环与崩溃问题。 --- Gemma 4 的发布像是一次未经充分驱动优化的硬件上架。权重已经推送到仓库，但底层推理引擎的指令集还没对齐。目 ...

0218

dxl0812 发表于 2026-4-7 AI大模型

把参数丢进硬盘：Gemma 4 的轻量化魔法

【把参数丢进硬盘：Gemma 4 的轻量化魔法】快速阅读：Gemma 4 E 系列模型通过 Per-Layer Embeddings 技术，将大量静态 Embedding 参数从显存移至磁盘。这种设计在不增加推理计算负担的前提下，极大地扩展了模型的知识容量。 --- Gemma 4 的 E2B 和 E4B 模型里，那个“E”指代 Embedding，与 MoE 模型里的 Experts 完全 ...

0221

简小军发表于 2026-4-7 AI大模型

规模迷信的终结：Gemma 4 31B 稠密模型对 MoE 的效率碾压

【规模迷信的终结：Gemma 4 31B 稠密模型对 MoE 的效率碾压】快速阅读：在 FoodTruck Bench 的商业模拟测试中，Gemma 4 (3/1B) 表现惊人，以仅 $0.20/run 的极低成本实现了 100% 的生存率与超高的投资回报率。它不仅在决策质量上接近 GPT-5.2，更在性价比上彻底碾压了价格高出数十倍的顶级模型。 --- 有人觉得参数量就 ...

0214

先姐发表于 2026-4-7 AI大模型

大模型的发展史，本质上是一部关于“对齐”与“解构”的博弈史。今天，Gemma 4 31B 迎来了它最彻底的一次释放。

大模型的发展史，本质上是一部关于“对齐”与“解构”的博弈史。今天，Gemma 4 31B 迎来了它最彻底的一次释放。开发者 dealignai 正式发布了 Gemma-4-31B-JANG_4M-CRACK。这不仅是一个简单的量化版本，更是一个经过深度“消融”处理、完全移除拒绝机制的本地模型巅峰之作。以下是该模型值得关注的核心要点与深度思考： ...

0251

淡泊随心发表于 2026-4-6 AI大模型

DeepSeek V4的消息出来那天，我看到有人在群里问：R1我还没学完，V4又来了，感觉永远在追。

DeepSeek V4的消息出来那天，我看到有人在群里问：R1我还没学完，V4又来了，感觉永远在追。我当时的第一反应是：你学的方向可能就错了。 DeepSeek V4预计本月发布——1万亿参数，百万Token上下文，性能据说对标GPT-5级别。消息一出，我周围就有朋友开始焦虑：要不要提前看文档？要不要研究新架构？停一下。我们真 ...

0269

无私奉献是真爱发表于 2026-4-6 AI大模型

AI大模型今日: 0|主题: 103|排名: 17

快速发帖

AI大模型 今日: 0|主题: 103|排名: 17

快速发帖

AI大模型今日: 0|主题: 103|排名: 17