订阅

AI大模型 今日: 0|主题: 96|排名: 19 

  • 隐藏置顶帖 置顶 一起港湾 (17GW.com) 论坛发帖须知
    欢迎来到 一起港湾 (17GW) 社区!这里是 AI 技术爱好者、数码极客和生活分享者的精神家园。为了维护港湾的纯净秩序与技术氛围,请在开启您的分享之旅前,仔细阅读并遵守以下发帖规范。 一、 核心发帖准则 [*]主题契合,精准归类:请确保内容与所属版块(如 AI 技术、数码维修、资源分享等)相关。标题应简明扼要,避免“ ...
    1178 teanzhong 发表于 2026-3-29 服务
  • 现在看到这种图,都得谨慎点,去官网确认了下,是真的,GPT Image-2 断层领先 ​​​ New
    现在看到这种图,都得谨慎点,去官网确认了下,是真的,GPT Image-2 断层领先 ​​​
    029 茼花粉 发表于 4 天前 AI大模型
  • Gemini 3.1 Flash TTS正式推出,谷歌最新的文本转语音模型,支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音,以及 70 种不同语言。
    Gemini 3.1 Flash TTS正式推出,谷歌最新的文本转语音模型,支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音,以及 70 种不同语言。 现已在 AI Studio 的全新音频 Playground 和 Gemini API 中上线! http://t.cn/AXMrfgfq ​​​ ...
    044 狂刷排名 发表于 2026-4-17 AI大模型
  • 千问上线表格Agent:对话直接生成、编辑Excel文
    【千问上线表格Agent:对话直接生成、编辑Excel文】 钛媒体App 4月14日消息,千问上线“表格Agent”,支持在对话中直接生成、编辑Excel文件。用户可以要求千问检索信息后生成表格,也可以将多轮对话内容整理为表格,或基于图片、文件生成。系统通常可在1–2分钟内输出可下载的Excel文件,无需二次复制粘贴,并支持通过自然 ...
    050 透明的黑色 发表于 2026-4-14 AI大模型
  • Anthropic 最近算力成本真是顶不住了,疯狂降成本
    Anthropic 最近算力成本真是顶不住了,疯狂降成本 昨晚又推出了advisor tool,Sonnet 和 Haiku 这种小模型执行任务的时候,可以调用 Opus 这种大模型介入指导。 有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。 因为这样用户无法直接访问模型,又能提高现有模型的能力水平。 既能大幅提高 Sonnet 和 Hai ...
    048 憬溺 发表于 2026-4-11 AI大模型
  • 手机离线跑大模型!谷歌Gemma 4开源杀疯了🔥
    手机离线跑大模型!谷歌Gemma 4开源杀疯了🔥 AI圈又炸场!谷歌刚开源Gemma 4系列,31B版本直接登顶开源榜,小参数打赢大模型,手机端就能离线全模态运行✨ 轻量化王者,内存占用大砍,推理速度狂飙,图文理解、代码能力拉满,个人开发者与中小企业狂喜💻 不用挤云端、不用高算力,本地就能玩转强AI,彻底打破参数内 ...
    064 费尔牧笔记 发表于 2026-4-9 AI大模型
  • ✨ AI常常被视为一个“黑盒子”,但每一个智能系统背后都隐藏着一个结构精密的架构
    #人工智能# ✨ AI常常被视为一个“黑盒子”,但每一个智能系统背后都隐藏着一个结构精密的架构——从原始硬件到最终应用如聊天机器人和AI助手!我整理了这个七层分解(参考上传的图片),帮你揭秘AI系统是如何构建、训练并在规模上部署的。 🟥 𝟭. 物理层(硬件与基础设施) AI执行的基础——使用GPU(如NVIDIA、AM ...
    052 林小北 发表于 2026-4-9 AI大模型
  • 不靠工具,只靠逻辑:Gemma 4 的长程推理实验
    【不靠工具,只靠逻辑:Gemma 4 的长程推理实验】 快速阅读:通过一个复杂的维吉尼亚密码(Vigenère cipher)测试,发现 Gemma 4 在面对高难度任务时表现出极佳的“思维弹性”:它既能在被要求时进行长达十分钟的深度推理,又具备在无法解决时主动拒绝幻觉、不编造答案的诚实度。 --- 最近在测试 Gemma 4 时,有一个很 ...
    045 客路青山 发表于 2026-4-8 AI大模型
  • 大模型的连续跟踪
    大模型的连续跟踪 一、Anthropic: ——Claude调整订阅政策,第三方工具调用权限被移除,用户需单独购买额度包或切换至APIKey模式(2026.04.04起) ——意外泄露原始代码,曝光了包括24小时自主代理(KAIROS)和AI电子宠物(BUDDY)在内的多项未发布功能;从泄露代码看,融合了当下业界热切讨论的PromptEngineering、Conte ...
    046 天下行 发表于 2026-4-7 AI大模型
  • Gemma 4:是模型进阶,还是工程灾难?
    【Gemma 4:是模型进阶,还是工程灾难?】 快速阅读:Gemma 4 的发布正处于权重释放与底层适配脱节的阵痛期。虽然模型潜力巨大,但推理引擎在处理其特有的逻辑结构时,正面临严重的循环与崩溃问题。 --- Gemma 4 的发布像是一次未经充分驱动优化的硬件上架。权重已经推送到仓库,但底层推理引擎的指令集还没对齐。 目 ...
    038 dxl0812 发表于 2026-4-7 AI大模型
  • 把参数丢进硬盘:Gemma 4 的轻量化魔法
    【把参数丢进硬盘:Gemma 4 的轻量化魔法】 快速阅读:Gemma 4 E 系列模型通过 Per-Layer Embeddings 技术,将大量静态 Embedding 参数从显存移至磁盘。这种设计在不增加推理计算负担的前提下,极大地扩展了模型的知识容量。 --- Gemma 4 的 E2B 和 E4B 模型里,那个“E”指代 Embedding,与 MoE 模型里的 Experts 完全 ...
    041 简小军 发表于 2026-4-7 AI大模型
  • 规模迷信的终结:Gemma 4 31B 稠密模型对 MoE 的效率碾压
    【规模迷信的终结:Gemma 4 31B 稠密模型对 MoE 的效率碾压】 快速阅读:在 FoodTruck Bench 的商业模拟测试中,Gemma 4 (3/1B) 表现惊人,以仅 $0.20/run 的极低成本实现了 100% 的生存率与超高的投资回报率。它不仅在决策质量上接近 GPT-5.2,更在性价比上彻底碾压了价格高出数十倍的顶级模型。 --- 有人觉得参数量就 ...
    042 先姐 发表于 2026-4-7 AI大模型
  • 大模型的发展史,本质上是一部关于“对齐”与“解构”的博弈史。今天,Gemma 4 31B 迎来了它最彻底的一次释放。
    大模型的发展史,本质上是一部关于“对齐”与“解构”的博弈史。今天,Gemma 4 31B 迎来了它最彻底的一次释放。 开发者 dealignai 正式发布了 Gemma-4-31B-JANG_4M-CRACK。这不仅是一个简单的量化版本,更是一个经过深度“消融”处理、完全移除拒绝机制的本地模型巅峰之作。 以下是该模型值得关注的核心要点与深度思考: ...
    051 淡泊随心 发表于 2026-4-6 AI大模型
  • DeepSeek V4的消息出来那天,我看到有人在群里问:R1我还没学完,V4又来了,感觉永远在追。
    DeepSeek V4的消息出来那天,我看到有人在群里问:R1我还没学完,V4又来了,感觉永远在追。 我当时的第一反应是:你学的方向可能就错了。 DeepSeek V4预计本月发布——1万亿参数,百万Token上下文,性能据说对标GPT-5级别。 消息一出,我周围就有朋友开始焦虑:要不要提前看文档?要不要研究新架构? 停一下。 我们真 ...
    059 无私奉献是真爱 发表于 2026-4-6 AI大模型
  • 本地大模型的“甜点位”:Gemma 4 26B 的突围
    【本地大模型的“甜点位”:Gemma 4 26B 的突围】 快速阅读:在本地大模型领域,Gemma 4 26B MoE 架构凭借极高的推理效率和“不纠结”的决策风格,成为了 64GB 内存设备上的新宠。相比于容易陷入思考死循环的 Qwen 3.5,它在执行复杂编程任务时表现得更加果断且快速。 --- 最近在讨论本地模型时,大家发现了一个很有意 ...
    041 白云之上 发表于 2026-4-6 AI大模型
  • Andrej Karpathy分享了【如何用大模型来打造私人知识库】,这个帖子目前在X上有1037万的阅读。
    Andrej Karpathy分享了【如何用大模型来打造私人知识库】,这个帖子目前在X上有1037万的阅读。我让Gemini做了个更有人味的翻译版。 标题:用大模型打造私人知识库 最近我摸索出一套极佳的工作流:用大语言模型(LLM)针对感兴趣的研究课题,搭建个人知识库。照这套玩法,我近期消耗的海量 Token 算力,大头都不在敲代码 ...
    049 小苹果的清甜 发表于 2026-4-5 AI大模型
  • TW93的新长篇教程:《你不知道的大模型训练:原理、路径与新实践》
    TW93的新长篇教程:《你不知道的大模型训练:原理、路径与新实践》 大佬的前两篇文章《你不知道的 Claude Code:架构、治理与工程实践》、《你不知道的 Agent:原理、架构与工程实践》都很受欢迎。 在线阅读:tw93.fun/2026-04-03/llm.html “在写完《你不知道的 Claude Code:架构、治理与工程实践》、《你不知道的 Agent ...
    051 basd 发表于 2026-4-4 AI大模型
  • 国产AI编程大模型跻身全球第一梯队
    【#千问3.6AI编程排名全球第二#】#国产AI编程大模型跻身全球第一梯队# 4 月 3 日,全球知名大模型盲测榜单 LMArena 旗下聚焦 AI 编程能力的 Code Arena 公布新一期排名,阿里巴巴最新一代大语言模型 Qwen 3.6-Plus 登上全球榜单第二,超越 OpenAI、Google、xAI 等国际巨头,成为该榜单上排名最高的中国大模型。 据了解 ...
    046 阿拉伯难民 发表于 2026-4-4 AI大模型
  • Qwen3.6-Plus没有开源 没发预热,直接甩干货。
    Qwen3.6-Plus没有开源 没发预热,直接甩干货。Qwen 今天正式发布了 Qwen3.6-Plus,核心目标非常明确:打造面向现实世界的Agents。 这次升级不是小打小闹,核心亮点包括: 默认支持 1M 超大上下文窗口。 代码能力大幅进化,全面拥抱 Vibe Coding。 多模态视觉感知更敏锐。 极致的生态兼容:支持 Anthropic API 协议,可直接 ...
    046 水坤 发表于 2026-4-4 AI大模型
  • 微软的AI部门刚刚发了三款自研模型(看来真的是有点不想要OpenAI了),微软的自研模型叫MAI。
    微软的AI部门刚刚发了三款自研模型(看来真的是有点不想要OpenAI了),微软的自研模型叫MAI。 第一个,MAI-Transcribe-1 (语音转文本) 这是目前微软最强的**语音识别(STT)**模型,旨在直接竞争 OpenAI 的 Whisper。 性能: 在 25 种主流语言的测试中,平均字词错误率仅 3.8%,全面超越 Whisper-large-v3。 速度: 批量 ...
    048 周小宝武汉 发表于 2026-4-3 AI大模型
  • Qwen3.6 可能会部分开源 ​​​
    Qwen3.6 可能会部分开源 ​​​
    046 科菲地板 发表于 2026-4-3 AI大模型
  • 下一页 »

    快速发帖

    还可输入 120 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    关注公众号

    相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

    在本版发帖
    关注公众号
    返回顶部