订阅

AI大模型 今日: 0|主题: 101|排名: 2 

  • 隐藏置顶帖 置顶 一起港湾 (17GW.com) 论坛发帖须知
    欢迎来到 一起港湾 (17GW) 社区!这里是 AI 技术爱好者、数码极客和生活分享者的精神家园。为了维护港湾的纯净秩序与技术氛围,请在开启您的分享之旅前,仔细阅读并遵守以下发帖规范。 一、 核心发帖准则 [*]主题契合,精准归类:请确保内容与所属版块(如 AI 技术、数码维修、资源分享等)相关。标题应简明扼要,避免“ ...
    1330 teanzhong 发表于 2026-3-29 服务
  • 这个大模型能力benchmark结果各位认可否? New
    这个大模型能力benchmark结果各位认可否? #
    013 罗丽 发表于 昨天 11:00 AI大模型
  • 英伟达开源550B大模型:卖铲人最高明的阳谋 New
    【英伟达开源550B大模型:卖铲人最高明的阳谋】 英伟达刚发布了Nemotron 3 Ultra,一个550B的MoE巨无霸开源模型,专为智能体设计。很多人在惊叹它的推理速度和架构创新,但这里面真正高级的逻辑,是英伟达在用最顶级的开源软件,给自己的硬件悍然带货。 智能体是未来的趋势,需要极多的推理循环和算力消耗。英伟达把如此 ...
    039 皮埃尔 发表于 4 天前 AI大模型
  • Anthropic又融资了650亿美元。估值已经到万亿这个级别了。 ​​​
    Anthropic又融资了650亿美元。估值已经到万亿这个级别了。 ​​​
    086 纯野山参 发表于 2026-5-29 AI大模型
  • DeepSeek这次真的杀疯了,直接把V4-Pro的API价格永久砍到了原价的四分之一,这力度大超预期,妥妥的AI圈价格屠夫!
    DeepSeek这次真的杀疯了,直接把V4-Pro的API价格永久砍到了原价的四分之一,这力度大超预期,妥妥的AI圈价格屠夫!但这绝对是好事,堪称AI行业的平价革命。这种良性的价格战能把原本高不可攀的AI门槛直接打下来,逼着其他厂商跟进,让更多企业用得起顶尖模型,最终把整个行业的蛋糕越做越大。 对A股市场来说,这波操作主要 ...
    079 半纸鸢 发表于 2026-5-24 AI大模型
  • 【DeepSeek V4 对比 Claude Code:速度翻倍成本骤降,开发格局变了】
    【DeepSeek V4 对比 Claude Code:速度翻倍成本骤降,开发格局变了】 快速阅读:开发者发现使用 DeepSeek V4 代替 Claude Code 能获得数倍的响应速度和极低的成本。尽管在复杂的多文件重构和逻辑深度上仍存在争议,但其性价比已足以改变高强度开发的成本结构。 以前总觉得 Claude Code 是不可逾越的。 但现在,DeepSeek ...
    0123 有梦就有缘 发表于 2026-5-2 AI大模型
  • 现在看到这种图,都得谨慎点,去官网确认了下,是真的,GPT Image-2 断层领先 ​​​
    现在看到这种图,都得谨慎点,去官网确认了下,是真的,GPT Image-2 断层领先 ​​​
    0136 茼花粉 发表于 2026-4-22 AI大模型
  • Gemini 3.1 Flash TTS正式推出,谷歌最新的文本转语音模型,支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音,以及 70 种不同语言。
    Gemini 3.1 Flash TTS正式推出,谷歌最新的文本转语音模型,支持场景指令、说话人级别的精细控制、音频标签、更自然且更富表现力的声音,以及 70 种不同语言。 现已在 AI Studio 的全新音频 Playground 和 Gemini API 中上线! http://t.cn/AXMrfgfq ​​​ ...
    0124 狂刷排名 发表于 2026-4-17 AI大模型
  • 千问上线表格Agent:对话直接生成、编辑Excel文
    【千问上线表格Agent:对话直接生成、编辑Excel文】 钛媒体App 4月14日消息,千问上线“表格Agent”,支持在对话中直接生成、编辑Excel文件。用户可以要求千问检索信息后生成表格,也可以将多轮对话内容整理为表格,或基于图片、文件生成。系统通常可在1–2分钟内输出可下载的Excel文件,无需二次复制粘贴,并支持通过自然 ...
    0136 透明的黑色 发表于 2026-4-14 AI大模型
  • Anthropic 最近算力成本真是顶不住了,疯狂降成本
    Anthropic 最近算力成本真是顶不住了,疯狂降成本 昨晚又推出了advisor tool,Sonnet 和 Haiku 这种小模型执行任务的时候,可以调用 Opus 这种大模型介入指导。 有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。 因为这样用户无法直接访问模型,又能提高现有模型的能力水平。 既能大幅提高 Sonnet 和 Hai ...
    0128 憬溺 发表于 2026-4-11 AI大模型
  • 手机离线跑大模型!谷歌Gemma 4开源杀疯了🔥
    手机离线跑大模型!谷歌Gemma 4开源杀疯了🔥 AI圈又炸场!谷歌刚开源Gemma 4系列,31B版本直接登顶开源榜,小参数打赢大模型,手机端就能离线全模态运行✨ 轻量化王者,内存占用大砍,推理速度狂飙,图文理解、代码能力拉满,个人开发者与中小企业狂喜💻 不用挤云端、不用高算力,本地就能玩转强AI,彻底打破参数内 ...
    0151 费尔牧笔记 发表于 2026-4-9 AI大模型
  • ✨ AI常常被视为一个“黑盒子”,但每一个智能系统背后都隐藏着一个结构精密的架构
    #人工智能# ✨ AI常常被视为一个“黑盒子”,但每一个智能系统背后都隐藏着一个结构精密的架构——从原始硬件到最终应用如聊天机器人和AI助手!我整理了这个七层分解(参考上传的图片),帮你揭秘AI系统是如何构建、训练并在规模上部署的。 🟥 𝟭. 物理层(硬件与基础设施) AI执行的基础——使用GPU(如NVIDIA、AM ...
    0145 林小北 发表于 2026-4-9 AI大模型
  • 不靠工具,只靠逻辑:Gemma 4 的长程推理实验
    【不靠工具,只靠逻辑:Gemma 4 的长程推理实验】 快速阅读:通过一个复杂的维吉尼亚密码(Vigenère cipher)测试,发现 Gemma 4 在面对高难度任务时表现出极佳的“思维弹性”:它既能在被要求时进行长达十分钟的深度推理,又具备在无法解决时主动拒绝幻觉、不编造答案的诚实度。 --- 最近在测试 Gemma 4 时,有一个很 ...
    0123 客路青山 发表于 2026-4-8 AI大模型
  • 大模型的连续跟踪
    大模型的连续跟踪 一、Anthropic: ——Claude调整订阅政策,第三方工具调用权限被移除,用户需单独购买额度包或切换至APIKey模式(2026.04.04起) ——意外泄露原始代码,曝光了包括24小时自主代理(KAIROS)和AI电子宠物(BUDDY)在内的多项未发布功能;从泄露代码看,融合了当下业界热切讨论的PromptEngineering、Conte ...
    0119 天下行 发表于 2026-4-7 AI大模型
  • Gemma 4:是模型进阶,还是工程灾难?
    【Gemma 4:是模型进阶,还是工程灾难?】 快速阅读:Gemma 4 的发布正处于权重释放与底层适配脱节的阵痛期。虽然模型潜力巨大,但推理引擎在处理其特有的逻辑结构时,正面临严重的循环与崩溃问题。 --- Gemma 4 的发布像是一次未经充分驱动优化的硬件上架。权重已经推送到仓库,但底层推理引擎的指令集还没对齐。 目 ...
    0123 dxl0812 发表于 2026-4-7 AI大模型
  • 把参数丢进硬盘:Gemma 4 的轻量化魔法
    【把参数丢进硬盘:Gemma 4 的轻量化魔法】 快速阅读:Gemma 4 E 系列模型通过 Per-Layer Embeddings 技术,将大量静态 Embedding 参数从显存移至磁盘。这种设计在不增加推理计算负担的前提下,极大地扩展了模型的知识容量。 --- Gemma 4 的 E2B 和 E4B 模型里,那个“E”指代 Embedding,与 MoE 模型里的 Experts 完全 ...
    0126 简小军 发表于 2026-4-7 AI大模型
  • 规模迷信的终结:Gemma 4 31B 稠密模型对 MoE 的效率碾压
    【规模迷信的终结:Gemma 4 31B 稠密模型对 MoE 的效率碾压】 快速阅读:在 FoodTruck Bench 的商业模拟测试中,Gemma 4 (3/1B) 表现惊人,以仅 $0.20/run 的极低成本实现了 100% 的生存率与超高的投资回报率。它不仅在决策质量上接近 GPT-5.2,更在性价比上彻底碾压了价格高出数十倍的顶级模型。 --- 有人觉得参数量就 ...
    0122 先姐 发表于 2026-4-7 AI大模型
  • 大模型的发展史,本质上是一部关于“对齐”与“解构”的博弈史。今天,Gemma 4 31B 迎来了它最彻底的一次释放。
    大模型的发展史,本质上是一部关于“对齐”与“解构”的博弈史。今天,Gemma 4 31B 迎来了它最彻底的一次释放。 开发者 dealignai 正式发布了 Gemma-4-31B-JANG_4M-CRACK。这不仅是一个简单的量化版本,更是一个经过深度“消融”处理、完全移除拒绝机制的本地模型巅峰之作。 以下是该模型值得关注的核心要点与深度思考: ...
    0144 淡泊随心 发表于 2026-4-6 AI大模型
  • DeepSeek V4的消息出来那天,我看到有人在群里问:R1我还没学完,V4又来了,感觉永远在追。
    DeepSeek V4的消息出来那天,我看到有人在群里问:R1我还没学完,V4又来了,感觉永远在追。 我当时的第一反应是:你学的方向可能就错了。 DeepSeek V4预计本月发布——1万亿参数,百万Token上下文,性能据说对标GPT-5级别。 消息一出,我周围就有朋友开始焦虑:要不要提前看文档?要不要研究新架构? 停一下。 我们真 ...
    0145 无私奉献是真爱 发表于 2026-4-6 AI大模型
  • 本地大模型的“甜点位”:Gemma 4 26B 的突围
    【本地大模型的“甜点位”:Gemma 4 26B 的突围】 快速阅读:在本地大模型领域,Gemma 4 26B MoE 架构凭借极高的推理效率和“不纠结”的决策风格,成为了 64GB 内存设备上的新宠。相比于容易陷入思考死循环的 Qwen 3.5,它在执行复杂编程任务时表现得更加果断且快速。 --- 最近在讨论本地模型时,大家发现了一个很有意 ...
    0123 白云之上 发表于 2026-4-6 AI大模型
  • Andrej Karpathy分享了【如何用大模型来打造私人知识库】,这个帖子目前在X上有1037万的阅读。
    Andrej Karpathy分享了【如何用大模型来打造私人知识库】,这个帖子目前在X上有1037万的阅读。我让Gemini做了个更有人味的翻译版。 标题:用大模型打造私人知识库 最近我摸索出一套极佳的工作流:用大语言模型(LLM)针对感兴趣的研究课题,搭建个人知识库。照这套玩法,我近期消耗的海量 Token 算力,大头都不在敲代码 ...
    0135 小苹果的清甜 发表于 2026-4-5 AI大模型
  • 下一页 »

    快速发帖

    还可输入 120 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    关注公众号

    相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

    在本版发帖
    关注公众号
    返回顶部