Redis作者 antirez 的一项实验,这里GPT 5.4 要优于Claude Opus 埋葬冬天的回忆 2026-04-08 09:23:26 三款开源TTS大模型横评,LongCat-AudioDiT完胜🐱 wushuhong 2026-04-07 00:51:32 AGI测试新标杆来了 尚美河南 2026-04-01 23:09:51 从国产SOTA走向世界SOTA? GLM-5.1 实测! 东方无翼 2026-03-30 22:57:03 一个有趣的评测:让大模型互相辩论,看谁能说服谁? 嘉益 2026-03-28 13:43:00 【全程无广】9款AI大模型横评!谁是生产力之王,国产大模型能上桌吃饭吗? 夕遥 2026-03-24 12:31:13 这周尝试了各种本土化的OpenClaw和AIO的SaaS工具,最后决定还是老老实实用BYOK的LLM Client作为桌面端的主力。 蒲天治 2026-03-22 16:04:31 Qwen 3.5 397B:最强本地编程模型? 春春欲动 2026-03-22 10:03:18 龙虾专用大模型? GLM-5-Turbo 实测! 落日的孤单 2026-03-17 23:03:30 OpenClaw创始人公布了一份32个模型的真实测试排名,评价维度只有三个:成功率/速度/费用,但都非常关键。 青竹居士 2026-03-13 21:18:46 Qwen3.5 系列产品在共同基准测试中的比较 从 27b 开始,Qwen 似乎真的很有用;任何比这更小的难度,效果都会明显降低。 芳悟 2026-03-10 13:26:28 Claude Opus 4.6 🆚 GPT 5.4 相同提示词下前端能力对比 可爱滴 2026-03-10 06:30:14 大家带来归一化的Qwen3.5系列模型分数汇总, 惊喜的发现是 27B dense 这个模型的确不以言, 基本达到了期间模型 Qwen3.5-397B-A17B 94% 的性能 一念法界 2026-03-09 10:21:24 给大家带来刚发布的 nano-banan-2 评测 大谢小贺 2026-03-02 17:08:54 21个主流AI工具深度评测 一点放纵 2026-02-27 16:26:14 2026年必装AI工具横向评测:15款主流产品深度对比与选型指南 喵粮多 2026-02-27 16:19:01 Midjourney v8 就要来了,但现在大家都在用 Nano Banana Pro。AI 创作博主 Nick St. Pierre (x:nickfloats) 用两张图告诉大家两 约翰克里斯朵夫 2026-02-26 15:07:47 大模型能陪你一本正经的胡说八道吗? 雷小羞 2026-02-25 13:07:57 我在X上刷到了一匹金色的骏马! 展菲 2026-02-21 21:06:34 【NullClaw 深度评测】678KB 的 AI 助手框架能做什么? 王宝柱 2026-02-20 00:10:00 发现更多