AI测评 - 一起港湾

一起港湾 - AI技术分享社区

Redis作者 antirez 的一项实验，这里GPT 5.4 要优于Claude Opus

埋葬冬天的回忆 2026-04-08 09:23:26

三款开源TTS大模型横评，LongCat-AudioDiT完胜🐱

wushuhong 2026-04-07 00:51:32

AGI测试新标杆来了

尚美河南 2026-04-01 23:09:51

从国产SOTA走向世界SOTA? GLM-5.1 实测!

东方无翼 2026-03-30 22:57:03

一个有趣的评测：让大模型互相辩论，看谁能说服谁？

嘉益 2026-03-28 13:43:00

【全程无广】9款AI大模型横评！谁是生产力之王，国产大模型能上桌吃饭吗？

夕遥 2026-03-24 12:31:13

这周尝试了各种本土化的OpenClaw和AIO的SaaS工具，最后决定还是老老实实用BYOK的LLM Client作为桌面端的主力。

蒲天治 2026-03-22 16:04:31

Qwen 3.5 397B：最强本地编程模型？

春春欲动 2026-03-22 10:03:18

龙虾专用大模型? GLM-5-Turbo 实测!

落日的孤单 2026-03-17 23:03:30

OpenClaw创始人公布了一份32个模型的真实测试排名，评价维度只有三个：成功率/速度/费用，但都非常关键。

青竹居士 2026-03-13 21:18:46

Qwen3.5 系列产品在共同基准测试中的比较从 27b 开始，Qwen 似乎真的很有用；任何比这更小的难度，效果都会明显降低。

芳悟 2026-03-10 13:26:28

Claude Opus 4.6 🆚 GPT 5.4 相同提示词下前端能力对比

可爱滴 2026-03-10 06:30:14

大家带来归一化的Qwen3.5系列模型分数汇总, 惊喜的发现是 27B dense 这个模型的确不以言, 基本达到了期间模型 Qwen3.5-397B-A17B 94% 的性能

一念法界 2026-03-09 10:21:24

给大家带来刚发布的 nano-banan-2 评测

大谢小贺 2026-03-02 17:08:54

21个主流AI工具深度评测

一点放纵 2026-02-27 16:26:14

2026年必装AI工具横向评测：15款主流产品深度对比与选型指南

喵粮多 2026-02-27 16:19:01

Midjourney v8 就要来了，但现在大家都在用 Nano Banana Pro。AI 创作博主 Nick St. Pierre (x:nickfloats) 用两张图告诉大家两

约翰克里斯朵夫 2026-02-26 15:07:47

大模型能陪你一本正经的胡说八道吗?

雷小羞 2026-02-25 13:07:57

我在X上刷到了一匹金色的骏马！

展菲 2026-02-21 21:06:34

【NullClaw 深度评测】678KB 的 AI 助手框架能做什么？

王宝柱 2026-02-20 00:10:00