简评谷歌生成音乐模型Lyria 3:不论中英文、模型还是交互,都远不如Suno
简评谷歌生成音乐模型Lyria 3:不论中英文、模型还是交互,都远不如Suno,就算只是2024年3月的Suno V3(现在V5了),http://t.cn/AXtmUDAZ 是24年suno v3生成的。
Gemini上可以玩Lyria 3,速度很快,一般几秒就生成好三十秒视频(一张静态图片,最后加固定的Gemini动图)。
两者都能一句话生成音乐,但不推荐。Lyria 3的 ...
【礼崩乐好 视频版 Vol.25】 超长拷问!
【礼崩乐好 视频版 Vol.25】
超长拷问!AI音乐盲听辨假+逆向改编挑战,现在Suno的水平到底有多离谱?
今天就是一个「人机对决」…
本期视频包含两个疯狂的实验:
Part 1:音乐图灵测试 🧠 10 首歌盲听 赌上尊严鉴AI,猜错就要啃柠檬!
Part 2 :AI暴力重构 🛠️ 三首不同世代/风格女歌手作品爆改,差点让我怀疑人生!
A ...
这次 Suno 推出 Mashup 功能,像打开一扇未命名的音轨之门——规则尚在生长,可能性却已漫溢。
这次 Suno 推出 Mashup 功能,像打开一扇未命名的音轨之门——规则尚在生长,可能性却已漫溢。我用自己写的歌试了试,声线自然、律动贴合,仿佛AI读懂了旋律背后的呼吸节奏。手头还攒着十几首未发布的原创,每一首都可能孵化出截然不同的Mashup生命体。更惊喜的是,虚拟歌手的表现力竟如此鲜活……光是想到这点,指尖就忍不 ...
2026年,我只干一件事:用好AI。 别再纠结哪个AI最强了。
2026年,我只干一件事:用好AI。
别再纠结哪个AI最强了。
真正厉害的人,是让四个AI同时为自己打工。
我的方法很简单:
先问ChatGPT,拿到底层逻辑。
再丢给Gemini,补盲区、加案例。
交给Claude,重构成体系。
最后给Grok挑刺,找漏洞、去水分。
一个问题,四个视角。
交叉验证,反复迭代。
信息密度直接翻倍。
AI时代最大 ...
自强者他助: 还是要深耕原创,自我发展。
自强者他助:
还是要深耕原创,自我发展。chatGPT刚出来的时候,我还没有玩明白,中国IP就让给封禁了,那次是openAI主动封的。
兜兜转转找了很多途径,用了一些镜像,仍不理想,后来也就不了了之。如今风水轮流转,核心还是自强不息。也该国外想办法找国内手机号了。
还有就是,技术更新太快了。有时候不必太快去抢体验, ...
就像会不会使用智能手机是上一代人是否被时代淘汰的标志一样,能否辨认ai生成的内容是这一代人是否被时代淘汰的标志。
就像会不会使用智能手机是上一代人是否被时代淘汰的标志一样,能否辨认ai生成的内容是这一代人是否被时代淘汰的标志。刚才我转发的那个博主发的影评,满屏“不是而是”“从根上稳”“立得住”,这么明显的gpt5.2口癖甚至完全没有润色过。我甚至很少用gpt的都用gemini 3.5pro…但是互联网分不清这种泔水文字的傻逼咋这么多啊 ...
在 Obsidian 笔记仓库里使用 Open Code
在 Obsidian 笔记仓库里使用 Open Code:
背景是 GLM Plan 被闲置,给它找点活干 [卡皮巴拉]
让它分析我的笔记,总结我对 AI 人工智能的观点,总结如下:
你的核心思想是:AI 不是要取代人类,而是通过深度对齐和协作,成为人类的扩展和伙伴。
你对 AI 的看法具有以下特点:
1. 理性开放:既不神化也不贬低 AI
2. 深入 ...
一张照片暴露地址?AI工具GeoSpy仅需2秒即可精准定位
【一张照片暴露地址?AI工具GeoSpy仅需2秒即可精准定位】
近期,一款名为GeoSpy的AI图像分析工具在网络安全与OSINT(开源情报)社区引发了广泛关注。与以往依赖照片元数据(EXIF/GPS)的定位方式不同,该工具展示了AI在视觉环境推理方面的强大能力
GeoSpy不需要照片中包含任何GPS位置信息,它通过计算机视觉技术,分析 ...
AI圈卷疯了! 1块钱做出4个游戏
AI圈卷疯了!
1块钱做出4个游戏,实测阿里百万Token8毛的新王炸千问3.5!
## http://t.cn/AXtYbc2z
2026 年是 IT 新人最难找工作的一年吧。。。
2026 年是 IT 新人最难找工作的一年吧。。。
但是,我最近看了好几个 demo ,都是 1,2个人的团队在几个月内做的。而且都不需要融资。
而且人少了,好像这些产品都变得简单,清晰和好用了。。。
2026 年可能是过去 30 年间创业最容易的一年。
当做个用 3D 打印,vibe coding 做个全新的软硬件像弄杯咖啡那么容易,那么 ...
在ChatGPT 的指导下,花了将近10个小时配置我的本地OpenClaw+云端模型
在ChatGPT 的指导下,花了将近10个小时配置我的本地OpenClaw+云端模型,经历了: 装不了homebre - 装不了node.js -反反复复卸了重装 - gateway跑不起来 - 认证通不过 - 模型读不出 - 好不容易读出来了又受VPN 影响端口对不上 - 对上了之后又没额度被迫换模型
中间无数次想放弃直接一键部署云端吧都坚持了下来,终于,我拥 ...
OpenClaw从入门到省钱,自己撰写的三连发
OpenClaw从入门到省钱,自己撰写的三连发
OpenClaw(龙虾)新手入门纯干货
http://t.cn/AXtQoxsl
给你的龙虾安上千里眼和顺风耳
http://t.cn/AXtQoxsW
给你的龙虾装上省钱引擎,Token消耗降低80%!
http://t.cn/AXtQoxsj
AI都玩腻了,我觉得最值得下载的就是Openclaw
AI都玩腻了,我觉得最值得下载的就是Openclaw,很多人不是说安装n8n,使用vibe code很难吗,其实就真的跟Openclaw说一句话,从安装到实操,都完成了,根本不需要学怎么使用n8n,我的工作流都是丢给manus一键做出来,复制到n8n上操作就可以了。
需要学的就是,怎么替换和修改,怎么运用到工作上,怎么把它做成一个又一个的 ...
深度陪伴型 AI Mori 开始公测啦!
深度陪伴型 AI Mori 开始公测啦!目前暂时还没上架 App Store,大家直接用手机浏览器打开就能体验我们的Web APP。请移步我们的小红书了解如何加上 Mori 这个新朋友。P.S. 特意赶在春节这个节点上线,是因为有朋友反馈,这两天过年回家感受到的焦虑,被 Mori 很好地接住了。🫴🫴🫴 希望它也能陪大家度过一个舒服自在的假期。 ...
AI各有所长,赶紧收藏
AI各有所长,赶紧收藏:
1。 豆包:查资料、聊天、写文章、翻译等。
2。 Kimi:处理长文章,能看懂也能写!
3。 海豚配音:有300+种适合自媒体的声音。
4。 FishAudio:快速复制声音,操作简单。
5。 iSlide:一句话就能做出PPT。
6。 可灵:能把文字和图片变成视频。
7。 即梦:只要简单描述,就能生成图片。
8。 有言: ...
新人帖
分享一个 AI coding 的实践,强烈建议养成习惯
分享一个 AI coding 的实践,强烈建议养成习惯:
每次做重大功能或结构改动前,先写 design doc。
流程可以很简单:
1. 用 plan mode 先做 research
2. 输出一份结构化 design doc
3. 基于 doc 再拆实现 plan
4. 实现
5. 把 doc 编号存档,commit 进仓库
核心不在“文档好不好看”,而在两件事。
第一,把思考外化 ...
AI落后的法国,却造出了最会“撩”的机器人
AI落后的法国,却造出了最会“撩”的机器人 ## http://t.cn/AX5B8zEh
📢 你可以来Kimi使用OpenClaw了,全新云端部署或关联设置好的OpenClaw都可以。Kimi Claw 传送门:kimi.com/bot
📢 你可以来Kimi使用OpenClaw了,全新云端部署或关联设置好的OpenClaw都可以。Kimi Claw 传送门:kimi.com/bot
(注:功能正处于早期实验阶段,目前首批开放给参与了 Allegretto 及以上会员计划的用户先行体验以收集反馈,加速迭代) http://t.cn/AXtYU1Ap
...
“我真的被谷歌新推出的 Gemini 3 Deep Think 模型里那只骑自行车的鹈鹕的 SVG 图形深深打动了。”
“我真的被谷歌新推出的 Gemini 3 Deep Think 模型里那只骑自行车的鹈鹕的 SVG 图形深深打动了。” — Simon Willison
很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑 github.com/BIT-DataLab/Edit-Banana
很有意思也很实用的项目Edit Banana -- 让不可编辑的内容也能编辑
github.com/BIT-DataLab/Edit-Banana
上传一张图表的图片或pdf文件(自然是不可编辑的,除非p图),该项目可以将其转换为一张可编辑的DrawIO(XML)或svg或PPT文件。
原理大概是先用 SAM 3分割图片,然后做OCR。由多模态 LLM 指导的提取过程。
#
...