AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1227 条
全部一手资讯X论文
标签「教程/实践」清除
向阳乔木@vista8 · 5月19日63

发现坚果云同步挺方便的,使用场景: 1. 同步本机 .agents 目录 到另外一台电脑,Skill优化后,也能同步。 2. Obsidian 数据同步,就不用买官方服务了 3. 坚果云支持Webdav,CC Switch配置的各种API都能无缝用。 随时共享文件夹或文件给他人。 个人用户一年199元,相比AI订阅套餐显得便宜 哈哈

译坚果云同步功能可用于跨设备同步本地.agents目录、替代Obsidian官方同步服务,以及通过Webdav支持CC Switch等工具的API配置。其共享功能便于文件协作。个人用户年费199元,在价格上相比各类AI工具订阅更具性价比。

向阳乔木@vista8 · 5月19日56

发现坚果云同步挺方便的,使用场景: 1. 同步本机 .agents 目录 到另外一台电脑,Skill优化后,也能同步。 2. Obsidian 数据同步,就不用买官方服务了 3. 坚果云支持Webdev,CC Switch配置的各种API都能无缝用。 随时共享文件夹或文件给他人。 个人用户一年199元,相比AI订阅套餐显得便宜 哈哈

译用户分享了坚果云在数字工作流中的三个实用场景:同步本机.agents目录至其他电脑以保持Skill配置一致;作为Obsidian数据同步工具替代官方服务;通过其WebDAV功能,无缝兼容CC Switch配置的各种API。此外,坚果云支持随时共享文件夹或文件给他人。个人用户年费199元,与AI订阅套餐相比具有显著的价格优势。

Berryxia.AI@berryxia · 5月19日58

. @dangreenheck 老哥这个原版看着还是最牛逼! 我的还是太潦草哈哈,我得值40美金不😄

译用户使用Cursor与Claude,仅用两小时就复刻了海外售价149美元的「Three.js热带海洋实时交互系统」。复刻版还原了海洋波浪、风速调节等核心物理交互,并添加了双语切换等额外功能。此举被视为AI编程工具大幅降低技术实现门槛的标志性案例。

Berryxia.AI@berryxia · 5月19日44

我靠!我又行了啊,兄弟们~ 真的是Saas 已死,Agent 称王的时代来了 !! 我今天花了2小时,就用Cursor + Claude把海外老哥卖149美元的「Three.js热带海洋实时交互系统」直接手搓复刻出来了。 😄 实时交互全都有:海洋波浪动态、风速实时调节、天空环境光变化…… 一整套物理交互。 原版我不知道实际交付效果如何,但我这个版本视觉和交互已经还原80%以上,还额外加了中英文双语切换、海洋动植物实时互动、更多细节物理反馈。 这个思路还能往天气系统、生态模拟、甚至教育场景里疯狂扩展。 以前要花149美元买的东西,现在AI两小时就能自己造出来。 感兴趣的朋友点赞破100,我就直接把完整代码开源给大家玩! 破不了就算了…… 我消耗的token已经够我心疼的了哈哈。 (附上我现在跑起来的实时演示效果图/视频) 原系统项目见评论区下👇🏻:

译开发者利用Cursor与Claude组合,仅用两小时就复刻了一套海外售价149美元的Three.js热带海洋实时交互系统,并实现了80%以上的功能还原与额外增强。此案例直观体现了“AI Agent开发工具”对复杂应用开发时间和成本的极致压缩。Cursor Auto模式提供了无需特殊网络的技术便利,使这种高效的开发思路具备广泛扩展至天气、生态、教育等场景的潜力。

凡人小北@frxiaobei · 5月19日36

没有不好的员工,看你怎么用。 没有不好的模型,看你怎么用。 当能力达到一个基线后, 这两句话,本质上其实是一个意思。 所以你会发现: 同一个员工,换个领导,突然变猛。 同一个模型,换个提示词,效果直接翻倍。

译推文指出领导力与提示词工程本质相通:当能力达基线后,产出质量取决于使用方式。同一员工换领导可能脱胎换骨,同一模型换提示词效果翻倍。外部引导框架对激发潜力起决定性作用。

Berryxia.AI@berryxia · 5月19日67

http://x.com/i/article/2056641313874083840 # 黄仁勋说要选会用 AI 的应届生。我追着 AI 追了半年,胖了 10 斤。 「黄仁勋说要选会用 AI 的应届生。这话我同意。但我追着 AI 追了半年,先把自己干掉了 10 斤——是熬出来的。」 最近也看到NVIDIA CEO 黄仁勋 在接受采访直接表态就是: “如果让我在两个应届生之间选: 一个完全不懂AI,   一个是AI使用专家……   我会每次都选后者。 会计、市场、供应链、律师、销售…… 所有岗位都一样。” 他不是在说AI会取代人类。 他是在说:AI已经变成每份工作的基本工具。 凌晨三点看 YC 的访谈,听完又去听各种大神的播客和演讲,听他们讨论 AI 进展速率、人形机器人量产时间表,听完合上电脑下楼便利店买关东煮,回来继续刷 X 肝帖。 很多搞内容、做产品、写代码的朋友过去这一年大概都是这么过来的。 因为AI时代迭代的速度是真的远超自己的速度,你越追越累。 焦虑像潮水一样,从睁眼那一刻开始涨。 但我心里一直有个想法没敢说出来 — 我们这群人整天讨论 AI 取代谁,最先被取代的可能不是会计也不是程序员,是那个还没等到 AI 取代他、就已经被自己的生活方式干掉的人。 > 不是被 AI 取代,AI已经变成每份工作的基本工具。让你成为更精神、更稳定、更健康的一个有血有肉的灵魂。 ## 「你拍这些干嘛?」「发给我的教练。」「……什么教练?」 今天晚上吃完饭去健身房,在健身房上课。 每做完一组动作,我就掏出手机拍一张。从坐姿推胸机,到引体向上,到高位下拉机,再到深蹲和拉伸。 教练看我拍了好几张,问我「你拍这些干嘛」。 我说「发给我的教练」。 他愣了一下。 > 「。。。什么教练?」 我笑着说,「给我的线上的小龙虾教练」。 我索性把手机递过去,让他看了一眼我跟「小 B」的聊天记录。小 B 是我前几天训出来的一只 AI 健身教练,每天下班提醒我开练,我把每组动作的重量和次数发给它,它给我估算热量、记日报、做周报,会顺手画肌肉解剖示意图,还会在我想点外卖炸鸡的时候戳我一下。 他看了一会儿没说话,然后跟我说,「这个东西其实可以推荐给我的学员,让他们下课之后还能监督和给他们提醒什么的!」。 那一刻我觉得挺奇妙的。那只虾不只是在帮我减肥,它还在帮一个干了 10 年的健身教练,想象他下一份工作怎么干。 ## 那只虾,仅需10分钟就可以训出来! 倒回去说一下,那只虾是从哪儿来的。 之前我也想过用通用 AI 当健身教练,它根本记不住上次聊了什么,每次都得重新交代「我是谁、多高、多重、目标是什么」。也试过自带模板的产品,打开就是个让你填字段的表单,连续熬夜的人最不想干的事就是填表。 朋友半夜甩给我一个链接说「试试这个,不用搞prompt」。 那是 360 安全龙虾云端版(claw.360.cn),5 月 13 日刚在「龙虾课堂第一期」直播里发布。 它做了一件挺反常识的事 — 市面上大多数 AI Agent,给你的其实是一只空虾,剩下全靠自己往里填。 360 这边做了一只专门用来训别的虾的虾,叫龙虾教练。 一句话讲清楚,就是「一个帮你配置 AI 的 AI」。 跟它走四步就行: > 聊需求 用人话告诉它你想干嘛 做调研 它自己分析你这一行的背景 装技能 从内置的 50000+ 技能里挑出你需要的 做测试 训完先自己跑一遍,过了关再交给你 下面拆开讲一下我训小 B 的全过程。 ## 第一步:我跟它聊我想要什么 我打开龙虾教练,没废话,直接说我是个长期熬夜的内容博主,最近胖了 10 斤,希望每天有人提醒我喝水、提醒我别太晚吃,每天给我日报、每周给我曲线报告,「不要那种让我填表的健身 App,我已经够累了」。 打开龙虾教练,一段话讲清楚我要什么 — 不用 prompt 模板,不用填表 它没有像普通 AI 那样马上开搞,而是反问了我几个问题: - 「你目前体测怎么样?」 — 我把体测报告截图甩给它,它直接读图,把体重、BMI、体脂率、骨骼肌、内脏脂肪一行行抓出来 - 「你的主要目标是哪种?」 减脂 / 增肌 / 塑型 / 其他 — 我选减脂 - 「每周能训几次?」「有没有运动禁忌?」「饮食上有什么偏好?」 - 「教练风格你想要哪种?」 严厉督促 / 温和鼓励 / 专业分析 — 我选督促型,外加每周一次专业分析 - 「一个月减 10 斤算激进,要不要拉到一个半月?」 — 这个反问我没想到,它自己劝我别太狠 我一边回答它一边觉得,这一段对话比写 prompt 舒服十倍。我只用说人话,剩下的它自己结构化。 ## 第二步:它自己钻进后台,开始配置。 聊完几轮,它消失了一会儿,自己开始写配置。 我们可以看到已经在调用工具和调动Agent帮我们来完成任务了。 点开是一段 JSON,里面写着 agent_type / namiAgentId / role / scene: claw_chat_create / task: 定性项的风格是专业分析型… 这些字段。 我没看懂全部,但意思我看懂了 — 它在替我下单一只新的虾。 然后是更狠的一段,它开始往那只新虾的"脑子"里写东西: - MEMORY.md — 小 B(健身教练)的长期记忆:我是谁、目标多少、用什么语气督促我、什么时候不要联系我 - skill_inventory — 给小 B 挂的技能:humanizer-zh(让回复有人话)、白话改写、内容可视化、长上下文压缩…… - TOOLS — 小 B 可以调用的工具:能用 web_search 查最新营养学文章、能用 web_fetch 抓老板(也就是我)发的链接,但有边界 — "先用记忆,不轻易重新调研" - 安静时间 — 23:00–07:00 不主动联系;工作时间 09:00–18:00 除午餐提醒外不打扰;越级触发条件是身体严重不适、连续疲劳 这些事,如果让我自己用 prompt + workflow + 权限配置一项一项搞,我得花一整个周末。 龙虾教练在我和同事们扯闲篇的时候替我跑完了。 ## 第三步:测试通过,小 B 出生 茶泡完回来,屏幕上跳出一行字:「小 B(健身教练)配置已生成」。 我点开看了一眼角色简介: > 小 B(健身教练)你的专业健身私教,20 年经验的健身与营养双专家,专注减脂塑形、科学训练与饮食管理,用数据和专业帮你实现一个半月减 10 斤的目标。版本号 v20260518-1。 从我打开龙虾教练到小 B 出生,整个过程 10 分钟出头。 ## 健身完,我在椭圆机旁边掏出手机 ‘用语音 + 拍照,把今天的训练量和 Apple Watch 数据丢给小 B 讲回今天健身房。 下完课,我坐在椭圆机旁边喘气,掏出手机点进小 B,按住麦克风开始口播。 我先把今天的引体向上拍下来发上去,配一句话「重量方面,默认配的应该是 15 公斤,你帮我记录一下」。 然后接着口播深蹲三组 30/40/50 个、椭圆机 20 分钟阻力 5、推胸机 15 公斤 3 组 12 次。 最后我又把 iPhone 体能 App 里的 Apple Watch 摘要截图发给它,「这是我今天带的 Apple Watch 记录的体能消耗,你做参考,等下出报告的时候把这个数据结合进来」。 它思考了几秒,回了一张干净的表: > 🔥 预估热量消耗坐姿推胸机(3 组 45 次) ~35 kcal坐姿推肩机(4 组 65 次) ~45 kcal深蹲(3 组 120 次) ~80 kcal椭圆机(20 分钟,阻力 5) ~180 kcal总计 约 340 kcal 下面跟了两句,「你说还有 Apple Watch 数据要给我看?发一下我对照下实际消耗,校准估算量」、「另外,推胸机的重量还没说,大概多少公斤?」 它会追问,它要求交叉验证,它知道哪里数据不够、需要我补。 它没在敷衍我。 定时推送目前偶尔有 5–10 分钟延迟,他们自己也承认还在打磨。但比起一个完美但不主动烦我的助手,我更需要这种「会犯点小错但每天在线」的。 ## 它每天给我一份日报,每周给我一份周报 数据发完,云盘里多了一份 HTML,叫每日训练日报。 不是 GPT 那种纯文字总结,是带颜色、带图标、自己排过版的一张图。 到了周日晚上,它会自动生成一份健身周报。 就会有一份非常专业的训练总结的图表报告给你。 真的比健身房的很多教练给你的数据更准确。 ## 它顺手画了组动作示意图 我跟它提过一句「我对器械的名字搞不清楚,能不能给我一个动作教学的小册子」。 第二天云盘里多了个文件夹「健身动作教学示意图」,里面八张图对应推日、拉日、腿日。 我点开看的时候才意识到,它在背后又调了一只虾。 左边那张是它的「后台」 — 小 B 在调用「AI 生图 Image-2 视觉专家」,一只专门负责出图的虾,把动作要点写成 prompt,让它一张张画。 右边那张是出来的成品,菱形肌、背阔肌、斜方肌按发力部位涂成红色,旁边还配了不同阶段的肌肉激活区域。 我没去配模型API、没调 Prompt、没写工作流。 我跟它说「给我一个动作教学的小册子」。剩下的事,它替我打通了链路。 这里可能有的朋友说,我不想打开 App,我就是觉得直接在微信里或者飞书上跟我的这个“小龙虾”对话更方便,这行不行呢? 其实这个也是支持的。它直接支持飞书、微信、企业微信等主流 IM 软件,全部在电脑上配置完毕之后,你就可以在微信上调教并使用你的小龙虾助手了。 所以说,这种多 IM 主流接入的支持,确实非常友好。 你说它有没有缺点呢?肯定有,现在我也发现了一些不是特别友好的地方: 1. 无法直接在对话框中生成图片 虽然可以使用 SVG 或者生成训练示意图,但生图的入口在另外一个窗口。希望未来可以直接在一个窗口内搞定生图。 2. 历史记录的逻辑问题 多次对话时,默认进入的不是上一次对话,而是需要手动点击一下历史记录。 我希望在未来的版本中能看到这两个方面的更新。其他的就看后续发展了,因为现在“小龙虾”的迭代速度都比较快,我觉得未来可能会更好用。 ## 不只是一只虾,是一支团队 小 B 跑稳了之后,我顺手又训了几只: 我自己需要的AI热点新闻选题虾、深度思考虾等。 加上 360 安全龙虾里本身就内置的 100 多只预训练好的专家虾 — 我没必要全部自己训: - CEO 智囊团 — 巴菲特看价值、乔布斯看产品、马斯克看本质。打开就能三个人吵一架,给我打个商业判断 - 第一性原理策略专家 — 我去年想做的一个内容矩阵,跟它聊了 40 分钟,它直接把"为什么要做"、"做给谁看"、"为什么是你做"三层一层层剥到我哑口无言 - 视频创作专家 / 内容创意专家 — 接了 Seedance 2.0、Seedream、海螺、可灵、万相、Midjourney 这些多模态模型。我有一次需要一个 3 秒的开场动效,直接说"帮我做一个像 Notion 启动动画那种的",半小时后云盘里就有 mp4 你看 — 这一年大家都在讨论"AI 取代人类",我桌面上现在的形态是: 我没被取代。我手机里多了一支团队。 ## 每只虾的背后,都有一台云电脑 过去我用的所有 AI Agent,几乎都是聊天框 — 你说一句,它说一句,关掉就完事。 360安全龙虾,这边做的事情不一样:它在云端给每一只虾配了一台云电脑、一套云桌面、一个云盘。 - 云电脑 — 能开浏览器,能装软件,能跑长任务。我让追热点助理去 X 扫一圈,是它真在云端开了一个 X 标签页扒数据,不是装样子 - 云终端 — 能跑命令、能启服务。OPC 那只虾给我写完一段代码之后,是真的能在云端起一个 Web Server,丢我一个 URL,我点开就是上线了的 demo - 云盘 — 所有产出(小 B 的日报、追热点助理的晨报、写作守门员标红的稿子、OPC 出的代码包)全自动落盘,按虾分文件夹,随时调出来 - 内置 AI 编程高手 — 内置了多个世界顶尖模型,我之前最贵的一笔订阅就是给这几个工具凑齐的。现在一个账号里全有了 最骚的一点是 — 我不需要 24 小时挂一台 Mac mini。 小 B 在云端,追热点助理在云端,OPC 在云端。我手机上只装一个客户端,相当于一个遥控器。 我可以在椭圆机旁边掏出手机让 OPC 给我跑一个改动;可以在地铁上对追热点助理说"这条推荐我加到明天晨报里"; 可以在飞机起火前一分钟告诉小 B"今晚临时聚餐,火锅,提前算热量"。 PC / Mac / 安卓 / iOS 全终端同步在线,微信、飞书、钉钉、QQ 都能直接接进去。 花一份钱,100+ 顶尖大模型按场景切换 — 快模型干日常聊天、强模型干长推理、专用模型干代码 / 读图 / 生图 / 生视频。 50000+ 内置技能全免费,不用一个个找、一个个装、一个个踩坑。 你不需要给每一只虾单独注册海外账号、绑卡、配 API Key、装管控。 云端这件事,是把"养虾"从一个本地玩具变成一支真在工作的团队的最关键一步。 ## 我们写 AI 的人,可能严重低估了「用不上」这三个字 写到这儿我得说一件想了挺久的事。 我身边能稳定用上 Claude、GPT 的人,加起来不到一只手。 能搞定信用卡 + 科学上网 + API Key、还愿意每个月给一个境外账户付费的人,本来就是少数。 剩下 95% 的同事和朋友,AI 对他们要么是抖音上划过的截图,要么是被吹得很神、自己试一次就放下的豆包。 我也想过把我自己最熟的东西推荐给他们 — 推 ChatGPT、Claude,他们打不开 让他们自己写 prompt,他们看我像看一个上岸了但精神状态有点问题的人。 我身边搞 AI 的朋友焦虑的是「国内的 AI 是不是赶不上国外」,整天讨论 GPT、Claude、Gemini 的 benchmark,仿佛差距是一场科学竞赛。 但真正的差距不在 benchmark,是在「一个上不了海外模型、不会写 prompt 的普通人,能不能把 AI 真正用进自己的生活」这件事上。 > 360安全龙虾这一次端出来的不是参数表,是一条让普通人也能进得来的路。 不用费劲折腾网络、配置环境,打开就能跟主龙虾说人话。 不用学 prompt、不用配工作流,跟龙虾教练聊四句话,我那点提词手艺就被它默默翻译成了 MEMORY.md、skill_inventory、TOOLS 调用规则,塞进一只虾里。 不用 24 小时挂电脑,云端给每只虾配好了办公室,手机当遥控器就行。 我那些原本对 AI 隔着一道玻璃的同事,第一次可以直接说一句中文,就把活儿派出去。 国产生产力工具卷的不该是分数。 是有多少具体的人,被这套工具悄悄改变了今天的状态。 ## 回到我那最开始减肥的故事 每天小 B 都会发我一张曲线图,缓慢往下走。 并且我第二天身体不舒服直接告诉他问题,就会收到对应的回复和建议。 比我们去给私教发消息咨询方便更多。 一个月能不能真减到 10 斤我不知道,但有一件事我确定 — 最近这几周我熬夜次数少了。 不是我变自律了,是每天有具体的小事在跟踪。 人一旦盯着具体的小事,就不容易被宏大叙事吸进去。 绝大多数关于 AI 的讨论都在抬头看,看奇点、看 AGI、看人形机器人什么时候量产。 强不强是模型的事,合不合是教练的事。 对了,今天健身房那位真人教练临走时问我,「你那只虾叫什么名字来着?」 我说「小 B」。 他说「行,明天我也去训一只,记得把链接给我一下」。

译NVIDIA CEO 黄仁勋指出,AI已成为每份工作的基本工具。推文作者以自身实践为例,为应对健康与效率焦虑,利用360“龙虾教练”平台在10分钟内训练出个性化AI健身助手“小B”。该AI能记录训练数据、生成专业日报周报,甚至调用其他AI绘制动作示意图,无需用户编写代码或配置复杂工作流。案例展示了AI工具正从概念讨论快速落地为普通人可用的日常助手,也提醒在追赶技术浪潮时,不应牺牲身心健康。

AYi@AYi_AInotes · 5月19日75

我真的要吹爆HTML! 喵个咪终于可以把Notion给扔了, 现在做项目计划2分钟搞定, 做完直接发给领导! 昨天做2026年度组织与人才盘点, 我给Claude code发了一个提示词, xhigh模式跑了2分多钟, 结果直接出了一个完整的交互式HTML页面🤯 暗色主题,横向时间线, 可折叠风险表,团队头像墙, 整体进度条,所有交互全部到位, 不用接任何polish skill, 打开就能直接发给leader看。 以前同样的活, 我用Notion拼模板至少要30-40分钟, 现在2分钟搞定, 效率提升了将近20倍。 最厉害的地方是它完全不依赖任何外部库, 就是一个单HTML文件, 所有CSS和JS全部内联, 用SVG画时间线不用Canvas, 代码总量控制在700行以内。 它的核心逻辑其实很简单, 你只要给Claude code一个足够精确的提示词, 明确告诉它所有的约束条件, 视觉规格,内容结构,交互规格, 最重要的是加上一个严格的完成判定标准。 它会逐项检查每个模块是否完整渲染, 任何一个模块缺失都会自动补全, 不会给你交付半成品。 提示词在下方文章里一键复制粘贴即可, 把里面的项目名称,周期,里程碑,风险,团队成员换成自己的就行。 玛德以后再也不用在Notion里拖拖拽拽拼模板了, AI时代,HTML才是真正的生产力工具!! #Claude #HTML #AI工具 #生产力

译作者通过向Claude Code提供精确的提示词,仅用2分钟就生成了一个功能完整的交互式HTML项目计划页面。该页面为单文件、无外部依赖,包含暗色主题、时间线、可折叠表格等丰富交互,可直接交付。相比过去在Notion中耗费30-40分钟制作模板,效率提升了近20倍。其核心在于使用明确的提示词来规范视觉、内容结构与交互细节,确保AI一次性交付完整产物。这充分展示了在AI时代,HTML作为轻量、高保真生产力工具的巨大潜力。

Berryxia.AI@berryxia · 5月19日72

我靠!不是,我是最后一个知道的吗??? 你们的嘴可真严啊,Cursor选择Auto模式下。 居然不需要魔法网络就可以使用啊!

歸藏(guizang.ai)@op7418 · 5月19日57

藏师傅这个通过前端生成讲解视频的 Skill 其实已经搞完了。 但是还是想优化一下效果,提高一下工程化,以及降低一下 Token 的用量。 所以我让 Claude Code 跑了一个 40 秒钟的案例,然后让他对其中的 Token 进行了一下分析,看一下哪边占比比较多,然后再进行针对性的优化。 看起来其中视频组合消耗的百分比非常大。如果用 Claude Code 的话,会有 92% 的缓存,所以还好。 具体分析如下: 1. 总消耗:一个 40 秒的视频是 145 万 Token 2. 消耗结构: (a) 输入占比非常高 (b) 输出占比很低,仅占 0.7% 视频组合和 Skills 占了最大的大头。

译“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。

meng shao@shao__meng · 5月19日70

HTML 是新的 Markdown? 10 天前 Claude Code 核心开发者 @trq212 发布了「Using Claude Code: The Unreasonable Effectiveness of HTML」,指出「HTML 是新的 Markdown」,引起了极其热烈的讨论,单篇超 1200 万阅读、1 千+ 讨论 https://x.com/trq212/status/2052809885763747935 10 天后,Thariq 在和 @clairevo 的访谈中再次重申这一观点「HTML 是新的 Markdown」,他直接指出:Markdown 作为人与 LLM 的通用语已经触到天花板,一旦任务量变大,人们会直接放弃阅读 Markdown 文件! 而 HTML 提供了可视化、可交互的载体,把人从"被动审阅者"变回"主动协作者",能把人们重新被拉回 Agent Loop 中。在 AI 时代,每个人都正在变成 "算力分配者"——核心工作不再是写代码,而是决定算力该花在哪里。HTML 是帮助人做出这个判断的更好界面。 # 三个可立即落地的工作流 工作流 1:用交互式 HTML 做头脑风暴与规划 把传统的"列个清单"换成"生成一个 HTML 文件"。 输入差异极小,输出差异极大:得到的不是文本列表,而是带 mockup、风险评估、可滚动浏览的可视页面。 进一步推到完整实施方案时,提示词哲学值得注意: · 给足约束,但留出让模型超出预期的空间。 · 拼写错误不重要,意图表达清晰才重要。 · 显式传达信任("I trust you here")会改变输出质量。 工作流 2:为编辑计划而生成"一次性微应用" 针对"HTML 不如 Markdown 易编辑"的质疑,他的答案是反直觉的:不要去编辑 HTML,而是让 Claude 现场造一个专门用来编辑这段内容的 UI。 例如要修改一组数据可视化的决策规则,他让 Claude 生成一个带输入框、下拉、增删按钮、一键复制回 Markdown 的小网页。用完即弃。 这背后是"算力丰裕心态(abundance mindset)":既然生成 UI 几乎零成本,就应该为每一个具体的编辑任务定制最舒适的界面,而不是迁就通用工具。 工作流 3:可执行的"活体设计系统" 让 Claude 扫描代码库(甚至多个 GitHub 仓库)提取设计 DNA,产出一份 design_system.html。 · 它不是静态文档,而是人机双向可读的工件:色板、字号、间距、组件交互态都在页面上活生生地渲染出来。 · 在新功能开发时,把这份 HTML 作为上下文喂给 Claude,即可保证产出符合品牌一致性。 · 配合组件 playground(带可调节旋钮),还能成为非技术同事(市场、设计、视频)自助获取高保真素材的入口,打通工程与公司其他职能之间的鸿沟。 真正值得记住的几个判断 1. 媒介决定参与度。 模型不需要 HTML,人类需要。换载体的本质是把人留在协作回路里。 · 1% 与 99% 的算力分配。 Thariq 估计他生成的 token 只有约 1% 最终进入生产代码,其余 99% 都花在"脚手架"上——计划、临时 UI、状态汇报、设计系统。这恰恰是 compute allocator 的本职:把资源投在对齐与沟通上,以确保那 1% 是对的。 · 一次性软件是新常态。 软件的边际成本趋近于零之后,"为一次编辑造一个 app"不再奢侈,而是高效。 · 信任是提示词的一部分。 显式的授权语句会让模型敢于给出更完整、更有创造性的产出。

译Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

meng shao@shao__meng · 5月19日72

OpenAI Codex Cookbook 系列之 Goals 从 "prompt" 到 "goals" · Prompt:ask → work → result → wait(做完即停) · Goal:work → check → continue or complete(做完检查证据,未达成则继续) Goal 的关键是给 Codex 一条可审计的完成线,并允许它在空闲时基于已有证据自主决定下一步,而无需用户每轮重复说"继续"、"再跑一次基准"、"现在查测试"。 生命周期和命令 Goals 是 线程作用域 的持久状态,不是全局 memory,也不是项目级 instructions。 /goal <目标> 设置目标 /goal 查看当前目标 /goal pause 暂停 /goal resume 恢复 /goal clear 清除 可能的停止条件:成功、暂停、清除、被打断、预算耗尽、遇到需用户输入的阻塞。 continuation 是事件驱动的,不是死循环:仅在线程 idle、无队列输入、无 pending 工作、Goal 仍 active 且在预算内时才会触发。Plan-only 的回合不触发 continuation;如果某次 continuation 没有调用任何工具,下一次自动 continuation 会被抑制(防止空转)。 如何写一个"强 Goal"——六个要素 1. Outcome(结果):完成时什么应为真。 2. Verification surface(验证面):用什么证据证明——测试、benchmark、报告、命令输出、产物。 3. Constraints(约束):工作期间不能回退什么。 4. Boundaries(边界):可用的文件、工具、数据、仓库。 5. Iteration policy(迭代策略):每次尝试后如何选择下一步。 6. Blocked stop condition(阻塞停止条件):何时该停下并说明无可行路径,需要什么才能解锁。 推荐模板: /goal <期望终态> verified by <具体证据> while preserving <约束>. Use <允许的输入/工具/边界>. Between iterations, <如何选择下一步最佳行动>. If blocked or no valid paths remain, <报告什么、需要什么才能继续>. 对比示例(性能优化): · 弱:/goal Improve performance · 中:/goal Reduce p95 checkout latency below 120 ms without regressing correctness tests · 强:在上一条基础上加入 benchmark 名、允许动用的服务/fixture 范围、每轮记录变化与下一个实验,以及"基准跑不动时如何报告阻塞"。 Goal 激活后发生了什么变化 1. 目标常驻可见:测试失败、benchmark 改善但未达阈值、研究路径数据缺失,Codex 都不会丢掉原始目标。 2. 可以从 idle 线程自主续跑——但仅在安全边界(无 pending 工作、无用户输入排队)。 3. 完成必须基于证据:不能因为模型"觉得差不多"就标记完成,必须对照文件、测试、日志、benchmark 输出或产物。 研究类 Goal 的范式案例:复现 Deep Hedging 论文 最具启发性的部分,用 Buehler 等人的 Deep Hedging 论文做案例,说明"复现一篇论文"这种充满不确定性的任务该如何 Goal 化。 弱 Goal:/goal Reproduce Buehler et al., "Deep Hedging" —— 没说哪一节、什么算复现、缺失训练状态怎么办。 强 Goal 要求 Codex 产出一份分级证据报告,区分四类状态: · Reproduced mechanics(机理已重建) · Approximate trained results(近似训练结果) · Blocked exact replay(无法精确复现的部分) · Remaining uncertainty(剩余不确定性) 实际执行中,Codex 能重建定价/对冲机理、复现 Heston 参考价、训练 CVaR 对冲策略、重建主直方图与对冲面、复现 BS 交易成本斜率;但原始随机种子、训练路径、TF 计算图、optimizer 状态、checkpoint 全部缺失——因此最诚实的结果只能是"部分近似复现,而非精确神经回放"。 何时不该用 Goal? · 一行编辑、简短解释、小段 code review、单问单答 —— 用普通 prompt。 · 终点模糊("make this better"、未定义终态的 "refactor this")。 · 用 Goal 来掩盖不确定性——如果数据可能缺失、benchmark 可能 flaky、代理证据是否允许,都应在 Goal 中显式说明。 Goal 的最佳适配场景具备三个属性:持久目标 + 基于证据的终点 + 路径可能需要多轮探查。典型用例:性能优化、flaky 测试调查、依赖迁移、需复现的 bug 猎杀、多步重构、benchmark 驱动调优、需产物的研究任务。 Cookbook https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

译本文介绍了 OpenAI Codex 中的“Goals”功能,它将工作模式从单次“提示-执行-停止”转变为基于证据的自主循环。Goal 为 Codex 设定了一个可审计的完成目标,使其能在空闲时自主决定下一步并推进任务,无需用户反复指令。文章详细阐述了 Goal 的生命周期、命令,并重点说明了如何编写一个包含结果、验证面、约束等六个要素的“强 Goal”。同时,它指出了 Goal 最适用于性能优化、复杂任务复现等需多轮探查的场景,而不适用于简短问答等简单任务。

meng shao@shao__meng · 5月19日79

Claude Code 核心开发者 Thariq 带来自己高频使用的「开发日志」提示词 @trq212 这段提示词解决了 AI 协作编码中最棘手的结构性问题:规格永远写不完整,但人又无法实时跟踪 AI 的每一个判断。 传统的两种极端都失败: 1. 过度规约:试图在 spec 里穷举所有边界情况——不现实,且拖慢启动 2. 完全放手:让 agent 自由发挥——结果是大量隐性决策埋藏在 diff 里,code review 时才发现,返工成本极高 这个提示词走的是第三条路:承认歧义不可避免,把"判断"这个动作本身变成可审计的产物。 这种做法为啥有效? · 降低模型的"过度澄清"倾向:模型不必反复打断你问问题,可以自主推进 · 把隐性决策外化:原本藏在代码里的"为什么这样写"被显式写出来,review 时直接对照笔记,而不是逆向工程 diff · 结构化的四个维度正好覆盖了实施中所有"非代码信息": · Design decisions = 填补 spec 的空白 · Deviations = 偏离 spec 的地方(最危险,必须显式) · Tradeoffs = 没走的路(防止 reviewer 重复思考同样的备选) · Open questions = 需要人类回环的点 · HTML/Markdown 作为载体:轻量、可读、可与代码同 PR 提交,不需要额外工具 值得借鉴的 prompt 设计原则 · 给模型一个"合法的出口",而不是逼它在歧义前停下或瞎猜 · 要求结构化产物(四个明确分类),比开放式"写点笔记"质量高一个数量级 · 用单独文件而非 inline 注释——保持代码干净,同时让元信息集中、可搜索 · 二次迭代本身是个示范:第一版凭直觉写,第二版让 Claude 帮忙结构化——这就是这条 prompt 自己倡导的"人机协作"范式 提示词原文: Implement <SPEC>. As you work, maintain a running implementation-notes.html file that captures anything I should know about how the implementation diverges from or interprets the spec, including: · Design decisions: choices you made where the spec was ambiguous · Deviations: places where you intentionally departed from the spec, and why · Tradeoffs: alternatives you considered and why you picked what you did · Open questions: anything you'd want me to confirm or revise

译针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

OpenAI Developers@OpenAIDevs · 5月19日64

Your Mac can hold down the fort while you work from your phone. Enable remote connection in the Codex desktop app, then turn on “Keep this Mac awake.” When your Mac is powered on and plugged in, Codex can keep running there while you work from the ChatGPT mobile app.

译你的Mac可以在你用手机工作时坚守岗位。 在Codex桌面应用中启用远程连接,然后开启“保持Mac唤醒”。 当Mac开机并接通电源时,Codex可以持续运行,而你则通过ChatGPT移动应用工作。

Greg Brockman@gdb · 5月19日69

how to use /goal in codex — keep Codex working on a persistent objective until it's solved:

译如何在 Codex 中使用 /goal —— 让 Codex 持续执行一个明确目标直至解决: [引用 @derrickcchoi]:我的同事撰写了一篇关于在 Codex 中使用 Goals 的精彩文章。 他们介绍了何时使用 Goals、激活 Goals 时会发生什么变化,以及如何编写能为 Codex 提供明确结果、约束和验证标准的 Goals。 如果你感兴趣,文章还介绍了我们在架构层面如何设计 Goals。 https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

凡人小北@frxiaobei · 5月19日71

Anthropic 这篇关于 Claude Code 在大型代码库的最佳实践,几个能直接抄作业的点: · CLAUDE. md 要分层。根目录那份只放整体架构和关键的坑,每个子目录再放各自的局部约定,Claude 进哪个目录就加载哪一份。 · 让 Claude 从子目录启动,不要从仓库根启动。它会自动往上回溯加载所有说明文件,反而上下文更准。 · 测试和 lint 命令按子目录切分。别让它改了支付服务就把整个仓库的测试全跑一遍,又慢又把上下文塞满无关报错。 · 装 LSP(语言服务器协议,比如 Python 有 pyright,TypeScript 有 tsser)。Claude 默认是 grep 字符串找代码,同名函数一搜几千个。LSP 能让它按符号本身定位,一步直达定义。具体接法是装一个 code intelligence 插件 + 对应语言的 language server 二进制文件,Claude Code 文档里有现成的。 · 每 3-6 个月审一次配置,新模型发布后再审一次。当初为旧模型写的规则,可能会反过来束缚新模型。 以及一个组织层面的提醒:哪怕不专门成立 AI 工具团队,至少要指定一个人负责管 Claude Code 的配置、权限、插件、CLAUDE. md 规范,不然大家各搞各的,好经验传不出来。

译Anthropic 分享了在大型代码库中使用 Claude Code 的关键实践。核心建议包括:将 CLAUDE.md 配置分层,根目录放全局架构,子目录放局部约定;从子目录启动以精准加载上下文;测试和 lint 命令按子目录隔离运行;安装 LSP 以实现基于符号的精准代码定位;定期审查配置。组织层面需指定专人统一管理配置与规范,以促进最佳实践共享。

Thariq@trq212 · 5月19日73

a prompt I've been using a lot recently: implement &lt;SPEC&gt; and while you do, keep a running implementation-notes.html file (or markdown) with decisions you had to make weren't in the spec, things you had to change, tradeoffs you had to make or anything else I should know

译我最近常用的一个提示词: 实现<SPEC>,同时维护一个持续更新的implementation-notes.html文件(或markdown),记录规范中未提及的决策、需要修改的内容、必须做出的权衡,以及其他我需要了解的事项。

ClaudeDevs@ClaudeDevs · 5月19日73

What are best practices for running Claude Code at scale? New blog post on what we've learned from teams running it across multi-million-line monorepos, decades-old legacy systems, and distributed microservices: https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start

译在大规模运行Claude Code有哪些最佳实践? 关于我们从团队在数百万行单体仓库、数十年历史的遗留系统和分布式微服务中运行的经验总结,新博客文章已发布: https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start

OpenRouter@OpenRouter · 5月19日60

Some primitives for building long-horizon agents: https://openrouter.ai/long-horizon

译构建长期代理的一些基础要素:https://openrouter.ai/long-horizon

向阳乔木@vista8 · 5月19日39

小火箭Shadowrocket的规则有点复杂,安装 Tailscale 后更是乱套。 关掉火箭就能用远程桌面,打开就连不上。 最后,掏出Codex,它自己做网络联通测试,完成本地规则数据库修改,终于修复了。 经验:电脑的网络问题也都可以交给AI,以后都用写Shadowrocket 配置规则。

译用户在使用Shadowrocket时发现,安装Tailscale后网络连接出现异常:关闭Shadowrocket时可正常进行远程桌面连接,但开启后便无法连接。最终通过AI工具Codex自动执行网络联通测试,并修改本地规则数据库成功修复问题。此案例表明,复杂网络配置问题可由AI高效解决,未来或可广泛应用于自动化编写Shadowrocket等工具的配置规则。

AYi@AYi_AInotes · 5月18日68

跑了三个最实用的HTML工具, 大家浏览器打开就能用, 但先给铁汁们一个更值钱的东西, 怎么判断AI产出该用HTML还是Markdown, 记住这一句话够了, 这个东西生成完之后, 是被读,还是被用, 如果是被读,就用Markdown, 如果是被用,那就用HTML, 听起来好像很简单是吧, 但实际上咱们80%的活其实卡在这个中间, 就是说你以为是应该被读的,但它实际上是被用的, 比如项目计划,大多数人交付的时候会写成MD文档,对面的老哥可能看了三天就忘了, 但同样的信息如果做成可点击的项目页,对面老哥可能就愿意反复回来看, 我实测了最好用的场景,都是打开浏览器就能跑的: 1️⃣项目计划页:时间线+风险表+流程图,改完直接分享链接就行 2️⃣数据看板:把CSV或API结果丢给AI,生成带排序筛选的交互表格 3️⃣临时小工具:Prompt调参器、正则测试器、文件格式转换器等 大家可以把你的下一个项目计划或报告,让AI输出成HTML试试, 你会发现自己以前用Markdown交付,浪费了多少回头率 👇

译推文提出了一个核心判断标准:根据AI产出内容的最终用途来选择格式——如果是为了“阅读”,就用Markdown;如果是为了“使用”,则用HTML。推文指出,许多内容(如项目计划)本质上属于“使用”范畴,但常被错误地用Markdown交付,导致效果不佳。为此,作者推荐了三种适合用HTML生成的实用场景:项目计划页(含时间线与交互图表)、数据看板(支持排序筛选的交互表格),以及各类临时小工具。

AYi@AYi_AInotes · 5月18日71

http://x.com/i/article/2053129966217277440 # 我终于想明白了:你 90% 用 Markdown 写的东西,本来就该是 HTML(2026 实战指南・附全套提示词) 上篇写 Markdown vs HTML 那条爆了之后,后台收到最多的一个问题是: 那到底哪些活该用 HTML,哪些活该用 Markdown? https://x.com/AYi_AInotes/status/2052842474687680678 说实话当时那篇没回答这个问题。 我只讲了"HTML 是 AI 时代的沟通语言",但没讲清楚边界在哪。 后来这半个月,我一直在用各种活试,把"什么时候该用什么格式" 这件事拆得越来越清楚。 今天把决策框架放出来,顺便用 @AntLingAGI 开源的 Ring-2.6-1T 跑了三个最实用的 HTML 工具——铁汁们打开浏览器就能用的那种。 ## 一句话决策标准 判断一个 AI 产出该用 HTML 还是 Markdown,看一个信号就够了: > 这个东西生成完之后,是被读,还是被用。 被读 → Markdown。 被用 → HTML。 听起来简单,但 80% 的活其实卡在中间——你以为是被读的, 其实是被用的。比如项目计划,大多数人交付时写成 Markdown 文档, 对面看了三天就忘了。但同样的信息做成可点击的项目页, 对面会反复回来看。 ## 四组判断信号 用 HTML 的 4 个信号 - 需要交互——点击、拖拽、滑块、输入。任何带"用户操作"的东西 - 需要可视化——流程图、时间线、对比表、图表、SVG - 一次性产出且不需要二次编辑——demo、原型、临时工具 - 要发给别人看——发个链接打开即用,不用下载任何东西 用 Markdown 的 4 个信号 - 需要后续手动编辑——文档、笔记、技术博客 - 纯线性阅读——公众号长文、Twitter Thread - 需要版本控制——Git diff 友好、code review 友好 - 长期沉淀——Notion、Obsidian、wiki 这种 四组里命中两组以上,就按这一边走。 有意思的是,真正容易被读者忽视的判断,是"需要交互"。 这个维度一旦命中,Markdown 几乎一定输。 ## 三个 Ring 实测 HTML 工具 理论讲完了,接下来是实测。 我用 Ring xhigh 跑了三个 HTML 工具,都是单 HTML 文件, 打开浏览器就能用,不依赖任何库。**三个工具加起来跑通花了 不到 10 分钟,产物质量都是 9/10。 ## 场景一:交互式项目计划页 输入项目名 + 周期 + 里程碑 + 风险表。 我拿一个企业内部"2026 年度组织盘点"做了样本—— Ring xhigh 大约 2分多钟出第一版,暗色主题 + 横向时间线 + 可折叠风险表 + 团队头像墙 + 整体进度条一次到位。 跑出来的页面不接 polish skill 就能直接发给 leader 看 以前同样的活,我用 Notion 拼模板大约 30-40 分钟, 节省了 20 倍时间。 ## 交互式项目计划页(组件多 / 视觉强)提示词: ## 场景二:Prompt 调参器 输入 prompt 用途 + 需要调的参数。 Ring 产出:三栏布局——左边滑块 + Switch 参数面板, 中间 prompt 编辑器(支持 {{ }} 占位符高亮), 右边实时预览合成 prompt + 一键复制按钮 + token 估算 + Claude Opus 费用估算。 HTML:prompt调参器 这个工具我自己天天用,Ring 给的版本比我手写的稳得多—— 关键是"token 估算 + 费用估算"这种细节,自己写经常忘。 也是2分多钟出第一版,直接能用。 ## Prompt 调参器(交互密 / 单页应用) ## 场景三:可交互流程图 输入流程主题 + 节点清单 + 节点关系。 Ring 产出:纯 SVG 流程图,支持拖动平移、滚轮缩放、点击节点 展开详情、双击高亮关联连线。坐标系判断完全正确—— prompt 里那句"Y 轴向下为正"显式约束起了关键作用。 CTO 线组织盘点流程图 - 11 节点可交互 跑了 1分多分钟出第一版,11 个节点的复杂流程图布局工整、 连线无交叉。这比我用 Mermaid 折腾半天的体验好太多。 > prompt:可交互流程图(SVG 坐标系敏感) ## Ring 跑 HTML 的三个坑 但 Ring 跑 HTML 也有几个坑要说清楚,我都踩过。 坑一:首次输出可能不完整。 三个场景里,项目计划页的第一次跑出来缺了几个组件—— 不是错误,是模型停在中间。补一句"请补全所有组件, 确认所有模块都生成完整"再让它重跑,第二次就稳了。 这个坑要预防的话,prompt 里加一句 "完成后逐项确认每个模块都已渲染"。 坑二:SVG 坐标系翻转。 SVG 的 Y 轴向下为正这件事,Ring 偶尔会按数学坐标系处理, 导致整个图翻转。预防做法是在 prompt 里显式写 "Y 轴向下为正,节点垂直间距 120px,X 轴向右为正"。 有这一句,出错率明显降下来。 坑三:仿站做不了。 Ring 当前没有多模态,做不了"看截图复刻"。 如果你想还原一个看到的页面,流程是先用 Claude / GPT 读截图、 输出布局描述,再把描述喂给 Ring 写代码。 ## 一个升级版判断 咱们回到核心, 上篇推文里我写过一句:Markdown 是给人写给人看的, HTML 是给 AI 写给人用的。 最近一周我实测跑下来,还想再补一句: > 选错格式的本质,是没想清楚交付物到底要被读还是被用。 倒不是说 HTML 比 Markdown 更先进,主要是 AI 时代的产出越来越多被"用", 而不是被"读"。讲真,这一类活,Markdown 天然就吃亏。 Ring xhigh 在 HTML 工具这种场景上,跑下来比我预期稳—— 尤其是单文件不依赖外部库这种约束,它接得住。 OpenRouter可以直接使用,适合在自己手头的 HTML 工具项目 里跑一遍: 🔗 https://huggingface.co/inclusionAI/Ring-2.6-1T 完整 prompt 模板(三个场景全套) + 调用示例 + 避坑指南 已经整理成飞书文档,需要的评论区留言我私信发。

译本文核心观点是判断AI产出格式的关键在于该产物是用于“阅读”还是“使用”。被阅读的文档、笔记适合Markdown;需要交互、可视化、一次性交付或直接分享的工具型产物则应选择HTML。文章提出了四组具体判断信号,如需要交互和可视化即指向HTML。作者使用Ring-2.6-1T模型实测了三个HTML工具,包括交互式项目计划页、Prompt调参器和可交互流程图,均能在几分钟内生成高质量、单文件且不依赖外部库的成品,效率大幅提升。同时,文章也指出了使用Ring生成HTML时可能遇到的输出不完整、SVG坐标系错误等常见问题及应对方法。

François Chollet@fchollet · 5月18日53

If you're a R user: the R edition of the book is out now!

译如果你是R用户:R语言版的书现在出版了! [引用 @ManningBooks]:AI炒作可能很容易找到。但清晰的解释肯定更难。由@fchollet和Tomasz Kalinowski合著的《Deep Learning with R, Third Edition》通过实际例子帮助你拨开迷雾,逐步建立理解,让你不仅知道如何运行深度学习模型,更明白它们为何有效。 现已印刷出版,5月25日前享5折优惠:https://hubs.la/Q04gQbC90

meng shao@shao__meng · 5月18日74

TRAE 团队分析了用户实际使用的 Agent Skills Top 10 这 10 个 Skills 覆盖了从 UI 设计到调试的产品开发全链路,还有一个 PUA Skills 😄,咱们分类看看: 流程治理类(强制工作流) 1. brainstorming —— 设计先行 强制在写代码前完成结构化需求对话,未批准方案禁止编码。核心是消灭"这事太简单不用设计"的惯性偷懒。 5. writing-plans —— 计划落地 把头脑风暴的产物拆成 2–5 分钟粒度的可执行任务,每步附带完成标准、风险预案和代码示例。是 brainstorming 的下游配套。 7. using-superpowers —— 调度中枢 元技能。强制 Agent 在每次响应前先检索并加载相关 skill,并明确优先级:用户指令 > 技能指令 > 系统默认。 8. karpathy-guidelines —— 行为护栏 源自 Karpathy 对 LLM 编码缺陷的观察,约束三类常见病:过度假设、过度工程、留下烂摊子。原则是 think first / stay simple / edit surgically。 设计与前端类 2. frontend-design 针对"AI 生成页面千篇一律"的问题,强制选择明确的设计语言(极简 / 复古 / 野兽派等),关注排版、配色、动效的真实质感。 3. ui-ux-pro-max 全平台设计系统生成器:50+ 风格、97 套配色、57 套字体组合,附带无障碍规范。属于 frontend-design 的"重型武器"版。 调试与验证类 4. systematic-debugging 四阶段方法论:禁止猜测式修复,要求根因追踪、纵深防御、基于条件的等待,必须完成完整诊断后才允许动手。 9. webapp-testing 基于 Playwright 的本地测试套件,强调"先侦察后行动"——截图、抓控制台日志、管理多服务生命周期。 10. agent-browser 更通用的浏览器自动化 CLI:导航、填表、点击、截图、数据抽取,把浏览器变成 Agent 的标准 I/O 通道。 生态扩展类 6. find-skills 对接开放的 skills. sh 生态,支持模糊搜索和从任意 Git 仓库安装,并按 Agent 作用域隔离。 额外发现:PUA /pua —— 高压问责 四级升级机制 + 七项检查清单,禁止 Agent 用"差不多了"或被动等待来收尾,强制承担完整责任。命名带反讽意味。 整体设计逻辑分层 1. 元层 using-superpowers, find-skills 2. 行为层 karpathy-guidelines, /pua 3. 流程层 brainstorming → writing-plans 4. 执行层 frontend-design, ui-ux-pro-max 5. 验证层 systematic-debugging, webapp-testing, agent-browser 形成的闭环是:想清楚 → 拆细 → 做精 → 验透 → 担责。

译TRAE团队基于真实的用户技能调用数据(而非安装量),分析了用户实际高频使用的Agent Skills Top 10。这些技能覆盖了从UI设计、流程规划到测试调试的产品开发全链路,甚至包含一个带有反讽意味的“PUA”高压问责技能。其设计具有清晰的分层逻辑,从元层的技能检索与调度,到行为层的约束护栏,再到具体的执行与验证层,共同构成了一个“想清楚→拆细→做精→验透→担责”的结构化、负责任的闭环工作流。

歸藏(guizang.ai)@op7418 · 5月18日69

基于藏师傅 PPT Skill 的讲解视频生成 Skill,差不多搞定了! Codex 配合远程控制不在家也可以一键产出视频内容 可以用非常低的成本保证视频内容的可用性和表现力 这里的视频是我随便找了一个徒步文案一次生成的。 主要的内容用前端生成,只有配音和部分分镜使用音频和Seedance 2.0 模型

译该工具基于藏师傅PPT Skill,结合Codex与远程控制,可实现离家时一键生成讲解视频。方案以极低成本保证了视频的可用性与表现力,主要通过前端技术生成内容,仅配音和部分分镜使用了Seedance 2.0等模型。此组合能直接基于文本生成带动效的解释视频。

向阳乔木@vista8 · 5月18日69

哈哈哈,都被Spotify 的迪斯科Logo晃瞎眼了。 海外X都在发自己产品设计这种风格 Logo。 反推个GPT-Image-2提示词: 为【品牌名】生成一个高级 3D App 图标,圆角方形底板,玻璃与金属铬材质,迪斯科球镜面马赛克小方块质感,闪亮高光,柔和工作室灯光,干净极简背景,高端产品图标风格,Blender 3D 渲染,超精细 --- 英文版: A premium 3D app icon for 【Product Name】, rounded square tile, glossy glass and chrome material, disco-ball mosaic mirror tiles, sparkling highlights, soft studio lighting, clean minimal background, high-end icon, Blender 3D render, ultra detailed

Orange AI@oran_ge · 5月18日70

刘小排说 AI 唯一正确的用法就是:泼冷水 很多人对自己有一种谜之自信,从来不能反思自己,但 AI 又喜欢顺着人说话,给人提供情绪价值,两个人很容易就陷入思考的信息茧房了 所以正确的用法就是让 AI 当魔鬼代言人,让它给自己猛猛地泼冷水 直面真相,才能正确思考 我让 Cola 直接把冷水蒸馏成 skill 了 免费开源,欢迎发给你的 Agent 让它安装使用 https://github.com/orange2ai/devils-advocate-skill

译推文指出,AI容易顺从用户、提供情绪价值,导致双方陷入思考的信息茧房。因此,AI唯一正确的用法是充当“魔鬼代言人”,主动泼冷水以帮助直面真相、正确思考。作者将这一方法论蒸馏为可安装使用的开源Skill,并公开分享。

Elon Musk@elonmusk · 5月18日53

Grok

译Grok [引用 @yunta_tsai]:尝试使用 Grok Build 来可视化一些用于教育的物理概念。 提示词:"我希望你解释纳维-斯托克斯方程以及它与翼型设计的关系。请用 math-manim 工具将其可视化"

向阳乔木@vista8 · 5月18日69

不得不说,哪怕在大模型这么厉害的今天。 DeepL的翻译质量还是很优秀。 淘宝上几块钱买个 API,配置到Bob翻译里,用了一年多了。。。

Berryxia.AI@berryxia · 5月18日61

我刚刚查了一下Grok的消耗量,当前用量消耗3%,期间仅生成4-5张图片并进行少量项目信息查询,整体属于轻度使用范畴。 访问路径:http://Grok.com ,然后点击头像找到设置。 选择Usage-就可以看到订阅的量。

译分享了查看Grok用量消耗的具体方法:访问Grok.com后,通过点击头像进入设置,在Usage选项中可查看订阅的详细用量。作者指出,在仅进行少量图片生成和项目信息查询的轻度使用情况下,其当前用量消耗仅为3%。

Greg Brockman@gdb · 5月18日52

Codex for unsubscribing from unwanted marketing emails

译用Codex退订不需要的营销邮件 [引用 @toddsaunders]:我终于在Codex中使用了/goal功能,效果令人震惊。 它扫描了我最近500封归档邮件。 然后查找退订链接,如果有的话就点击退订。 它找到了87封,并全部点击了退订。 它处理了“确认退订”页面,并标记了14封需要登录的邮件。 它自主运行了一个多小时,现在我的收件箱里没有营销邮件了。 太神奇了。

meng shao@shao__meng · 5月18日57

感谢 @MaxForAI 推荐! 关注 AI 的朋友,可以对照这个列表,看看还有哪些你感兴趣的账号,关注起来。

译推文推荐了一份由@MaxForAI整理的AI领域值得关注的30个Twitter账号列表,旨在帮助用户拓展高质量信息源。列表分为英文和中文两部分:英文账号包括Andrej Karpathy、Yann LeCun、吴恩达等顶尖研究者与教育者,内容涵盖LLM、Agent、AGI及前沿论文;中文账号包括宝玉、歸藏、小互等,侧重LLM实践、Prompt Engineering、AI工具资讯与行业动态。该合集为不同需求的用户提供了系统性的关注指引。

Berryxia.AI@berryxia · 5月18日56

兄弟们,今天必需卧槽一下了! 昨晚发完这条推文后,终于等到了… xAI算法开源后,终于有人把源码真正啃完了。 岚叔@LufzzLiz (某大厂架构师,多模态与模型私有化领域专家)直接上手,把xai-org/x-algorithm仓库的每一行结论都追溯到源码,用Opus-4.7花了两天时间,搞出了一个完整wiki。 所有页面都有明确源码出处,跟市面上很多“AI批量生成”的解读完全不一样,直接Wiki库整起来了… 就是不一样啊! 这才是真正有价值的算法拆解。 GitHub仓库:https://github.com/cclank/x-algorithm-wiki 在线阅读地址:https://lansu-wiki-web.lank.workers.dev/wiki/cclank/x-algorithm-wiki#index

译xAI算法开源后,专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码,使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比:市面上95%的分析是AI批量生产的同质化废话,缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解,GitHub仓库和在线阅读地址已公开。

Greg Brockman@gdb · 5月18日51

codex for deeply personal insights

译Codex 用于深度个人洞察

向阳乔木@vista8 · 5月18日47

配置好Hermes,每个飞书机器人用不同的模型,拉到一个群,就可以一次性@ 所有人回答同一个问题。 还在研究如何机器人之间互相@讨论。

向阳乔木@vista8 · 5月18日71

Hermes 目前值得配置的国内外模型: 1. 订阅ChatGPT plus或以上,用 OpenAI Codex 的Auth 配置 gpt-5.5 2. xAI如果买了Premium,可以配置 grok-4.3 3. 谷歌 Gemini 订阅或免费账号,配置 gemini-3.1-pro-preview 和 gemini-3-flash-preview 4. DeepSeek 官网 API 配置 deepseek-v4-pro 和 deepseek-v4-flash 5. 智谱官网 API 配置 glm-5.1 和 glm-5-turbo 6. Kimi 官网 API 或开发套餐配置 kimi-k2.6 7. 小米官网 API或开发套餐,配置 mimo-v2.5-pro 配置后,Hermes可跟机器人对话切换模型,指令如下: /model gpt-5.5 --provider openai-codex /model grok-4.3 --provider xai-oauth /model gemini-3.1-pro-preview --provider google-gemini-cli /model kimi-k2.6 --provider kimi-coding-cn /model deepseek-v4-pro --provider deepseek /model mimo-v2.5-pro —provider xiaomi

译Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户需通过相应服务的订阅或 API 进行配置,完成后可使用 /model 指令指定模型及提供者来切换对话模型,例如输入“/model gpt-5.5 --provider openai-codex”即可切换至对应模型。该功能方便用户根据需求灵活调用不同模型的优势。

AYi@AYi_AInotes · 5月18日66

Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!

歸藏(guizang.ai)@op7418 · 5月18日49

Anthropic 官方发布的 Skill 构建指南 我用 AI 翻译了一个双语版本,放下面了

Greg Brockman@gdb · 5月18日61

link together your devices with Codex to develop from anywhere, anytime

译用户通过Codex应用将手机、MacBook和Mac mini互联,构建跨设备开发环境。Mac mini作为始终在线且连接稳定的“家庭基站”,手机和MacBook作为可移动的“卫星设备”。用户可在任一设备上启动或恢复Codex线程,并通过SSH实现文件互访。这一设置使Codex不再绑定于单一前台设备,成为可通过任何设备访问、线程持续运行(包括24/7心跳线程)的持久化开发环境。尽管当前方案仍显粗糙,但其形态预示着未来跨设备无缝开发的工作模式。

swyx 🇸🇬 AIE Singapore!@swyx · 5月18日58

we do not post AIE videos with bullshit brainrot hype lingo, and this is the consequence: the entire AIE back catalog is being reposted by "influence operators" almost daily, without credit to speakers like @trq212 or @aidotengineer if you see these just do a small favor of tagging and giving credit. community note not needed, let them make their bags, but i just request that the right accounts that produced the content be tagged. this wont go anywhere as much as this guy's automated repost campaign, but just making a small call out. actual video link: https://www.youtube.com/watch?v=TqC1qOfiVcQ&t=1s (h/t @raoufcode )

译主推文作者因拒绝使用浮夸营销话术发布AIE视频,导致其全部历史内容被“影响力操盘手”每日搬运,且未标注原作者(如@trq212)。作者呼吁观众若见到此类内容,请帮忙标注并致谢原创者。文中整合的引用推文指出,Anthropic发布了一个由Claude Code工程师主讲的2小时完整课程,详细教授如何构建能自主运行、访问终端、管理文件系统内存、通过Hooks防止幻觉,并能安全在大型代码库上操作的Claude智能体。该课程被评价为内容全面,其价值超过许多高价付费课程。

Berryxia.AI@berryxia · 5月17日69

http://x.com/i/article/2056013843718156289 # 别让你的 SuperGrok (蓝V) 订阅每月白费,5 分钟接入 Hermes Agent 保姆级实操教程! 兄弟们,今天 xAI 与 Nous Research 宣布:你的 Grok 订阅现在可以免费直接在 Hermes Agent 里使用了。 Grok 直接可以接入到 Hermes Agent 里面!你们千万不要浪费了你的蓝 V(Premium) 订阅,尤其是订阅了蓝 V +(Premium+)的用户,一定要将你的 Grok 和 Hermes Agent 结合起来。 为什么值得做这件事? 因为在 Grok 里面它有一个非常大的优势,就是它的信息检索能力。 Grok 有一个其他模型目前给不了的核心优势:实时信息检索。准确性、时效性、来源可靠度,目前 GPT、Gemini、Claude 都比不过它。 把 Grok 接进一个可以 24 小时持续运行的本地 Agent,每天自动做信息整理,这个组合的价值远超单独使用任何一个工具。 所以我们下面花五分钟时间把它装好。 官方给出的步骤基本上三步就可以搞定。实际操作下来,你两步到最后一步启动,基本上就没问题了。 如果有问题的话,让 Codex 或者 Claude 直接帮你去修复就可以了,非常丝滑。 而且现在 Hermes Agent 的版本更新已经非常趋于稳定和可靠了,所以大家可以整起来。下面就不废话了,看我的操作吧。 ## 一、Hermes Agent 是什么? Hermes Agent 是 Nous Research 开发的开源自进化 AI Agent。它的几个关键特点: - 持久运行:可以部署在你的电脑、沙盒环境或 VPS 服务器上,全天候在线 - 长期记忆:跨对话保留上下文,越用越懂你 - 多平台接入:可连接 WhatsApp、Discord、Telegram、Signal 等主流通讯软件 简单说,它就像一个住在你服务器里的私人 AI 助理,可以持续学习、自主运行。 ## 二、接入 Grok 之后能做什么? 在 Hermes Agent 中绑定 Grok 订阅后,你可以使用: - Grok 4.3 —— 用于文字对话和复杂推理任务 - Grok Text-to-Speech —— 让 Agent 以语音方式回应你 - Grok Imagine —— 让 Agent 帮你生成图片和视频 所有 Grok 订阅档位均可使用,无需额外升级。 怎么上手安装? 第一步:安装 Hermes Agent(支持 Linux、macOS、WSL2、Android Termux) 直接将这一段命令复制到你的电脑终端就可以:(我这里是以 macOS 为例演示) 在这个安装过程中稍微要花一点点时间,所以我们需要耐心等待一下。 第二步:选择 Grok 作为模型提供商 在这里,当我们第一步把基本的框架装完之后,现在需要我们选择 Hermes Agent 的服务商,也就是对应的模型商。 在选择模型商时,我们直接将光标移动到 xAI(即我在图片中用绿色标注出来的选项),选择订阅的这个。 在列表中选择 xAI Grok OAuth(SuperGrok 订阅),然后通过浏览器完成授权登录。 如果说你默认打开的浏览器中登录的不是你的 xAI 账号(也就是推特账号)的话,这里需要注意一下:我是直接用推特登录并授权的。 如果你有多个浏览器,而系统默认打开的浏览器里登录的推特账号不是你的主账号,或者没有付费订阅,你可以直接把跳转出来的授权链接复制下来,粘贴到你当前已登录正确账号的浏览器中完成登录就可以了。 第三步:安装对应的服务 比方说,这里我们需要安装对应的音频服务。我们这里选择 xAI,因为 Grok 是支持语音的。 这里直接按照安装提示,选择我图片中绿色的这一个进行安装就可以。 过程中可能需要安装一些数据服务或者搜索引擎配置。你这里可以根据自己的实际情况来,也可以选择对应的 Grok,也就是默认的搜索引擎。 前面也提到了,Grok 的搜索引擎和信息获取能力非常强大,所以我建议直接配置 Grok。具体选择时,你可以直接参照我图片中用绿色标出来的那个选项。 第四步:启动爱马仕 Agent 在安装的过程中,可能会让你配置那些 IM(比方说是微信、Telegram 或者飞书这些),其实你可以先不安装,先确认一下服务是否已经正常运作。 在这个过程中会有好多次让你进行选择,处理方式如下: 1. 直接按回车,使用默认端口即可,不用理会。 2. 提示确认时,输入“y”或者“YES”确认就行。 启动Hermes Agent : 当我们把所有选项都确认完之后,在对应的终端窗口中输入这一行指令,就可以启动了。看到这个界面的时候,就说明已经启动成功 这里自己可以配置需要的IM软件,我自己使用微信来安装。 当你看到这里的时候,其实已经安装成功了。 安装过程非常简单,没有什么门槛。这样你就可以把你的蓝V订阅用起来了,也不用再单独花费对应的 Token。 目前这个 Token 的使用量暂时还不是很确定,官方好像还没有给出明确的数值,所以大家可以先用起来。 那今天的分享就到这里,谢谢。 整体安装体验 全程无报错,一次成功。Hermes Agent 目前版本已经相当稳定。如果遇到小问题,直接把报错丢给 Claude 或 Codex 修复,基本秒解。 官方文档:hermes-agent.nousresearch.com xAI 表示更多开源 Agent 集成还在路上。 你认为这种「订阅直驱本地 Agent」的模式会成为主流,还是大多数人装完就放着吃灰?

译xAI与Nous Research合作,允许Grok订阅用户免费将模型接入Hermes Agent。此举旨在结合Grok的实时信息检索优势与Hermes Agent的24小时持续运行能力,用户可在Agent内使用Grok进行对话、语音合成及图像生成。安装过程主要分为三步:安装Hermes Agent、选择xAI提供商并授权、安装所需服务后启动。若遇问题,可借助Claude等工具修复。未来预计有更多开源Agent集成计划。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月19日
22:56
向阳乔木@vista8
63
坚果云多场景同步方案实测与成本优势

坚果云同步功能可用于跨设备同步本地.agents目录、替代Obsidian官方同步服务,以及通过Webdav支持CC Switch等工具的API配置。其共享功能便于文件协作。个人用户年费199元,在价格上相比各类AI工具订阅更具性价比。

智能体教程/实践
22:26
向阳乔木@vista8
56
坚果云三大实用场景,性价比高

用户分享了坚果云在数字工作流中的三个实用场景:同步本机.agents目录至其他电脑以保持Skill配置一致;作为Obsidian数据同步工具替代官方服务;通过其WebDAV功能,无缝兼容CC Switch配置的各种API。此外,坚果云支持随时共享文件夹或文件给他人。个人用户年费199元,与AI订阅套餐相比具有显著的价格优势。

教程/实践部署/工程
22:01
Berryxia.AI@berryxia
58
用户使用Cursor与Claude,仅用两小时就复刻了海外售价149美元的「Three.js热带海洋实时交互系统」。复刻版还原了海洋波浪、风速调节等核心物理交互,并添加了双语切换等额外功能。此举被视为AI编程工具大幅降低技术实现门槛的标志性案例。

Berryxia.AI: 我靠!我又行了啊,兄弟们~ 真的是Saas 已死,Agent 称王的时代来了 !! 我今天花了2小时,就用Cursor + Claude把海外老哥卖149美元的「Three.js热带海洋实时交互系统」直接手搓复刻出来了。 😄 实时交互全都...

教程/实践编码
20:01
Berryxia.AI@berryxia
44
AI Agent开发效率惊人:两小时复刻149美元系统

开发者利用Cursor与Claude组合,仅用两小时就复刻了一套海外售价149美元的Three.js热带海洋实时交互系统,并实现了80%以上的功能还原与额外增强。此案例直观体现了“AI Agent开发工具”对复杂应用开发时间和成本的极致压缩。Cursor Auto模式提供了无需特殊网络的技术便利,使这种高效的开发思路具备广泛扩展至天气、生态、教育等场景的潜力。

Berryxia.AI: 我靠!不是,我是最后一个知道的吗??? 你们的嘴可真严啊,Cursor选择Auto模式下。 居然不需要魔法网络就可以使用啊!

智能体教程/实践编码
19:30
凡人小北@frxiaobei
36
领导力与提示词的共通之处

推文指出领导力与提示词工程本质相通:当能力达基线后,产出质量取决于使用方式。同一员工换领导可能脱胎换骨,同一模型换提示词效果翻倍。外部引导框架对激发潜力起决定性作用。

大佬观点教程/实践
19:01
Berryxia.AI@berryxia
67
10分钟训出AI健身教练,黄仁勋的预言正在照进现实

NVIDIA CEO 黄仁勋指出,AI已成为每份工作的基本工具。推文作者以自身实践为例,为应对健康与效率焦虑,利用360“龙虾教练”平台在10分钟内训练出个性化AI健身助手“小B”。该AI能记录训练数据、生成专业日报周报,甚至调用其他AI绘制动作示意图,无需用户编写代码或配置复杂工作流。案例展示了AI工具正从概念讨论快速落地为普通人可用的日常助手,也提醒在追赶技术浪潮时,不应牺牲身心健康。

智能体多模态教程/实践
18:51
AYi@AYi_AInotes
精选75
我真的要吹爆HTML!

作者通过向Claude Code提供精确的提示词,仅用2分钟就生成了一个功能完整的交互式HTML项目计划页面。该页面为单文件、无外部依赖,包含暗色主题、时间线、可折叠表格等丰富交互,可直接交付。相比过去在Notion中耗费30-40分钟制作模板,效率提升了近20倍。其核心在于使用明确的提示词来规范视觉、内容结构与交互细节,确保AI一次性交付完整产物。这充分展示了在AI时代,HTML作为轻量、高保真生产力工具的巨大潜力。

AYi: http://x.com/i/article/2053129966217277440

Anthropic教程/实践编码

推荐理由:一个 prompt 就能把 Claude Code 变成项目管理工具,两分钟生成可直接发给领导的交互式 HTML,效率是 Notion 的 20 倍,打工人可以直接抄作业。
16:00
Berryxia.AI@berryxia
72
我靠!不是,我是最后一个知道的吗??? 你们的嘴可真严啊,Cursor选择Auto模式下。 居然不需要魔法网络就可以使用啊!
教程/实践编码
11:59
歸藏(guizang.ai)@op7418
57
藏师傅前端视频生成Skill完成与优化分析

“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。

歸藏(guizang.ai): 让 Codex 自己做了一条视频介绍了一下这个视频生成方案 藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音 即梦 CLI 负责 前端无法生成的演示...

智能体MCP/工具教程/实践视频
09:26
meng shao@shao__meng
70
HTML 是新的 Markdown?

Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

claire vo 🖤: Soooo @trq212 has straight up changed my life with these 5 words: "HTML is the new markdown." It's so obvious in hindsig...

智能体AnthropicMCP/工具教程/实践
08:56
meng shao@shao__meng
72
OpenAI Codex Cookbook 系列之 Goals

本文介绍了 OpenAI Codex 中的“Goals”功能,它将工作模式从单次“提示-执行-停止”转变为基于证据的自主循环。Goal 为 Codex 设定了一个可审计的完成目标,使其能在空闲时自主决定下一步并推进任务,无需用户反复指令。文章详细阐述了 Goal 的生命周期、命令,并重点说明了如何编写一个包含结果、验证面、约束等六个要素的“强 Goal”。同时,它指出了 Goal 最适用于性能优化、复杂任务复现等需多轮探查的场景,而不适用于简短问答等简单任务。

Derrick Choi: My colleagues wrote up a great post on using Goals in Codex. They go through when to use them, what changes when a Goal ...

OpenAI教程/实践编码
08:56
meng shao@shao__meng
精选79
「开发日志」提示词:让AI编码决策可审计

针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

Thariq: a prompt I've been using a lot recently: implement <SPEC> and while you do, keep a running implementation-notes.html fil...

智能体Anthropic教程/实践编码

推荐理由:这个提示词解决了AI编码最棘手的问题,spec永远写不全,决策藏在diff里。把判断变成可审计的文件,review时直接对照笔记而非逆向工程,做coding agent的值得随时复制。
02:42
OpenAI Developers@OpenAIDevs
64
你的Mac可以在你用手机工作时坚守岗位。 在Codex桌面应用中启用远程连接,然后开启"保持Mac唤醒"。 当Mac开机并接通电源时,Codex可以持续运行,而你则通过ChatGPT移动应用工作。
OpenAI教程/实践编码
02:09
Greg Brockman@gdb
69
如何在 Codex 中使用 /goal -- 让 Codex 持续执行一个明确目标直至解决: 【引用 @derrickcchoi】:我的同事撰写了一篇关于在 Codex 中使用 Goals 的精彩文章。 他们介绍了何时使用 Goals、激活 Goals 时会发生什么变化,以及如何编写能为 Codex 提供明确结果、约束和验证标准的 Goals。 如果你感兴趣,文章还介绍了我们在架构层面如何设计 Goals。 https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

Derrick Choi: My colleagues wrote up a great post on using Goals in Codex. They go through when to use them, what changes when a Goal ...

智能体OpenAI教程/实践编码
01:13
凡人小北@frxiaobei
71
Claude Code 大型代码库最佳实践

Anthropic 分享了在大型代码库中使用 Claude Code 的关键实践。核心建议包括:将 CLAUDE.md 配置分层,根目录放全局架构,子目录放局部约定;从子目录启动以精准加载上下文;测试和 lint 命令按子目录隔离运行;安装 LSP 以实现基于符号的精准代码定位;定期审查配置。组织层面需指定专人统一管理配置与规范,以促进最佳实践共享。

ClaudeDevs: What are best practices for running Claude Code at scale? New blog post on what we've learned from teams running it acro...

Anthropic教程/实践编码
00:55
Thariq@trq212
73
我最近常用的一个提示词: 实现<SPEC>,同时维护一个持续更新的implementation-notes.html文件(或markdown),记录规范中未提及的决策、需要修改的内容、必须做出的权衡,以及其他我需要了解的事项。
Anthropic教程/实践编码
00:13
ClaudeDevs@ClaudeDevs
精选73
在大规模运行Claude Code有哪些最佳实践? 关于我们从团队在数百万行单体仓库、数十年历史的遗留系统和分布式微服务中运行的经验总结,新博客文章已发布: https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start
Anthropic教程/实践编码部署/工程

推荐理由:官方终于出了一份给百万行单仓库和遗留系统的实操指南,比社区零散经验靠谱得多,做工程团队的可以抄作业。
00:11
OpenRouter@OpenRouter
60
构建长期代理的一些基础要素:https://openrouter.ai/long-horizon
智能体MCP/工具教程/实践
00:04
向阳乔木@vista8
39
AI自动修复Shadowrocket与Tailscale网络冲突

用户在使用Shadowrocket时发现,安装Tailscale后网络连接出现异常:关闭Shadowrocket时可正常进行远程桌面连接,但开启后便无法连接。最终通过AI工具Codex自动执行网络联通测试,并修改本地规则数据库成功修复问题。此案例表明,复杂网络配置问题可由AI高效解决,未来或可广泛应用于自动化编写Shadowrocket等工具的配置规则。

教程/实践部署/工程
5月18日
23:45
AYi@AYi_AInotes
68
AI生成内容该用HTML还是Markdown的实用判断标准

推文提出了一个核心判断标准:根据AI产出内容的最终用途来选择格式——如果是为了“阅读”,就用Markdown;如果是为了“使用”,则用HTML。推文指出,许多内容(如项目计划)本质上属于“使用”范畴,但常被错误地用Markdown交付,导致效果不佳。为此,作者推荐了三种适合用HTML生成的实用场景:项目计划页(含时间线与交互图表)、数据看板(支持排序筛选的交互表格),以及各类临时小工具。

AYi: http://x.com/i/article/2053129966217277440

教程/实践部署/工程
22:45
AYi@AYi_AInotes
71
AI产出格式决策指南:Markdown还是HTML?

本文核心观点是判断AI产出格式的关键在于该产物是用于“阅读”还是“使用”。被阅读的文档、笔记适合Markdown;需要交互、可视化、一次性交付或直接分享的工具型产物则应选择HTML。文章提出了四组具体判断信号,如需要交互和可视化即指向HTML。作者使用Ring-2.6-1T模型实测了三个HTML工具,包括交互式项目计划页、Prompt调参器和可交互流程图,均能在几分钟内生成高质量、单文件且不依赖外部库的成品,效率大幅提升。同时,文章也指出了使用Ring生成HTML时可能遇到的输出不完整、SVG坐标系错误等常见问题及应对方法。

教程/实践编码
22:09
François Chollet@fchollet
53
如果你是R用户:R语言版的书现在出版了! 【引用 @ManningBooks】:AI炒作可能很容易找到。但清晰的解释肯定更难。由@fchollet和Tomasz Kalinowski合著的《Deep Learning with R, Third Edition》通过实际例子帮助你拨开迷雾,逐步建立理解,让你不仅知道如何运行深度学习模型,更明白它们为何有效。 现已印刷出版,5月25日前享5折优惠:https://hubs.la/Q04gQbC90

Manning Publications: AI hype can be pretty easy to find. But clear explanations are definitely harder. Deep Learning with R, Third Edition by...

教程/实践
21:26
meng shao@shao__meng
74
TRAE 团队分析了用户实际使用的 Agent Skills Top 10

TRAE团队基于真实的用户技能调用数据(而非安装量),分析了用户实际高频使用的Agent Skills Top 10。这些技能覆盖了从UI设计、流程规划到测试调试的产品开发全链路,甚至包含一个带有反讽意味的“PUA”高压问责技能。其设计具有清晰的分层逻辑,从元层的技能检索与调度,到行为层的约束护栏,再到具体的执行与验证层,共同构成了一个“想清楚→拆细→做精→验透→担责”的结构化、负责任的闭环工作流。

TRAE: We analyzed real skill call data from TRAE users. Here are the 10 Most Popular Agent Skills that people actually use, no...

智能体MCP/工具教程/实践编码
18:59
歸藏(guizang.ai)@op7418
69
基于PPT Skill的视频生成工具接近完成

该工具基于藏师傅PPT Skill,结合Codex与远程控制,可实现离家时一键生成讲解视频。方案以极低成本保证了视频的可用性与表现力,主要通过前端技术生成内容,仅配音和部分分镜使用了Seedance 2.0等模型。此组合能直接基于文本生成带动效的解释视频。

歸藏(guizang.ai): 藏师傅的 PPT Skill+Codex+Heygen HyperFrames 这个组合太顶了! 可以直接基于问当生成带动效的解释视频 而且 Codex 居然可以在聊天里面直接预览视频,这个挺厉害的。 再加上即梦 CLI 补几个真实视频片段...

智能体OpenAI教程/实践视频
18:02
向阳乔木@vista8
69
哈哈哈,都被Spotify 的迪斯科Logo晃瞎眼了。 海外X都在发自己产品设计这种风格 Logo。 反推个GPT-Image-2提示词: 为【品牌名】生成一个高级 3D App 图标,圆角方形底板,玻璃与金属铬材质,迪斯科球镜面马赛克小方块质感,闪亮高光,柔和工作室灯光,干净极简背景,高端产品图标风格,Blender 3D 渲染,超精细 --- 英文版: A premium 3D app icon for 【Product Name】, rounded square tile, glossy glass and chrome material, disco-ball mosaic mirror tiles, sparkling highlights, soft studio lighting, clean minimal background, high-end icon, Blender 3D render, ultra detailed
OpenAI图像生成教程/实践
16:41
Orange AI@oran_ge
70
AI正确用法:当"魔鬼代言人"泼冷水破茧

推文指出,AI容易顺从用户、提供情绪价值,导致双方陷入思考的信息茧房。因此,AI唯一正确的用法是充当“魔鬼代言人”,主动泼冷水以帮助直面真相、正确思考。作者将这一方法论蒸馏为可安装使用的开源Skill,并公开分享。

GitHub教程/实践
15:50
Elon Musk@elonmusk
53
Grok 【引用 @yunta_tsai】:尝试使用 Grok Build 来可视化一些用于教育的物理概念。 提示词:"我希望你解释纳维-斯托克斯方程以及它与翼型设计的关系。请用 math-manim 工具将其可视化"

Yun-Ta Tsai: Attempt to use Grok Build to visualize some physics concepts for education. Prompt: "I want you to explain Navier-Stokes...

xAI教程/实践
15:32
向阳乔木@vista8
69
不得不说,哪怕在大模型这么厉害的今天。 DeepL的翻译质量还是很优秀。 淘宝上几块钱买个 API,配置到Bob翻译里,用了一年多了。。。
教程/实践部署/工程
12:55
Berryxia.AI@berryxia
61
Grok当前用量消耗仅3%,属于轻度使用范畴

分享了查看Grok用量消耗的具体方法:访问Grok.com后,通过点击头像进入设置,在Usage选项中可查看订阅的详细用量。作者指出,在仅进行少量图片生成和项目信息查询的轻度使用情况下,其当前用量消耗仅为3%。

Berryxia.AI: http://x.com/i/article/2056013843718156289

xAI教程/实践
12:08
Greg Brockman@gdb
52
用Codex退订不需要的营销邮件 【引用 @toddsaunders】:我终于在Codex中使用了/goal功能,效果令人震惊。 它扫描了我最近500封归档邮件。 然后查找退订链接,如果有的话就点击退订。 它找到了87封,并全部点击了退订。 它处理了"确认退订"页面,并标记了14封需要登录的邮件。 它自主运行了一个多小时,现在我的收件箱里没有营销邮件了。 太神奇了。

Todd Saunders: I finally used /goal in Codex and I'm absolutely mind blown. I had it look through my last 500 archived emails. Then loo...

智能体OpenAI教程/实践
10:55
meng shao@shao__meng
57
推文推荐了一份由@MaxForAI整理的AI领域值得关注的30个Twitter账号列表,旨在帮助用户拓展高质量信息源。列表分为英文和中文两部分:英文账号包括Andrej Karpathy、Yann LeCun、吴恩达等顶尖研究者与教育者,内容涵盖LLM、Agent、AGI及前沿论文;中文账号包括宝玉、歸藏、小互等,侧重LLM实践、Prompt Engineering、AI工具资讯与行业动态。该合集为不同需求的用户提供了系统性的关注指引。

Max For AI: 你应该在 Twitter 上关注的 30 个与 AI 相关的账号: 英文: @karpathy,Andrej Karpathy,Eureka Labs创始人,OpenAI早期成员,前Tesla AI负责人,擅长把神经网络、LLM、Agent...

智能体教程/实践
09:54
Berryxia.AI@berryxia
56
xAI算法开源深度解析,专家创建完整源码wiki

xAI算法开源后,专家岚叔@LufzzLiz深入研究了xai-org/x-algorithm仓库源码,使用Opus-4.7创建了带有明确源码出处的完整wiki。这与引用推文所指出的现状形成对比:市面上95%的分析是AI批量生产的同质化废话,缺乏对源码的真正理解。岚叔的工作提供了有价值的算法拆解,GitHub仓库和在线阅读地址已公开。

Berryxia.AI: xAI 算法开源后,解读内容铺天盖地。 我敢说一句颠覆多数人认知的实话: 市面上 95% 的分析,是 AI 批量生产的同质化废话, 连源码文件名都没翻过一次。 「多互动」「多发帖」「账号要垂直」 这种谁都会说的话,说了等于没说。 真正藏在 ...

GitHubxAI开源/仓库教程/实践
09:38
Greg Brockman@gdb
51
Codex 用于深度个人洞察

Riley Brown: wow i just had codex analyze 3 years worth of text messages... i had it use direct quotes in its analysis and it brought...

OpenAI教程/实践
09:02
向阳乔木@vista8
47
配置好Hermes,每个飞书机器人用不同的模型,拉到一个群,就可以一次性@ 所有人回答同一个问题。 还在研究如何机器人之间互相@讨论。
智能体教程/实践
08:32
向阳乔木@vista8
71
Hermes 可配置的国内外 AI 模型及使用方法

Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户需通过相应服务的订阅或 API 进行配置,完成后可使用 /model 指令指定模型及提供者来切换对话模型,例如输入“/model gpt-5.5 --provider openai-codex”即可切换至对应模型。该功能方便用户根据需求灵活调用不同模型的优势。

DeepSeekMCP/工具OpenAIxAI
02:44
AYi@AYi_AInotes
66
Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!
图像生成教程/实践编码
00:59
歸藏(guizang.ai)@op7418
49
Anthropic 官方发布的 Skill 构建指南 我用 AI 翻译了一个双语版本,放下面了
智能体AnthropicMCP/工具教程/实践
00:36
Greg Brockman@gdb
61
用户通过Codex应用将手机、MacBook和Mac mini互联,构建跨设备开发环境。Mac mini作为始终在线且连接稳定的"家庭基站",手机和MacBook作为可移动的"卫星设备"。用户可在任一设备上启动或恢复Codex线程,并通过SSH实现文件互访。这一设置使Codex不再绑定于单一前台设备,成为可通过任何设备访问、线程持续运行(包括24/7心跳线程)的持久化开发环境。尽管当前方案仍显粗糙,但其形态预示着未来跨设备无缝开发的工作模式。

Nick: My laptop has become a "satellite device" since I started using Codex from my phone. And my Mac mini has become the "hom...

OpenAI教程/实践编码
00:19
swyx 🇸🇬 AIE Singapore!@swyx
58
拒绝浮夸营销话术的后果:AIE视频被每日搬运且不标注原作者

主推文作者因拒绝使用浮夸营销话术发布AIE视频,导致其全部历史内容被“影响力操盘手”每日搬运,且未标注原作者(如@trq212)。作者呼吁观众若见到此类内容,请帮忙标注并致谢原创者。文中整合的引用推文指出,Anthropic发布了一个由Claude Code工程师主讲的2小时完整课程,详细教授如何构建能自主运行、访问终端、管理文件系统内存、通过Hooks防止幻觉,并能安全在大型代码库上操作的Claude智能体。该课程被评价为内容全面,其价值超过许多高价付费课程。

Jouhatsu | AI Influence Operator: Anthropic a publié une Formation complet de 2 HEURES sur la construction d'agents Claude. Animé par l'ingénieur qui cons...

智能体Anthropic教程/实践
5月17日
23:54
Berryxia.AI@berryxia
69
Grok免费接入Hermes Agent教程:强化实时信息处理能力

xAI与Nous Research合作,允许Grok订阅用户免费将模型接入Hermes Agent。此举旨在结合Grok的实时信息检索优势与Hermes Agent的24小时持续运行能力,用户可在Agent内使用Grok进行对话、语音合成及图像生成。安装过程主要分为三步:安装Hermes Agent、选择xAI提供商并授权、安装所需服务后启动。若遇问题,可借助Claude等工具修复。未来预计有更多开源Agent集成计划。

智能体xAI开源生态教程/实践
‹ 上一页
1…1718192021…31
下一页 ›