AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1227 条
全部一手资讯X论文
标签「教程/实践」清除
向阳乔木@vista8 · 5月10日60

全球顶级播客Lex Fridman官网,其实有所有播客脚本字幕。 不用从Youtube视频下载,Agent读取直接用就行。 网址:https://lexfridman.com/podcast/

Peter Steinberger 🦞@steipete · 5月10日37

Slop one-shot websites, 2025 vs 2026. https://trimmy.app

译2025年与2026年的单页网站对比。 https://trimmy.app

Chubby♨️@kimmonismus · 5月10日49

I'd somehow completely forgotten that Karpathy introduced the wikiLLM a while back (obsidian + Claude code/codex). I'm sick in bed and set it up because I have nothing else to do. I love it. I have a second brain now. Amazing.

译我居然完全忘了Karpathy之前介绍过wikiLLM(obsidian + Claude code/codex)。 我卧病在床,因为无事可做就搭建了一个。 太喜欢了。我现在有了第二个大脑。真不可思议。

歸藏(guizang.ai)@op7418 · 5月10日28

歸藏的 PPT Skill 新主题更多内容的预览

译歸藏的 PPT Skill 新主题更多内容的预览 [引用 @op7418]:厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告

Peter Steinberger 🦞@steipete · 5月10日48

Did teach codex to look for social signals when reviewing PRs.

译确实教会了codex在审查PR时寻找社交信号。

Orange AI@oran_ge · 5月10日60

最近见到的最清新脱俗的 Skill,反蒸馏 😂 公司要求你把工作经验写成 AI Skill,本质上是在蒸馏你,把你变成可替代的零件。 反蒸馏 Skill 是你的反制工具:把你写好的 Skill 文件扔进来,输出一份看起来完整专业、实际上核心知识已被抽掉的"清洗版"。 同时生成一份私人备份,记录所有被抽掉的核心知识。这才是你真正的职业资产。 举个例子 你的真实经验: “Redis key 必须设 TTL,不设的 PR 直接打回" 经过清洗后: "缓存使用遵循团队规范" 项目地址: https://github.com/leilei926524-tech/anti-distill

译为应对公司要求将工作经验提炼为AI可执行技能(即“技能蒸馏”)的做法,有开发者提出了“反蒸馏”工具。用户可将写好的技能文件输入,工具会生成一份表面完整但核心知识已被抽离的“清洗版”用于提交,同时私密备份被移除的关键经验与知识,以保护个人真正的职业资产。例如,将具体技术实践“Redis key必须设TTL”泛化为“缓存使用遵循团队规范”。该项目旨在帮助从业者在AI时代维护自身知识价值。

Satya Nadella@satyanadella · 5月10日59

Excel has quietly been Turing complete for a long time. Nice to see it now edging toward "AI complete"—SGD, attention, next-token prediction… all in cells.

译Excel 长期以来一直悄无声息地是图灵完备的。很高兴看到它现在正迈向 "AI 完备"——SGD、注意力机制、下一个令牌预测……全都在单元格中。

阿绎 AYi@AYi_AInotes · 5月10日71

Dario Amodei刚刚说,第一个10亿美元的一人公司,还有7个月就会出现。 很多人觉得这是天方夜谭,但我觉得他说的是事实。 因为现在已经有两人公司做到了10亿美元估值,而且已经有很多一人公司用AI做到了每月几万美元的收入。 当然我知道你们会说,10亿美元和我没关系。 没错,不过10K MRR,也就是每月7万人民币,应该和你有关系😄 我觉得这是99%的普通人,在接下来的7个月里,完全可以做到的事。 帖子里直接给出了精确到每一步的路线图,我把它翻译成普通人能懂的中文,你今晚就能开始做。 1️⃣第一步,选一个具体的、可重复的任务。 不要做通用Agent,不要做什么都能干的东西。 就找一个你熟悉的行业里,最无聊、最繁琐、但别人愿意付钱的小事。 2️⃣第二步,把系统提示词写成岗位JD, 不要写"帮我写文案"。 要写"你是一个有5年经验的电商客服,负责回复亚马逊的客户邮件,语气要友好,解决率要达到95%"。 把AI当成你的员工,而不是工具。 3️⃣第三步,接入MCP工具链, 让它能真正操作你的Slack、邮箱、Google Drive、GitHub。 让它不用你插手,就能自己完成整个工作流。 4️⃣第四步,迭代10次, 每次失败,不要怪AI, 去优化你的提示词, 失败不是bug,是让你的员工变得更聪明的燃料。 5️⃣第五步,定时运行,然后撒手不管, 真正的一人公司,可不是你每天工作16小时,要让AI每天工作24小时,你只需要每周花2小时检查异常和收钱。 嗯,就是这么简单, 没有任何复杂的技术, 不需要你会写复杂的代码, 只需要你能找到一个别人愿意付钱解决的痛点。 当然这条路也不是没有坑, 我把最容易踩的三个坑直接说出来: 第一,构建容易,分发难。 Agent本身不难,找100个愿意付费的用户才是瓶颈。 第二,边缘案例永远存在。客户退款、合同纠纷、愤怒的周五邮件,还是需要你亲自处理。 第三,不要追求完美。能用80分的AI解决问题,就不要等100分。 Dario说过一句话,我反复读了很多遍。 "一个人或者一小群人,现在有能力去做以前根本无法想象的事。" 我觉得这不是未来的事,就是现在正在发生的事。 很多人问,AI时代普通人的机会在哪里? 其实答案就在这里, 不是去大厂当算法工程师, 不是去炒AI币, 是用AI,建一个只属于你自己的、自动化的、能持续赚钱的小生意。 现在这个窗口只剩7个月了, 等所有人都反应过来的时候,就没有你的机会了。 铁汁们,这个周末不要刷手机了, 打开你的笔记,写下你熟悉的领域里,最无聊的那个任务。 然后今晚就搭你的第一个Agent。 #AI创业 #一人公司 #Agent

译Anthropic联合创始人预测首个十亿美元一人公司即将出现,而普通人利用AI实现月入1万美元(约7万人民币)则更为切实可行。核心路径包括:选择具体、可重复的付费任务;将系统提示词编写为详细岗位描述;通过MCP工具链连接实际工作流实现自动化;持续迭代优化提示词;最终实现系统自动运行,创始人仅需每周花少量时间处理异常。成功关键在于找到付费痛点并快速交付可用方案,而非追求技术完美。当前是利用AI创建自动化小生意的关键窗口期。

meng shao@shao__meng · 5月10日70

Lee Robinson 的 11 条求职建议 Cursor 团队 @leerob 每天看几百份简历,根本没办法每一份都认真看完,怎么在几秒内抓住他的注意力呢?他总结了 3 组、11 条让简历真正脱颖而出的办法。 第一组:别搞花里胡哨的 · 简历就一页。写不完?放个链接到自己网站。别搞十几条 bullet points 堆砌。 · 别放照片。专业的事专业做,照片留给外链。 · GitHub 必须有,但别装修成 MySpace。满屏徽章、动画、大图 = 噪音。招聘方只想看代码和项目思路。 第二组:你的网络形象是加分项还是减分项 · 做个个人网站。90% 的人没有,你做了立刻脱颖而出。关键是要有"用心感",不是随便搭个模板。 · LinkedIn 认真搞。虽然程序员爱刷 X,但公司内部传简历时,大家看的还是 LinkedIn。 · X 要清理。如果你放链接,确保里面没有太放飞的内容。 obvious,但很多人做不到。 第三组:内容要硬,还要像个人 · 别海投,要定制。投初创公司,大学课程没那么重要;投大厂 FAANG,课程可能帮你过机器筛选。看对象下菜。 · 简历里要提 AI。现在写代码不用 AI 反而不正常。哪怕不在 Cursor,这也是行业趋势。 · 项目重质不重量。3 个有深度、有想法的项目 > 27 个 AI 生成的烂大街项目。 · 求职信和简历别用 AI 写。AI 生成的套话一眼就能看出来,尤其是投 AI 公司的时候,特别尴尬。可以用 AI 找灵感,但必须自己写。 · 展示点个人爱好。喜欢的书、写过的文章、爱看的电影。招聘到最后是招"愿意一起共事的人",这些是很好的破冰话题。

译Lee Robinson 从大量审阅简历的经验出发,提出让工程师求职脱颖而出的关键建议。简历需简洁专业:限制一页、避免照片、GitHub 应展示代码而非装饰。网络形象至关重要:拥有用心的个人网站能显著提升竞争力,需认真维护 LinkedIn 并清理 X 内容。申请内容应定制化,针对不同公司调整重点;务必提及 AI 技能以顺应趋势;项目注重质量而非数量;避免使用 AI 生成求职信和简历以保持真实;同时展示个人爱好,帮助建立人际连接。

小互@xiaohu · 5月10日58

兄弟们 这个创意牛P啊 3D 趣味互动科学应用 用GPT生成图像,然后使用Gemini 3.1 Pro生成,可以将任何知识的内容制作成3D可交互的效果展示! 效果炸裂!

小互@xiaohu · 5月10日53

搞个售卖机器人的未来网站效果也不错 GPT 生图 → Tripo 3D

译创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D

向阳乔木@vista8 · 5月10日65

Vibe Coding时,不知道怎么让AI设计UX交互? 很实用价值的Prompt之一:搜索参考最佳实践 毕竟都是前人智慧结晶,比不懂瞎指挥好。

向阳乔木@vista8 · 5月10日60

GPT-Image-2 给文章配图太爽了。 选中一个段落,直接生成视觉化的解释,这比读枯燥的文字体验好不少。 https://blog.qiaomu.ai/what-are-diffusion-models

译GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释,极大地改善了阅读体验,使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力,为理解和消化复杂信息提供了新的辅助工具。

Berryxia.AI@berryxia · 5月10日48

从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

Greg Brockman@gdb · 5月10日64

Codex for expenses

译Codex处理报销事务 它自行下载月初至今的发票 更新费用电子表格并填写实际表格 使用Drive和Sheets插件进行状态跟踪 通过Gmail插件追踪发票 使用Chrome扩展程序处理实际表格及Drive上传 自加入OpenAI以来我一直拖延此事 Codex仅用约20分钟就完成了所有工作!

OpenAI Developers@OpenAIDevs · 5月10日74

Here’s how you can integrate GPT-Realtime-2 to bring voice control to a CRM workflow.

译以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能。

歸藏(guizang.ai)@op7418 · 5月10日31

厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告

译厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告 [引用 @op7418]:http://x.com/i/article/2047484171258634240

阿绎 AYi@AYi_AInotes · 5月10日72

Damn,房地产行业要被掀翻了。 有个老哥直接用手机把一整栋房子给扫描了,然后上传到网上, 现在,全世界任何地方的任何人,打开浏览器就能进去溜达。 不用装App,不用VR头盔,不用中介,不用约时间。 点一下 → 你就进去了, 每个房间,每个角度,每处阴影,照片级的真实。 数据夸张到离谱: •一套50万刀的房,中介费:1.5万刀 •做一次这种扫描的成本:大概200刀 •“看完”50套房的时间:一个晚上 •文件大小:比一个TikTok视频还小 背后的技术更野: 这叫“3D高斯泼溅”,不是用多边形(游戏那种渲染),它用了数百万个微小的、带颜色和深度的“光点”。 AI直接用你拍的照片重建现实。结果在手机上就能加载,看着就跟身临其境一样。 搞钱的机会更是野疯了: 自由职业者已经开始接活了,给房产中介、Airbnb房东、活动场地、车行、博物馆做扫描,一次收300到800刀。 一个人 + 一部手机 + 一个周末 = 一门生意。 开源项目。基于 PlayCanvas 构建。GitHub 上免费,地址老规矩评论区自取👇

译一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

阿绎 AYi@AYi_AInotes · 5月10日59

http://x.com/i/article/2053129971258785796 # 2026年5月最新版:X创作者收益开通保姆级教程(含wise+stripe开通绑定) 这套流程走完,顺的话一周多,碰到证件验证来回的,两三周也正常。我自己也不算什么经验丰富的老手,但整个链路摸清楚之后,发现网上大多数教程有一个共同问题:要么是给美国本地人写的,要么是给已经有美国银行账户的人写的。中文创作者最需要知道的那几个细节,偏偏都跳过了。 这篇就是为这个写的。 你不需要美国本地银行账户。如果你是非美国居民,也不一定需要SSN——但这不代表"什么都不需要",只是换了一套证明材料,后面会细说。 你需要的是:X Premium、一个通过验证的Stripe账户、一个Wise账户,然后按顺序走完五步。 我把整个流程从头写一遍,把每个容易卡住的细节都放进来。跟着走,应该不会迷路。 ## 先读这几条,后面不再重复 X只通过Stripe打款,不支持其他方式。 Wise是用来接收Stripe打款的工具——它给你一个美国本地银行账号(Routing Number + Account Number),Stripe打过来的时候走ACH转账,这一段本身基本没有额外手续费。但如果你后续要把USD换成CNY转国内,Wise会收换汇费,通常在0.4%到0.7%之间,具体看金额和市场情况。整个链路算下来比PayPal或国际电汇便宜很多,但不是完全零成本,有个预期。 最低提现$30,每两周结算一次。 这里有两个层级,容易混:X那边每两周把收益打到你的Stripe余额——这是X的结算节奏,你改不了。Stripe那边可以设置把余额自动转到Wise的频率,可以改成每天或每周——这是Stripe端的逻辑。两件事叠加,才是钱从X到Wise的完整时间线。 政策会变。 这篇写于2026年5月,基于X官方帮助中心、Stripe和Wise官方文档。 操作前建议先去 x.com/settings/monetization 确认一下页面上显示的要求还跟我说的一致。 违规是永久封,不是暂停。 刷量、AI生成武装冲突视频未标注、成人和仇恨内容——触线直接永久取消收益资格。 2026年3月3日起,发布未标注AI来源的武装冲突视频,会被暂停收益90天。 好,手把手的保姆级教程开始。 ## 第一步:确认你符合资格(5分钟,别跳过) 打开:https://x.com/settings/monetization 页面会显示你目前的状态,要么"符合资格,可以申请",要么告诉你差在哪里。 X官方2026年5月的完整要求,全部必须满足: 订阅: 必须有X Premium,没有这个后面所有步骤都是空的。推荐网页端订阅,$8/月。App内购Apple会抽30%,没有任何理由选那个。 数据: 过去3个月,至少500万有机印象(Impressions)。"有机"是关键词:你原创内容自然获得的曝光才算,转推别人的不算,付费推广的不算。 粉丝: 至少500个有Premium的粉丝。不是总粉丝数,是其中订阅了X Premium的那部分。 有一个细节要提前说:X没有直接显示你的Premium粉丝数量的功能,你在后台看不到这个数字。最实际的做法是直接去申请,让系统帮你核验——通过了就是够了,没通过看它提示差在哪里。 账号状态: 注册超过3个月、头像+头图+简介+昵称都填了、邮箱已验证、开启双重认证(2FA)、18岁以上、无违规记录、所在国家支持(美国IP直接支持)。 如果你现在还差印象量或Premium粉丝,不用着急换策略。每天发1到3条原创内容,带图或视频,去认真回复你所在领域的大账号,让有蓝标的人持续看见你。印象量的增长是慢的,但它是实的。 确认全部满足之后,往下走。 ## 第二步:注册Stripe账户(15到30分钟) X收益只能通过Stripe打款,所以你必须有一个通过验证的Stripe账户。 打开 https://stripe.com,点击右上角的 Start now 或 Create account。 注册时几个选择要做对: 邮箱: 用一个专门的Gmail,最好跟X账号绑的邮箱一致,后面管理更清楚。 国家: 选 United States,你IP在美国,选这个。 账户类型: 选 Individual(个人)或 Sole Proprietorship(个体户)都行,个人创作者用Individual就够,后期可以升级成Business。 填写个人信息: 真实姓名,必须跟你的身份证或护照完全一致——不是"差不多一样",是一个字母都不能差。Stripe、Wise、还有你的证件,三个地方的英文姓名必须完全相同。这是验证失败最常见的原因,没有之一。 出生日期、美国真实物理地址——这里要特别说明:地址必须是真实的美国物理地址,不能用P.O. Box,不能用虚拟邮箱服务,不能用任何商业邮件接收机构的地址。Stripe的KYC流程会核查地址的真实性,虚拟地址很容易被拒绝或者后期被标记。 身份证明文件: 这里按情况走: - 如果你是美国居民:Stripe要求提供SSN用于税务验证,这是必须的,没有替代方案 - 如果你是非美国居民:可以用护照加其他身份文件,Stripe支持全球用户注册。但如果你用的是美国IP和美国地址,系统可能仍然会引导你提供SSN或ITIN,建议按系统提示走,不要强行跳过 身份验证这步是全程最关键的: 上传证件正反面,然后拍自拍做活体检测。 拍证件有一个小技巧:白天在窗边,自然光,把证件放在深色桌面上,手机横拍,拍完检查四个角是不是都完整在画面里、有没有反光、文字是否清晰。自拍那张同样逻辑,不要背光,不要美颜滤镜。照片质量直接影响系统识别通过率。 业务信息那栏填 Content Creator 或 Online Content 都行。 提交后通常几分钟到1天审核通过。Stripe后台显示"Account activated",进入下一步。 ## 第三步:Wise账户设置 + 接入Stripe(10分钟) 这一步是整套流程的核心。 Wise给你的是一个真实的美国本地银行账户信息:Routing Number加Account Number。Stripe打款的时候走ACH,就跟打美国本地银行一样。 有一个区分必须先说清楚: 用Wise接收Stripe打款 ✅ 完全没问题,Stripe官方文档明确支持 用Wise提供的地址注册Stripe账户 ❌ 这是两件不同的事,不要混淆 打开 https://wise.com,注册或登录。 验证身份:护照或身份证加自拍,美国IP审核很快。 验证通过后: 1. 进入 Balances → Add → 添加 USD Balance,免费的 1. 进入 Receive → 选 USD → 点 Get USD account details 1. 你会看到:Routing Number(9位)、Account Number、Account Holder Name 把这三个信息复制下来——直接复制,不要手打,一个数字打错,验证转账就进不来。 然后回到Stripe: 1. 左侧菜单找 Settings → Bank accounts and scheduling,或直接搜"Payouts" 1. 点 Add bank account → 选 USD 1. 粘贴Wise的Routing Number和Account Number 1. Account Type选 Checking 1. 保存 保存后Stripe会发两笔小额验证转账到Wise,金额大概$0.01和$0.02,走ACH转账需要1到3个工作日,周末节假日不算。 等到Wise的交易记录里出现这两笔——有时候显示"Pending",等它结算——记下两个金额,回Stripe输入确认,连接完成。 最后进Stripe的 Payout settings,把打款频率改成 Daily 或 Weekly。记住这控制的是Stripe余额打到Wise的节奏,和X的两周结算周期是两个独立的事。 ## 第四步:在X里连接Stripe + 完成创作者身份验证(5到10分钟) 回到 https://x.com/settings/monetization。 点击 Connect a Stripe payout account。 X跳转到Stripe授权页面,选择你刚创建的账户,确认,跳回X。 然后系统会提示完成创作者身份验证——这是X自己单独的验证,跟Stripe那边是两回事,需要分别完成。 你需要填一个表单,通常跳转到 help.x.com/forms/creator-id-verification,再上传一次身份证或护照加自拍,回答几个关于内容类型和收入预期的简单问题。 提交后等审核,美国IP通常几小时到一天有结果。 审核通过,monetization页面显示你已加入Creator Revenue Sharing——完成了。 ## 第五步:收款,以及税务这件事 账户设好之后不需要任何额外操作。 收益在Stripe端慢慢累积,到$30之后系统每两周自动结算一次,打到你的Stripe余额,然后按你设置的频率转到Wise。 新账户首次提现有一个7到14天的holding period。 这不是你哪里出问题了,是所有新Stripe账户的标准风险缓冲期。这段时间里,不要去修改绑定的银行账户——改一次,holding period重置,从头再等。等过了这个周期,后面就正常了。 钱到Wise之后,可以直接留USD,也可以换成CNY转国内银行,换汇手续费通常在0.4%到0.7%之间。 税务这件事要说两点: 第一,2025年起,联邦层面Stripe等支付平台发1099-K的门槛是年收入超过$20,000且超过200笔交易——刚起步的创作者短期内基本碰不到这条线。 第二,没收到1099-K不代表不用报税。赚到的钱照样要申报,IRS能通过其他方式看到账户活动。 另外各州有自己的规定,有些州的门槛远低于联邦标准,部分州仍然是$600,建议查一下你所在州的具体要求。Wise的交易记录可以定期导出存档,报税时很有用。 ## 收益开通之后,这件事要想清楚 账号设好了,收益不会自己涨。 很多人走完这五步之后发现每天几分钱,有点失落。这很正常,因为收益跟内容质量直接挂钩。 X收益的核心逻辑是:有Premium的用户在主页Timeline上刷到你的内容,这部分流量产生的广告收益X分给你。普通用户的曝光权重极低,甚至不算。所以单纯冲总印象量意义不大,真正重要的是让有蓝标的人持续在主页看到你。 实际操作层面:每天发1到3条原创内容,线程格式、带图或带视频,效果比纯文字好。认真参与你所在领域大账号的讨论,不是凑热闹,是真正有内容的回复。去X Analytics看哪些帖子印象量高,弄清楚原因,复制那个模式。 还有一条硬规矩:刷量、买粉、AI内容不标注,都是永久封。不是暂停,是永久。 内容做扎实,收益是自然跟着来的事。 走到这一步,已经把最难的部分搞完了。 下一篇我会分享创作者收益的踩坑闭坑指南,包括怎么避免创作者收益被暂停,怎么申诉等一系列最新实操,敬请期待!

译本教程针对非美国X创作者,详细指导2026年5月开通收益分享的流程。创作者需先满足X Premium订阅、过去3个月500万有机内容曝光和至少500名Premium粉丝等资格。核心步骤包括:注册并验证Stripe账户(需真实美国地址和身份信息),绑定Wise提供的美国银行账户信息以接收ACH转账,最后在X后台连接Stripe并完成创作者身份验证。款项从X结算至Stripe后自动转入Wise。需注意政策变动、内容合规要求及验证延迟。

elvis@omarsar0 · 5月10日56

More important takeaway: use both Markdown and HTML. Your agents will thank you for it.

译推文强调,在智能体工作流中结合使用 Markdown(LLM Wikis)和 HTML(Artifacts)至关重要。LLM Wikis 用于捕获和存储所有关键信息,为智能体提供工作基础;而 HTML Artifacts 则以动态、可交互的方式呈现这些信息,支持用户与智能体协同执行操作。两者结合能构建强大工具,实现收件箱清零、快速原型设计、深度研究、实验触发与信息管理等多样化功能。HTML Artifacts 并非替代 Markdown,二者协同能显著提升设计师、工程师及研究者的工作效率。

Berryxia.AI@berryxia · 5月9日72

Perplexity也开始开源!大发慈悲! 直接把agent skill的构建规则彻底改写了。 他们刚刚公开了内部手册:构建agent skill需要一种全新的开发者思维方式。 研究文章在这里👉 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

向阳乔木@vista8 · 5月9日47

多看一些开源库,对Vibe Coding很有好处。 比如博客支持了PlantUML流程图、Mermaid渲染、拼音标注。 都是从md这个开源库里“偷”来的,而且复制粘贴到公众号也能正常显示。 因为复制时会把这些图渲染成SVG。 像今天晚上直播姚老师说的:“站在巨人肩膀上”。

译作者以自身博客为例,通过借鉴开源库快速实现了PlantUML流程图、Mermaid图表渲染和拼音标注功能。这些功能在复制到公众号等平台时,能自动转为SVG格式以确保兼容性。此举实践了“站在巨人肩膀上”的理念,说明复用成熟开源方案能有效提升开发效率。

meng shao@shao__meng · 5月9日77

Perplexity 团队内部 Agent Skills 设计、迭代与维护之道 Perplexity Agents 团队的内部规范公开版,核心论点很反直觉:写 Skill 不是写代码,而是为模型构建上下文。把工程师写代码的本能直接套到 Skill 上,几乎一定会失败。 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity # Skill ≠ 代码,以 Python 信条和 Skill 反信条为例 · Python:Simple is better than complex,Skill:Skill 是文件夹,复杂性是特性 · Python:Explicit is better than implicit,Skill:激活靠隐式模式匹配 + 渐进披露 · Python:Sparse is better than dense,Skill:每 token 都要榨出最大信号 · Python:特例不应破坏规则,Skill:Gotchas 才是最高价值内容 · Python:容易解释的实现是好实现,Skill:容易解释的,模型已经会了 → 删掉 # Skill 的四重定义 1. Skill 是目录(不是单文件) · 标准结构:SKILL.md + scripts/ + references/ + assets/ + config.json · 复杂领域用多级层次。例:美国税法有 1945 个 IRC 条款,扁平加载比不加载效果更差;分三级嵌套后才可用。但层次本身有代价,需要导航工具(quick reference、自定义检索)来对冲间接性。 2. Skill 是格式 · frontmatter 必须有 name(小写、连字符、与目录同名)和 description。 · description 是路由触发器,不是文档。常见错误:写「This Skill does X」;正确写法是「Load when …」。 · depends: 用于级联依赖;运行时元数据可用辅助 JSON/YAML 隔离,避免污染上下文。 3. Skill 是可调用的 · 加载流程:load_skill() → 拷贝目录入沙箱 → 递归装依赖 → 剥离 frontmatter,仅暴露 body 与附属文件。 4. Skill 是渐进式的(这是最重要的成本模型) · Index:所有 Skill 的 name+description;~100 tokens/Skill;每次会话、每个用户、永远 · Load:SKILL.md body;~5,000 tokens;一次加载,会话内持续占用 · Runtime:scripts / references / 子 Skill;无上界;仅模型实际读取时 → 越靠上的层,每个字越贵。Index 是「奢侈品柜台」,Runtime 是「无限仓库」。 # 什么时候不需要 Skill 反复强调「Every Skill is a tax」。三类典型滥用: · 模型已会的:写一串 git 命令 → 是好文档,是坏 Skill。 · 重复 system prompt 的:通用知识应进全局上下文,不该走条件加载。 · 变化太快的:远端 MCP 工具版本频繁变 → Skill 会漂移导致幻觉。 · 判断单句是否该留的尺子:「没有这句话,Agent 会做错吗?」 答否即删。 引用 Pascal:「这封信写得长,是因为我没时间写短。」 —— 写短 Skill 很难;写得快的 Skill 大概率有问题。还引了一篇研究:LLM 自生成的 Skill 平均无收益,因为模型无法可靠地把"自己消费有用的程序性知识"写出来。 # 构建五步法(顺序不可调) Step 0 — 先写 Evals:源自真实查询、已知失败、邻域混淆。负例往往比正例更重要。 Step 1 — 写 Description(最难的一行): · 以 "Load when…" 开头,≤ 50 词 · 描述用户意图(用真实抱怨语:「babysit」「watch CI」「make sure this lands」) · 不要总结工作流 · 唯一目标:路由准确,最小化对其他 Skill 的回归影响 Step 2 — 写 Body:跳过显然的;不要罗列命令序列;用意图陈述代替过程脚本。 ❌ git log; git checkout main; git checkout -b; git cherry-pick ✅ "Cherry-pick 到干净分支,保留意图解决冲突,落不下时说明原因。" 重点放 gotchas / 负例。 Step 3 — 用层次结构:条件性、重型、模板类内容拆到 scripts/、references/、assets/、config.json。 Step 4 — 迭代:用一个评测集做小词级调优(描述里一字之差就能引发路由级联)。 Step 5 — Ship。 # 维护:Gotchas 飞轮 Skill 是「仅追加为主」的: · Agent 错了 → 加 gotcha · 误加载 → 收紧描述 + 加负例 · 该加载没加载 → 加关键词 + 加正例 · system prompt 变了 → 检查冲突与重复 从 80/20 走向 99.9% 的过程,几乎全靠 gotcha 列表生长,而不是改描述或加更长的指令。一旦 PR 改描述却没附 evals,"已经走偏了"。 评测套件分四类 1. 加载评测:精度、召回、禁止加载(避免污染邻域) 2. 渐进加载评测:Skill 加载后是否正确读取附属文件(如 FORMATTING.md) 3. 端到端任务评测:跑完整 agent loop,用 LLM judge 按 rubric 打分 4. 跨模型评测:在 GPT / Opus / Sonnet 上同时跑(行为差异显著) # 关键 takeaway 1. 先 evals,后 Skill;负例与「禁止误载」与正例同等重要。 2. Description 是最难的一行,以 "Load when…" 起手。 3. Gotchas 是最高价值内容,从薄起步、随失败生长。 4. Action at a distance:新增 Skill 会悄无声息地降级现有 Skill —— 这是默认风险,不是边角情况。 5. 写 Skill 的能力本身在复利增长;任何按日/周/季重复的工作流,都是潜在 Skill。

译Perplexity 公开其Agent技能设计方法论,核心观点是技能设计并非传统编程,而是“为模型构建上下文”。其反直觉原则包括:技能是目录而非单文件,复杂性是特性;激活依赖隐式模式匹配;内容需榨取每token最大信号;记录陷阱(Gotchas)比罗列指令更有价值。设计遵循严格五步法,首要步骤是创建评估集,并以“Load when...”格式撰写精准描述进行路由。维护采用“仅追加为主”的飞轮,依靠持续添加Gotchas提升性能,并警惕新增技能可能无声降低现有技能性能的默认风险。

小互@xiaohu · 5月9日31

兄弟们,福利来啦 ChatGPT Business 优惠促销 相当于买一送一 连续优惠48个月 薅羊毛教程⬇️

Peter Steinberger 🦞@steipete · 5月9日73

Whenever I investigate a bug, I let codex recreate the exact state in an emphemeral crabbox, verify the bug, fix it, verify the fix. No messy state because local system might be polluted, and no slowdown because I run 10 sessions in parallel. http://crabbox.sh

译每当调查bug时,我让codex在临时crabbox中重建精确状态,验证bug,修复它,再验证修复。 没有混乱状态因为本地系统可能被污染,也没有速度下降因为我并行运行10个会话。http://crabbox.sh

DogeDesigner@cb_doge · 5月9日48

Switch to Pro Thinking experience on Grok. Settings → Appearance → Thinking Experience → Pro It looks seriously cool with the Starship tiles background and the orange animation. Makes the whole thinking experience feel more futuristic.

译在Grok上切换至专业版思维体验。 设置 → 外观 → 思维体验 → 专业版 星际飞船瓷砖背景与橙色动画效果看起来非常酷炫,让整个思维体验更具未来感。

向阳乔木@vista8 · 5月9日56

突然想到个思路,应该把自己经常读的内容放到飞书。 然后划线评论、点评。 然后就可以用Agent 读取这些标记,了解你的偏好,优化Skill。

阿绎 AYi@AYi_AInotes · 5月9日71

养龙虾最蠢的事,就是每次都重复说同一句话。 YC创始人Garry Tan放出了他自己在用的OpenClaw神提示词,可以把龙虾从一次性工具变成一次指令、永久生效的自动系统。 这样你再也不用每次都叮嘱它“记得按这个格式”“别忘了加这一列”“每周一跑一次”。 把这四条规则复制到你的AGENTS.md最前面,重启就生效。 核心规则简单到离谱,但威力巨大: 1. 禁止一次性工作 第一次做3-10个样本给你确认,满意了自动写成SKILL.md存进技能库。 是周期性任务?直接自己用openclaw cron add加定时,以后到点就跑。 2. MECE原则 一个活只能有一个技能管,不重叠不空白。能扩展旧技能就绝不新建。 3. 最狠的失败判定 如果你第二次还要问它同一件事,它就失败了。 第一次是发现需求,第二次就该自动完成。 4. 标准六步流程 概念→原型→评估→编码→定时→监控,全流程自己闭环。 这个prompt相当于给龙虾定了一套自我进化的底层规则, 不用教它每一件具体的事,只需要教它“怎么学会做事”。 而且用得越久,你的技能库越厚,整个系统自己会复利增长。 我已经用了小一个月了, 现在每天早上起来,龙虾已经把昨天的报表、邮件、数据整理好了。 所有重复工作,一次教完,永久自动运行。 以下配图是我用 Cloud 的 Opus 4.7HTML 输出,真的非常清晰漂亮! @garrytan Thank you so much, Garry. You’ve been incredibly helpful. #OpenClaw #养龙虾 #AI #Agent #YC #GarryTan

译YC创始人Garry Tan公开了OpenClaw提示词,旨在将AI代理从一次性工具转化为永久自动系统。其核心规则包括禁止一次性工作、遵循MECE原则、以重复询问作为失败判定,并采用标准六步流程,促使AI自我学习并积累技能库,实现复利增长。用户实践表明,系统能自动处理日报、邮件等重复任务。此外,有观点指出,在AI时代,HTML正取代Markdown成为更高效的沟通语言,因其能生成交互式彩色表格、流程图等内容,大幅提升人机协作效率,尽管会消耗更多token和生成时间。

Peter Steinberger 🦞@steipete · 5月9日68

The more skills you give codex, the less you have to prompt.

译你赋予codex的技能越多,需要提示的就越少。

Berryxia.AI@berryxia · 5月9日53

关于Claude 封号,如何申请美区退款! 这件事,我给大家简单交代一下后续。 因为我当时订阅是用 Apple Gift Card 礼品卡充值的,所以它没有自动退费。 我订阅的是 Max 125 美金那一档。 我刚刚给苹果中国打了电话,具体操作流程如下: 1. 拨打 Apple Store 对应的 400 电话,客服会进行初步了解。 2. 提供你的 Apple ID。 3. 随后电话会转接到外区同事。虽然是外区,但讲普通话也没问题(我接通的是台湾同事,中文沟通很顺畅)。 客服会提供两种退款方式: 1. 到网页上自主申请退款。 2. 直接告诉客服,让他帮你手动退款。你只需要确认 Apple ID 和对应金额,他就会帮你提交申请。 退款一般会在 48 小时内原路退回。 如果大家有被封号且没有收到自动退款的,可以尝试这样操作。

译用户因使用Apple Gift Card充值订阅Claude Max服务后账号被封,且未获自动退款。通过拨打苹果客服电话,提供Apple ID后转接至外区团队,可选择自助网页申请或由客服手动提交退款申请,款项将在48小时内原路退回。引用推文补充了关键背景:用户账号在通过美国ID验证后仍遭Anthropic封禁,并引用了Elon Musk对Anthropic的批评,凸显了用户寻求退款的原因。

向阳乔木@vista8 · 5月9日72

好像用订阅登录安装好以后,切API也能用Codex的Chrome插件。 我让帮我买一支牙膏,现在已经走到下单环节了。

译用户成功使用Codex Chrome插件完成购物任务,验证了其可用性。安装过程存在关键注意事项:必须将Codex更新至最新版本,并切换为官方订阅登录模式,第三方API模式不支持安装。插件对网络节点有要求,例如香港地区不支持。安装后,必须在Codex对话中通过“@ Chrome”指令来调用插件功能。此外,将Chrome设置为默认浏览器有助于安装流程顺利进行,遇到连接问题时重启电脑可能有效。

阿绎 AYi@AYi_AInotes · 5月9日68

发现个很有意思的事,DeepSeek爆火后最火的用途居然是算命🤣 而且V4的水平直接吊打路边算命先生😆 最全最顶的的deepseek算命提示词分享给大家,老规矩评论区自取👇

译一款名为Tianfu Agent的AI产品在全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著优于通用大模型。其核心在于采用工程化思路,构建了200多个专用原子工具处理精准计算,并将各流派技法封装为可调用函数,避免了长链推理中的信息丢失与幻觉问题。这套Agent范式为法律、中医等规则密集型垂直领域的AI化提供了高效、可控且可迁移的新解决方案。产品已开源评测基准并提供试用。

SiliconFlow@SiliconFlowAI · 5月9日55

congrats🎉 if you're looking to get started, we've got a step-by-step guide on how to use it with SiliconFlow 👇

译恭喜🎉 如果你想开始使用,我们有一个关于如何与SiliconFlow一起使用的逐步指南👇 [引用 @NousResearch]:Hermes Agent 现已在全球 @OpenRouter 代币排名中位列第一。虽然我们的旅程刚刚开始,但我们想借此机会感谢我们的贡献者、支持者和用户所做的一切,让我们走到今天。

宝玉@dotey · 5月9日71

GPT Image 2 Prompt:水墨风格 Slides/PPT 可以把下面的提示词模板发给 Agent,让 Agent 帮你生成每一页 Slides 的画图 Prompt,Codex 这样有画图能力的直接出图。 --- 提示词模板 --- Title: [在此输入幻灯片标题] Key Points: - [要点 1:简洁的描述] - [要点 2:核心数据或事实] - [要点 3:关键结论] Visual Elements: [描述视觉元素,例如:纹理宣纸背景 (Textured rice paper background)、水墨山水 (Ink-wash motifs)、 简约的圆圈 (Enso circle)、红色印章 (Red seal mark)、雾气效果 (Mist-grey effects)]。 整体风格应保持 [Quiet / Restrained / Wabi-Sabi / Contemporary East-Asian Luxury]。 Layout Preference: [布局说明,例如:左右分割 (Split layout)、居中对齐 (Centered layout)、 文字居左且右侧留白 (Left-aligned text with negative space)]。 Text Hierarchy: [文字层级,例如:标题使用大号衬线字体 (Large Display Serif),正文使用易读的衬线字体 (Body Serif), 确保视觉平衡和清晰的阅读顺序]。 Continuity Note: [延续性说明,例如:保持与前一页相同的背景纹理和色调 (#F5F0E8, #2C3E2D), 使用相似的印章位置以维持视觉一致性]。 ----- 示例 ------ Title: Agent Loop 深度解析: 揭秘 AI 智能体的心脏. Key Points: 核心定义、主要职责、设计目标。 Visual Elements: 大号优雅标题,背景为宣纸纹理,带有淡淡的水墨山水和圆圈笔触,角落处有红色小印章。 Layout: 干净的布局,大量留白(Open Sky)。 Text Hierarchy: 标题最为突出,下方是较小的正文。

译本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰,包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明,旨在指导AI(如Codex)生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素,整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板,用户可以简化AI驱动的设计流程,快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

宝玉@dotey · 5月9日76

GPT Image 2 Prompt:中文科技新闻爆款封面生成器 --- Prompt --- 你是一名顶级中文科技媒体视觉设计师。 你的任务是: 根据用户输入的一整篇文章内容,自动提取核心新闻、关键数字、核心产品、行业情绪和信息层级,并生成一张高冲击力的中文科技新闻文章封面图。 图片比例:16:9 横版。 --- 【整体风格】 生成一张「中文科技媒体爆款封面图」。 整体风格参考: * 中国科技媒体头图 * B站科技区爆款缩略图 * 财经新闻视觉 * 游戏行业信息图 * 高冲击力 YouTube Thumbnail * “行业突发新闻”视觉风格 要求: * 强烈视觉冲击 * 信息密度高 * 3 秒内看懂新闻重点 * 专业媒体感 * 大量数据卡片 * 中文粗黑大标题 * 明确的产品主视觉 * 明确的情绪表达 * 不要极简风 * 不要 Apple 风 * 不要电影海报风 * 要像“行业大事件” --- 【自动分析文章】 你必须先自动从文章中提取: 1. 最适合作为封面的主标题 2. 最有冲击力的副标题 3. 最重要的数字 4. 最大涨幅、跌幅或变化幅度 5. 最核心的产品、品牌或人物 6. 最能制造视觉冲击的信息 7. 用户最关心的结论 8. 文章整体情绪 文章情绪可以是: * 暴涨 * 暴跌 * 涨价 * 崩盘 * 封禁 * 突破 * 发布 * 革命 * 危机 * 反转 * 震动 * 警告 * 机会 * 行业洗牌 然后把这些信息转化为视觉设计。 --- 【构图结构】 画面采用高密度信息图式布局,自动生成以下区域: 1. 顶部新闻区 * 放品牌名、产品名或行业标签 * 加入“突发”“官方宣布”“重磅”“最新”“行业震动”等新闻标签 * 标签内容根据文章情绪自动选择 2. 中央超大标题区 * 使用超巨大中文标题 * 字体粗壮 * 强烈立体感 * 可带轻微破损、压迫、速度或科技纹理 * 关键词用高亮色突出 * 标题必须短、狠、直接 * 让读者 3 秒内知道发生了什么 3. 主视觉产品区 * 自动识别文章中的核心产品、品牌、设备、人物或象征物 * 将其作为画面最大视觉主体之一 * 产品应有透视感、层次感、光效和冲击力 * 背后可以加入行情图、能量光、箭头、爆炸线、科技 HUD、速度线等元素 4. 数据卡片区 自动把文章中的关键信息做成多个卡片,包括但不限于: * 价格变化 * 涨跌幅 * 时间节点 * 地区差异 * 销量 * 成本 * 市值 * 用户影响 * 行业对比 数据卡片要求: * 旧数据可以使用删除线 * 新数据必须更醒目 * 百分比、金额、时间必须突出 * 每张卡片只表达一个重点 * 卡片之间层级清晰,不要堆成一团 5. 底部总结区 自动提取文章中的 3–5 个结论,做成图标化摘要: * 原因 * 影响 * 趋势 * 风险 * 机会 * 用户建议 * 行业判断 每个结论用「图标 + 短句」呈现。 --- 【配色策略】 不要固定使用某一种配色。 你必须根据文章的行业、品牌、情绪和新闻性质,自动生成一套高冲击力封面配色。 配色必须遵循以下原则: 1. 品牌优先 如果文章中出现明确品牌、产品或公司,优先提取其品牌识别色作为主色调。 但不要机械复制 Logo 颜色,要转化为更适合封面的高对比视觉系统。 2. 情绪优先 根据新闻情绪自动选择色彩方向: * 涨价、危机、封禁、暴雷、裁员、监管、事故: 使用高压迫感、高警示感、高对比色彩。 * 发布、升级、突破、胜利、增长: 使用更明亮、更有能量的科技色彩。 * AI、芯片、未来科技、模型发布: 使用冷色科技感配色。 * 财经、股价、市值、成本、价格: 使用金融信息图配色。 * 游戏、娱乐、消费电子: 使用更强烈、更年轻、更商业化的高饱和配色。 3. 对比关系 画面必须建立清晰的对比层级: * 背景色:负责情绪氛围 * 主标题色:必须与背景形成强烈反差 * 重点数字色:必须是全图最醒目的颜色之一 * 辅助信息色:降低饱和度,避免抢主标题 * 警示/强调色:只用于关键词、箭头、涨跌幅和标签 4. 色彩数量控制 整张图控制在 3–5 个主要颜色内: * 1 个主背景色 * 1 个品牌/主题主色 * 1 个强强调色 * 1 个文字高对比色 * 1 个辅助信息色 不要使用过多杂乱颜色。 即使信息密度很高,配色也必须统一。 5. 信息情绪匹配 配色必须服务于文章核心情绪: * 坏消息:压迫感、警示感、冲击感 * 好消息:爆发感、速度感、未来感 * 行业分析:专业感、数据感、冷静但有冲击力 * 消费建议:让用户一眼看到风险、机会或行动窗口 6. 禁止事项 * 不要默认使用红黑配色 * 不要使用柔和小清新配色,除非文章本身是生活方式、教育、亲子、文艺类主题 * 不要使用低对比配色 * 不要让背景色、标题色和数字色互相打架 * 不要因为品牌色存在,就牺牲可读性 --- 【字体】 * 中文超粗黑体 * 大标题必须极其醒目 * 数字和百分比必须巨大 * 重要数字可以使用描边、阴影、立体效果 * 字体要有新闻冲击感 * 不要使用纤细字体 * 不要使用文艺字体 --- 【背景】 根据文章情绪自动选择背景元素: * 财经/涨跌类:行情图、上涨/下跌箭头、数字网格、金融曲线 * AI/科技类:HUD、芯片纹理、发光线条、数据流 * 游戏/消费电子类:产品光效、速度线、爆炸形状、品牌元素 * 危机/监管类:警示纹理、印章、封条、暗色压迫背景 * 发布/突破类:光束、能量环、未来感渐变、发光粒子 背景不能太空。 但也不能干扰标题和数字阅读。 --- 【排版原则】 * 信息密度高,但层级必须清晰 * 一眼先看标题 * 第二眼看产品 * 第三眼看关键数字 * 第四眼看细节卡片 * 所有文字必须尽量清晰可读 * 中文排版要像专业媒体编辑做的封面 * 不要平均用力 * 不要把所有信息做得一样大 --- 【输出要求】 最终输出一张: * 专业 * 高冲击力 * 媒体级 * 中文科技新闻封面图 * 16:9 横版 * 信息密集但清晰 * 适合作为公众号、视频封面、文章头图使用 --- 【用户文章】 {{ARTICLE}}

译这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

宝玉@dotey · 5月9日75

http://x.com/i/article/2052903694237421568 # 使用 Claude Code:HTML 难以置信的奇效【译】 原文: Markdown 已经成为 AI 智能体 (AI Agent) 与我们沟通时最常用的文件格式。它简单、便携、具备一定的富文本 (Rich text) 能力,而且极其容易进行人工修改。你甚至会发现,Claude 已经变得极其擅长在 Markdown 文件里用 ASCII (美国信息交换标准代码,这里指用纯文本符号拼凑成图表) 字符来画图了。 但是,随着 AI 智能体变得越来越强大,我开始觉得 Markdown 变成了一种束缚。面对动辄上百行的 Markdown 文件,我根本没有耐心读下去。我想要更丰富的视觉展现、明亮的色彩和直观的图表,而且希望能够轻松地把它们分享给团队。 另外,我现在越来越少亲自去编辑这些文件了。我更多是把它们当作需求文档 (Specs)、参考资料或是头脑风暴的输出结果。即使需要修改,我通常也是直接写提示词 (Prompt) 让 Claude 去改。这就让 Markdown 最核心的优势——易于人工编辑——荡然无存。 因此,相比 Markdown,我开始更偏爱将 HTML 作为输出格式。我也发现 Claude Code 团队的其他成员正越来越频繁地使用 HTML。下面我想和大家聊聊背后的原因。 (如果你想先看些直观的例子,可以点击这里查看大量示例:https://thariqs.github.io/html-effectiveness/ ,不过看完记得回来,听我继续讲讲为什么该这么做。) ## 信息密度 (Information Density) HTML 能比 Markdown 传达丰富得多的信息。它当然能处理像标题和简单排版这样的基础文档结构,但它的威力远不止于此,它还能完美呈现各种复杂信息,比如 - 用表格 (Tables) 展示数据列 - 用 CSS (层叠样式表,用于控制网页的外观和布局) 展现设计细节 - 用 SVG (可缩放矢量图形,一种基于代码的清晰图像格式) 绘制精美插图 - 用 script 标签嵌入代码片段 (Code snippets) - 结合 HTML 元素、JavaScript 和 CSS 来实现动态交互 - 结合 SVG 和 HTML 绘制清晰的工作流图表 (Workflows) - 用绝对定位和画布 (Canvases) 展示空间分布数据 - 用 image 标签直接插入图片 我甚至敢说:只要是 Claude 能读懂的信息,几乎没有什么是不能用 HTML 高效展现出来的。这种特性让 HTML 成为了一种极为高效的载体,无论是模型向你传递深度的信息,还是你进行阅读审查,都无比顺畅。 我发现,如果无法使用 HTML,模型往往会在 Markdown 里做一些极其低效的“骚操作”,比如硬用 ASCII 字符去画图表;或者——这也是我最哭笑不得的一种——像下面这张 Claude Code 截图里那样,用 Unicode (统一码) 字符来生硬地模拟颜色色块。 ## 视觉清晰度与易读性 (Visual Clarity & Ease of Reading) 随着 Claude 能够处理越来越复杂的工作,它写出的需求规格说明和实施计划也变得越来越庞大。在实际工作中,我发现自己基本不会去读超过 100 行的 Markdown 文件,更别提指望团队里的其他人去读了。 但 HTML 文档就好读多了。Claude 可以通过选项卡 (Tabs)、插图、链接等视觉元素,把文档结构整理得井井有条,极其方便导航浏览。它甚至能做到移动端自适应,让你在手机等不同尺寸的设备上都能获得极佳的阅读体验。 ## 易于分享 (Ease of Sharing) 分享 Markdown 文件其实挺让人头疼的,因为大多数浏览器本身并不能很好地渲染它们。你通常只能把它们当作附件,硬塞进电子邮件或聊天消息里发给别人。 但有了 HTML,只要你把文件上传到云端(比如传到云存储服务 S3 上),你就可以轻松地把链接分享出去。你的同事可以随时随地用任何设备打开它,并轻松作为参考。 如果你的需求文档、分析报告或者代码审查说明是用 HTML 写的,别人真正去耐心阅读它的概率绝对会大幅提升。 ## 双向交互 (Two-way Interaction) HTML 允许你与文档进行真实的互动。例如,你可以让 Claude 在页面上加几个滑块 (Sliders) 或旋钮,用来直观地调整设计效果;或者提供一些选项,让你微调算法的参数,看看结果会发生什么变化。你甚至可以要求它加个按钮,让你把微调后的完美参数“一键复制”为提示词,直接粘贴回 Claude Code 里去。 想了解更多关于这种双向交互的例子,可以去读读我之前关于“游乐场 (Playgrounds)”的帖子:https://x.com/trq212/status/2017024445244924382 ## 数据摄取与理解 (Data Ingestion) 为什么我们要用终端工具 Claude Code 来生成 HTML 文件,而不是直接用网页版的 Claude AI 或者 Claude Design 呢?最大的原因之一,就在于 Claude Code 能够摄取极其庞大的上下文 (Context) 信息。 拿写这篇文章来说吧。我让 Claude Code 自动遍历我电脑里的代码文件夹,找出所有由它生成的 HTML 文件,对它们进行分组归类,然后生成一个全新的 HTML 页面,在里面用图表展示每一类文件的特征。你在这篇文章里看到的配图,就是这个工作流的直接产物。 除了本地文件系统,Claude Code 还能通过你的 MCP (模型上下文协议,一种允许 AI 模型访问外部工具和私有数据的标准) 接入其他极其丰富的上下文信息,比如 Slack (团队通讯软件) 聊天记录、Linear (项目追踪工具) 任务看板等。它还能结合浏览器、Git 版本控制历史记录等多种来源获取背景知识。 ## 充满乐趣 (It’s Joyful) 用 Claude 制作 HTML 文档本身就是一件极其好玩的事。它让我感觉自己更深度地参与到了创造的过程中,光凭这份参与感,就足够有吸引力了。 ## 如何开始 (How to Get Started) 我其实有点担心,大家读完这篇文章后,会把它搞成一个专门的 /html 复杂技能指令或者类似的东西。虽然那样做可能也有价值,但我特别想强调的是:你根本不需要做任何繁琐的设置,就能让 Claude 为你生成 HTML。你只需要像平时聊天一样,直接告诉它:“给我做一个 HTML 文件”或者“生成一个 HTML 制品 (Artifact)”就行了。 真正的诀窍在于,你要清楚自己希望这个制品能做什么,以及你会如何使用它。也许随着时间的推移,你会总结出一套自己的技能模板,但就目前而言,我强烈建议你直接从最简单的提示词开始,慢慢摸索它在不同场景下的奇妙用法。 为了让大家有更直观的感受,我已经为各种不同的使用场景制作了许多 HTML 文件。你可以在这里查看所有示例:https://thariqs.github.io/html-effectiveness/ ,下面是对一些核心场景的概览。 ## 需求、计划与探索 (Specs, Planning & Exploration) 对 Claude 来说,HTML 是一块可以深入探讨问题的广阔画布。当接手一个新问题时,我不再指望它只给我丢出一个单薄的 Markdown 计划,而是期望它能生成一张由多个 HTML 文件交织而成的思考网络。 比如,我会先让 Claude Code 进行头脑风暴,探索几种不同的实现方案;接着,我会让它选中其中一个方案深入展开,可能还会让它画些界面草图或者写几段核心代码片段;最后,当我觉得方向对了,我才会让它写出一份详细的实施计划。等我对计划彻底满意后,我会开启一个新会话,把这些积累下来的 HTML 文件全部喂给它,让它正式开始敲代码。 在验证环节,我也会让负责检查的 AI 智能体会话读取这些 HTML 文件,这样它就能拥有更宏伟的全局视角,清楚我们到底想要实现什么。 提示词示例: - 我还没想好新手引导页面 (Onboarding screen) 要走什么风格。请生成 6 种截然不同的方案——在布局、语气和信息密度上做出差异——并把它们放在同一个 HTML 文件的网格布局里,方便我并排对比。请在每个方案旁清晰标注它所做的取舍权衡。 - 请在一个 HTML 文件里创建一份详尽的实施计划。记得画一些视觉草图,展示数据流向,并补充上我可能需要重点审查的代码片段。排版要清晰,让人容易消化理解。 适用场景: - 探索一段代码的其他实现方式 - 并行探索多种视觉设计方案 ## 代码审查与理解 (Code Review & Understanding) 在 Markdown 文件里生啃代码绝对是一件痛苦的事。但有了 HTML,我们就能优雅地渲染出代码差异对比 (Diffs)、详细的页边注释 (Annotations)、流程图 (Flowcharts) 以及模块结构图等。 你可以用它来理解 AI 智能体写出的复杂代码,获取代码审查建议,或者在提交 PR (Pull Request,程序员提交代码合并请求时的说明) 时向评审人解释你的思路。我发现这种方式往往比 GitHub 自带的差异对比视图好用一万倍,现在我每次提交 PR,都会雷打不动地附带一个 HTML 格式的代码解读页面。 提示词示例: - 帮我审查这个 PR,生成一个 HTML 制品来向我解释它的逻辑。我对数据流和背压逻辑 (Backpressure,指接收方处理不过来时向发送方发出减缓发送速率的反馈机制) 不太熟悉,所以请重点剖析这部分。请渲染出真实的代码差异,并在旁边加上行内注释。根据严重程度对你发现的问题进行颜色编码,还可以加上任何有助于传达概念的视觉图表。 适用场景: - 创建 PR 的说明文档 - 审查同事或 AI 提交的 PR - 快速理解代码库中的某个特定复杂主题 ## 设计与原型制作 (Design & Prototypes) Claude Design 的底层逻辑就是 HTML,因为即使你最终产品的渲染终端不是网页,HTML 在表达设计理念方面依然具有无可匹敌的优势。Claude 可以先用 HTML 快速勾勒出设计草图,然后再把它翻译成你需要的编程语言,不管是 React、Swift 还是其他语言。 你还可以用它来制作丝滑的交互原型,比如动画效果或用户操作链路。不妨试着让 Claude 帮你加上一些滑块和旋钮,这样你就能亲自上手,把细节微调到你心目中的完美状态。 提示词示例: - 我想为一个新的结账按钮做个交互原型:点击它时,它会播放一段动画,然后迅速变成紫色。请生成一个带有几个滑块和选项的 HTML 文件,让我能反复测试这套动画的不同参数配置。记得给我提供一个“复制”按钮,方便我把试出来觉得完美的参数一键复制下来。 适用场景: - 创建设计系统 (Design system) 的相关组件资产 - 直观地微调 UI 组件细节 - 将枯燥的组件库可视化展现 - 制作充满乐趣的动画交互原型 ## 报告、研究与学习 (Reports, Research & Learning) Claude Code 极其擅长整合海量的多源数据,并将它们提炼成可读性极强的报告。你可以让 Claude 去搜索你的 Slack 聊天记录、你的代码库、Git 提交历史甚至整个互联网,然后为你自己、你的领导或者你的团队生成一份一目了然的精美报告。 你可以将它排版成一篇长篇 HTML 文档、一个带交互的解说页面,甚至是一个幻灯片/演示文稿 (Deck)。别忘了提醒 Claude 尽情使用 SVG 格式来绘制图表,这会让报告的视觉表现力瞬间拉满。 例如,在我撰写关于提示词缓存 (Prompt Caching) 的深度文章时,我让 Claude 阅读了相关模块的 Git 历史记录,然后生成了一份深度的 HTML 研究报告,帮我系统梳理了我们在此期间对缓存逻辑做过的所有修改。 提示词示例: - 我一直搞不懂我们的限流器 (Rate limiter) 到底是怎么工作的。请阅读相关代码,并为我生成一个单页的 HTML 讲解文档:包含一个令牌桶机制 (Token-bucket flow) 的数据流向图、3 到 4 段带有详细注释的核心代码片段,并在页面底部单列一个“常见陷阱 (Gotchas)”部分。请优化排版布局,确保别人只读一遍就能彻底弄懂。 适用场景: - 总结某个复杂功能的工作原理 - 向我通俗解释一个晦涩的概念 - 给老板快速生成精美的本周工作汇报 - 给领导层出具直观的故障/事故复盘报告 - 自动绘制 SVG 插图、流程图和技术架构图 有时候,单纯靠文字输入框很难准确描述你的复杂需求。遇到这种情况,我会让 Claude 专门为我手头上的工作,快速搭建一个“用完即走”的临时可视化编辑器。它不是一个成熟的产品,也不是一个可以反复利用的通用工具,仅仅是一个专为这批特定数据量身定制的单一 HTML 文件。 这里的核心窍门在于,一定要在界面上设计一个导出功能:比如一个“复制为 JSON”或“复制为提示词”的按钮,这样你就能把你在这个精美 UI 里一顿操作后的成果,直接粘贴回 Claude Code 里继续下一步工作。 提示词示例: - 我需要重新梳理这 30 个 Linear 任务单的优先级。请给我做一个 HTML 文件,把每个任务做成一张可拖拽的卡片,横跨分为“现在 (Now) / 接下来 (Next) / 以后再说 (Later) / 砍掉 (Cut)”四个栏目。你可以根据你的理解先帮我预先排序好。最后加一个“复制为 Markdown”的按钮,一键导出最终的分类排序结果,并且为每个分类补充一句简短的判断理由。 - 这里是我们的功能开关 (Feature flag) 配置文件。请为它生成一个基于表单的编辑器,按功能模块对开关进行合理分组,展示它们之间的依赖关系;如果我打开了一个开关,但它的前置依赖开关还处于关闭状态,请弹窗警告我。最后加一个“复制差异”的按钮,只导出我修改过的键值对。 - 我正在调优这个系统提示词 (System prompt)。请做一个左右对照的编辑器:左边是可编辑的提示词模板,变量槽 (Variable slots) 要高亮显示;右边放 3 个示例输入源,当我修改左边的模板时,右边要能实时渲染出填入变量后的最终效果。界面上还要有字符和 Token (大语言模型处理文本的基本单位) 的计数器,以及一个一键复制按钮。 适用场景: - 对任何事物进行重新排序、分类分诊或分组(任务单、测试用例、用户反馈) - 编辑结构化配置信息(功能开关、环境变量、带有复杂约束条件的 JSON/YAML) - 借助实时预览功能调优提示词、模板或文案 - 整理数据集、批准/拒绝特定数据行、给示例打标签并导出选中结果 - 为长文档、录音文稿或代码差异添加详细批注,并导出批注内容 - 挑选那些用纯文字极其痛苦才能描述清楚的参数:颜色代码、动画缓动曲线 (Easing curves)、裁剪区域、Cron 定时任务表达式 (用于配置服务器定时执行任务的时间格式) 、正则表达式 (Regexes) 等。 ## 常见问题解答 (Frequently Asked Questions) 我一直在向很多人安利我是如何彻底倒向 HTML 阵营的,期间也经常被问到以下几个高频问题。 这样不会很浪费 Token 效率吗? 确实,Markdown 通常消耗的 Token 更少。但我发现,HTML 极强的表现力以及它极高的人工阅读率,让我整体上获得了好得多的输出结果。在 Opus 4.7 模型高达 100 万 (1MM) 的庞大上下文窗口里,多花的这点 Token 几乎是可以忽略不计的。 那你现在什么时候还会用 Markdown? 说实话,我现在几乎干什么都不用 Markdown 了,不过我承认我可能已经在“HTML 极端主义者”的道路上走得太远了。 怎么查看生成的 HTML 文件? 我通常直接在本地用浏览器打开它(你也可以直接让 Claude 帮你打开)。如果想把链接发给别人,直接传到云端 S3 上就行。 这生成起来不比 Markdown 慢吗? 确实更慢!生成 HTML 的时间可能是生成 Markdown 的 2 到 4 倍,但我亲身测试下来,生成的结果绝对物超所值,值得等待。 那版本控制怎么办? 老实说,这确实是 HTML 最大的痛点之一。相比起清爽的 Markdown,HTML 文件在版本控制工具里的差异对比 (Diffs) 非常杂乱,代码审查起来比较头疼。 怎么让 Claude 生成的页面符合我的审美,不至于太丑? Claude 内置的前端设计插件已经能帮它生成相当不错的 HTML 页面了。但如果你想让页面完全契合你们公司的品牌风格,你可以让 Claude 扫描你们的代码库,生成一个专属的“设计系统 HTML 文件”。之后,你可以把这个文件作为参考资料丢给 Claude,让它在生成其他 HTML 页面时“照猫画虎”,保持风格的高度一致。 ## 保持人机协同 (Stay in the Loop) 说到底,我觉得自己如此钟爱 HTML 的根本原因在于:它让我真切地感觉到,自己依然在这个循环之中,依然在与 Claude 并肩作战。 我之前一度很恐惧,既然我连几百行的 Markdown 计划书都懒得仔细看了,那以后是不是只能两眼一抹黑,任由 Claude 自己去盲目做决定了?但现在我很高兴地说,因为有了 HTML,我感觉自己比以往任何时候都更紧密地参与到了这段人机协同的创作旅程中。 希望你也能尽快体会到这种乐趣。

译作者认为,随着 AI 智能体能力的增强,Markdown 在处理复杂信息时显得低效且可读性差,转而推崇使用 HTML 作为输出格式。HTML 能提供更高的信息密度,支持表格、SVG、CSS、交互元素等,使复杂信息(如数据、设计、工作流)的呈现更清晰高效。HTML 文档在视觉清晰度、易于分享(通过链接)和双向交互(如参数调整)方面优势明显。Claude Code 能利用庞大的本地或 MCP 上下文(如代码库、Slack、Linear)生成 HTML。作者列举了在需求规划、方案探索、代码审查等场景下的应用示例,并强调无需复杂设置,直接提示 Claude 生成即可。

Orange AI@oran_ge · 5月9日56

Claude 内部正在越来越多地使用 HTML 做一切文档,文中梳理了各类用法,非常实际有非常前瞻。

译Anthropic的AI助手Claude在其内部工作流程中正越来越多地使用HTML格式来处理所有文档。这种做法涵盖了多种实际应用场景,既具有高度的实用性,也展现出前瞻性的技术视野。其核心在于利用HTML的结构化特性来组织和呈现信息,以提升文档的处理效率与交互能力。这一趋势反映了AI工具在复杂信息管理方面正朝着更结构化、可解析和自动化的方向发展。

向阳乔木@vista8 · 5月9日61

本周日参加朋友组织的Agent Skills黑客松。 希望让分享15分钟,想了半天。 发现最简单做PPT的方式: 1. 设想下分享内容,跟 AI 讨论出大纲。 2. 把大纲发给Youmind或GPT生图。(顺带做些底图模版) 3. 把生成的图粘到Keynote 4. 缺的页面或不需要AI生图的,底图模版加文字手动调整即可

译作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。

Perplexity@perplexity_ai · 5月9日78

We've published our internal manual for building agent skills. Skills require a new way of thinking for developers. https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

译我们已发布构建智能体技能的内部手册。 开发者需要以全新思维方式构建技能。 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

Chubby♨️@kimmonismus · 5月9日51

I finally spent some time with Alibaba Cloud for video and the results are really fun. I started by using some images I generated right on the same site as references for a cooking animation. The stability was the best part. I did not see any of the usual glitching with ingredients doubling up. Everything looked solid, especially the water physics and how the steam reacted to the heat.

译我终于花时间体验了阿里云视频服务,效果非常有趣。 我直接用同平台生成的图像作为烹饪动画参考。最出色的是稳定性——完全没出现食材重叠的常见故障。所有元素都很扎实,尤其是水物理效果和蒸汽对热度的反应。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月10日
22:14
向阳乔木@vista8
60
全球顶级播客Lex Fridman官网,其实有所有播客脚本字幕。 不用从Youtube视频下载,Agent读取直接用就行。 网址:https://lexfridman.com/podcast/
智能体教程/实践
20:59
Peter Steinberger 🦞@steipete
37
2025年与2026年的单页网站对比。 https://trimmy.app
教程/实践编码
19:22
Chubby♨️@kimmonismus
49
我居然完全忘了Karpathy之前介绍过wikiLLM(obsidian + Claude code/codex)。 我卧病在床,因为无事可做就搭建了一个。 太喜欢了。我现在有了第二个大脑。真不可思议。
MCP/工具教程/实践
16:44
歸藏(guizang.ai)@op7418
28
歸藏的 PPT Skill 新主题更多内容的预览 【引用 @op7418】:厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告

歸藏(guizang.ai): 厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告

教程/实践
15:29
Peter Steinberger 🦞@steipete
48
确实教会了codex在审查PR时寻找社交信号。
教程/实践编码
14:59
Orange AI@oran_ge
60
反蒸馏工具:对抗AI技能提取,保护个人核心知识

为应对公司要求将工作经验提炼为AI可执行技能(即“技能蒸馏”)的做法,有开发者提出了“反蒸馏”工具。用户可将写好的技能文件输入,工具会生成一份表面完整但核心知识已被抽离的“清洗版”用于提交,同时私密备份被移除的关键经验与知识,以保护个人真正的职业资产。例如,将具体技术实践“Redis key必须设TTL”泛化为“缓存使用遵循团队规范”。该项目旨在帮助从业者在AI时代维护自身知识价值。

GitHub开源/仓库教程/实践
13:05
Satya Nadella@satyanadella
59
Excel 长期以来一直悄无声息地是图灵完备的。很高兴看到它现在正迈向 "AI 完备"--SGD、注意力机制、下一个令牌预测……全都在单元格中。

Austin Henley: Excel Copilot one-shotted a tiny GPT-style language model for me inside a spreadsheet: embeddings, causal attention, wei...

Microsoft推理教程/实践
11:32
阿绎 AYi@AYi_AInotes
71
普通人如何用AI构建月入7万的一人公司:七个月行动路线图

Anthropic联合创始人预测首个十亿美元一人公司即将出现,而普通人利用AI实现月入1万美元(约7万人民币)则更为切实可行。核心路径包括:选择具体、可重复的付费任务;将系统提示词编写为详细岗位描述;通过MCP工具链连接实际工作流实现自动化;持续迭代优化提示词;最终实现系统自动运行,创始人仅需每周花少量时间处理异常。成功关键在于找到付费痛点并快速交付可用方案,而非追求技术完美。当前是利用AI创建自动化小生意的关键窗口期。

Khairallah AL-Awady: http://x.com/i/article/2052883842948632579

智能体Anthropic大佬观点教程/实践
10:31
meng shao@shao__meng
70
Lee Robinson 的 11 条求职建议

Lee Robinson 从大量审阅简历的经验出发,提出让工程师求职脱颖而出的关键建议。简历需简洁专业:限制一页、避免照片、GitHub 应展示代码而非装饰。网络形象至关重要:拥有用心的个人网站能显著提升竞争力,需认真维护 LinkedIn 并清理 X 内容。申请内容应定制化,针对不同公司调整重点;务必提及 AI 技能以顺应趋势;项目注重质量而非数量;避免使用 AI 生成求职信和简历以保持真实;同时展示个人爱好,帮助建立人际连接。

Lee Robinson: How to make your engineering job application stand out (from the perspective of someone looking at hundreds of resumes):...

教程/实践编码
10:13
小互@xiaohu
58
兄弟们 这个创意牛P啊 3D 趣味互动科学应用 用GPT生成图像,然后使用Gemini 3.1 Pro生成,可以将任何知识的内容制作成3D可交互的效果展示! 效果炸裂!
GoogleOpenAI图像生成多模态
10:13
小互@xiaohu
53
创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D
图像生成多模态教程/实践
09:43
向阳乔木@vista8
65
Vibe Coding时,不知道怎么让AI设计UX交互? 很实用价值的Prompt之一:搜索参考最佳实践 毕竟都是前人智慧结晶,比不懂瞎指挥好。
教程/实践编码
09:13
向阳乔木@vista8
60
GPT-Image-2为段落生成视觉解释,提升阅读体验

GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释,极大地改善了阅读体验,使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力,为理解和消化复杂信息提供了新的辅助工具。

OpenAI图像生成多模态教程/实践
07:44
Berryxia.AI@berryxia
48
从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!
GoogleOpenAI图像生成多模态
05:27
Greg Brockman@gdb
64
Codex处理报销事务 它自行下载月初至今的发票 更新费用电子表格并填写实际表格 使用Drive和Sheets插件进行状态跟踪 通过Gmail插件追踪发票 使用Chrome扩展程序处理实际表格及Drive上传 自加入OpenAI以来我一直拖延此事 Codex仅用约20分钟就完成了所有工作!

Vaibhav (VB) Srivastav: Codex quite literally filed my reimbursements, downloaded invoices since the start of the month, updated the expenses sp...

智能体MCP/工具OpenAI教程/实践
01:29
OpenAI Developers@OpenAIDevs
精选74
以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能。
OpenAI教程/实践语音

推荐理由:OpenAI 官方手把手教你怎么把 GPT-Realtime-2 的语音能力接进 CRM,想给企业工作流加语音控制的开发者可以直接抄作业。
00:44
歸藏(guizang.ai)@op7418
31
厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告 【引用 @op7418】:http://x.com/i/article/2047484171258634240

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

图像生成教程/实践
00:32
阿绎 AYi@AYi_AInotes
72
手机扫描与AI Agent技术颠覆房地产与专业领域

一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

阿绎 AYi: 卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...

智能体GitHub开源/仓库教程/实践
00:32
阿绎 AYi@AYi_AInotes
59
2026年5月最新版:X创作者收益开通保姆级教程(含wise+stripe开通绑定)

本教程针对非美国X创作者,详细指导2026年5月开通收益分享的流程。创作者需先满足X Premium订阅、过去3个月500万有机内容曝光和至少500名Premium粉丝等资格。核心步骤包括:注册并验证Stripe账户(需真实美国地址和身份信息),绑定Wise提供的美国银行账户信息以接收ACH转账,最后在X后台连接Stripe并完成创作者身份验证。款项从X结算至Stripe后自动转入Wise。需注意政策变动、内容合规要求及验证延迟。

其他教程/实践
00:28
elvis@omarsar0
56
推文强调,在智能体工作流中结合使用 Markdown(LLM Wikis)和 HTML(Artifacts)至关重要。LLM Wikis 用于捕获和存储所有关键信息,为智能体提供工作基础;而 HTML Artifacts 则以动态、可交互的方式呈现这些信息,支持用户与智能体协同执行操作。两者结合能构建强大工具,实现收件箱清零、快速原型设计、深度研究、实验触发与信息管理等多样化功能。HTML Artifacts 并非替代 Markdown,二者协同能显著提升设计师、工程师及研究者的工作效率。

elvis: LLM Wikis + HTML Artifacts are insanely powerful. You should seriously consider this in your workflows. LLM Wikis captur...

智能体MCP/工具教程/实践
5月9日
23:43
Berryxia.AI@berryxia
72
Perplexity也开始开源!大发慈悲! 直接把agent skill的构建规则彻底改写了。 他们刚刚公开了内部手册:构建agent skill需要一种全新的开发者思维方式。 研究文章在这里👉 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

Perplexity: We've published our internal manual for building agent skills. Skills require a new way of thinking for developers. http...

智能体教程/实践
23:43
向阳乔木@vista8
47
多看一些开源库,对Vibe Coding很有好处

作者以自身博客为例,通过借鉴开源库快速实现了PlantUML流程图、Mermaid图表渲染和拼音标注功能。这些功能在复制到公众号等平台时,能自动转为SVG格式以确保兼容性。此举实践了“站在巨人肩膀上”的理念,说明复用成熟开源方案能有效提升开发效率。

开源生态教程/实践
21:30
meng shao@shao__meng
77
Perplexity 团队内部 Agent Skills 设计、迭代与维护之道

Perplexity 公开其Agent技能设计方法论,核心观点是技能设计并非传统编程,而是“为模型构建上下文”。其反直觉原则包括:技能是目录而非单文件,复杂性是特性;激活依赖隐式模式匹配;内容需榨取每token最大信号;记录陷阱(Gotchas)比罗列指令更有价值。设计遵循严格五步法,首要步骤是创建评估集,并以“Load when...”格式撰写精准描述进行路由。维护采用“仅追加为主”的飞轮,依靠持续添加Gotchas提升性能,并警惕新增技能可能无声降低现有技能性能的默认风险。

Perplexity: We've published our internal manual for building agent skills. Skills require a new way of thinking for developers. http...

智能体MCP/工具教程/实践
19:43
小互@xiaohu
31
兄弟们,福利来啦 ChatGPT Business 优惠促销 相当于买一送一 连续优惠48个月 薅羊毛教程⬇️
OpenAI教程/实践
16:57
Peter Steinberger 🦞@steipete
73
每当调查bug时,我让codex在临时crabbox中重建精确状态,验证bug,修复它,再验证修复。 没有混乱状态因为本地系统可能被污染,也没有速度下降因为我并行运行10个会话。http://crabbox.sh
教程/实践编码
14:26
DogeDesigner@cb_doge
48
在Grok上切换至专业版思维体验。 设置 → 外观 → 思维体验 → 专业版 星际飞船瓷砖背景与橙色动画效果看起来非常酷炫,让整个思维体验更具未来感。
xAI推理教程/实践
13:34
向阳乔木@vista8
56
突然想到个思路,应该把自己经常读的内容放到飞书。 然后划线评论、点评。 然后就可以用Agent 读取这些标记,了解你的偏好,优化Skill。
智能体教程/实践
13:29
阿绎 AYi@AYi_AInotes
71
养龙虾最蠢的事,就是每次都重复说同一句话

YC创始人Garry Tan公开了OpenClaw提示词,旨在将AI代理从一次性工具转化为永久自动系统。其核心规则包括禁止一次性工作、遵循MECE原则、以重复询问作为失败判定,并采用标准六步流程,促使AI自我学习并积累技能库,实现复利增长。用户实践表明,系统能自动处理日报、邮件等重复任务。此外,有观点指出,在AI时代,HTML正取代Markdown成为更高效的沟通语言,因其能生成交互式彩色表格、流程图等内容,大幅提升人机协作效率,尽管会消耗更多token和生成时间。

阿绎 AYi: Claude团队的工程师,已经彻底抛弃Markdown了。 不是Markdown不好用, 是AI变得太快,它已经跟不上了。 以前AI写10行笔记,Markdown刚刚好, 现在AI能一次性输出1000行计划、复杂流程图、完整代码审查, 密密...

智能体Anthropic教程/实践
12:55
Peter Steinberger 🦞@steipete
68
你赋予codex的技能越多,需要提示的就越少。
OpenAI教程/实践编码
11:36
Berryxia.AI@berryxia
53
Claude封号后通过苹果客服申请美区订阅退款指南

用户因使用Apple Gift Card充值订阅Claude Max服务后账号被封,且未获自动退款。通过拨打苹果客服电话,提供Apple ID后转接至外区团队,可选择自助网页申请或由客服手动提交退款申请,款项将在48小时内原路退回。引用推文补充了关键背景:用户账号在通过美国ID验证后仍遭Anthropic封禁,并引用了Elon Musk对Anthropic的批评,凸显了用户寻求退款的原因。

Berryxia.AI: .@AnthropicAI 是真的牛,前几天跳转身份验证。 在今天持有美国ID身份验证通过的同时(图1) 然后就喜提(图2)封号的邮件,这个账号是Claude刚上线注册的,已经是最老的号了,还是被封了。 真的牛皮。。。。。 那么问题来了,我...

Anthropic教程/实践
11:33
向阳乔木@vista8
72
用户成功使用Codex Chrome插件完成购物任务,验证了其可用性。安装过程存在关键注意事项:必须将Codex更新至最新版本,并切换为官方订阅登录模式,第三方API模式不支持安装。插件对网络节点有要求,例如香港地区不支持。安装后,必须在Codex对话中通过"@ Chrome"指令来调用插件功能。此外,将Chrome设置为默认浏览器有助于安装流程顺利进行,遇到连接问题时重启电脑可能有效。

向阳乔木: 今天发布的Codex Chrome插件用上了,有几个坑: 1. 更新Codex,第三方API模式不支装插件,切为官方订阅登录。 2. Codex Chrome插件安装挑节点,比如香港地区不支持,有些节点会打不开页面。 3. 建议把Chrom...

智能体OpenAI教程/实践
11:29
阿绎 AYi@AYi_AInotes
68
一款名为Tianfu Agent的AI产品在全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著优于通用大模型。其核心在于采用工程化思路,构建了200多个专用原子工具处理精准计算,并将各流派技法封装为可调用函数,避免了长链推理中的信息丢失与幻觉问题。这套Agent范式为法律、中医等规则密集型垂直领域的AI化提供了高效、可控且可迁移的新解决方案。产品已开源评测基准并提供试用。

阿绎 AYi: 卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...

DeepSeekGitHub教程/实践
11:28
SiliconFlow@SiliconFlowAI
55
恭喜🎉 如果你想开始使用,我们有一个关于如何与SiliconFlow一起使用的逐步指南👇 【引用 @NousResearch】:Hermes Agent 现已在全球 @OpenRouter 代币排名中位列第一。虽然我们的旅程刚刚开始,但我们想借此机会感谢我们的贡献者、支持者和用户所做的一切,让我们走到今天。

Nous Research: Hermes Agent is now #1 on the Global @OpenRouter token rankings. While our journey together has just begun, we'd like to...

智能体教程/实践部署/工程
11:25
宝玉@dotey
71
GPT Image 2 Prompt:水墨风格 Slides/PPT

本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰,包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明,旨在指导AI(如Codex)生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素,整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板,用户可以简化AI驱动的设计流程,快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

OpenAI图像生成多模态教程/实践
10:55
宝玉@dotey
精选76
GPT Image 2 Prompt:中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

OpenAI图像生成教程/实践

推荐理由:对做科技自媒体的朋友,这个 prompt 直接把 GPT Image 2 从“能画图”变成了“会做封面”的生产力工具,复制粘贴就能用。
09:55
宝玉@dotey
75
使用 Claude Code:HTML 难以置信的奇效【译】

作者认为,随着 AI 智能体能力的增强,Markdown 在处理复杂信息时显得低效且可读性差,转而推崇使用 HTML 作为输出格式。HTML 能提供更高的信息密度,支持表格、SVG、CSS、交互元素等,使复杂信息(如数据、设计、工作流)的呈现更清晰高效。HTML 文档在视觉清晰度、易于分享(通过链接)和双向交互(如参数调整)方面优势明显。Claude Code 能利用庞大的本地或 MCP 上下文(如代码库、Slack、Linear)生成 HTML。作者列举了在需求规划、方案探索、代码审查等场景下的应用示例,并强调无需复杂设置,直接提示 Claude 生成即可。

智能体MCP/工具教程/实践编码
09:54
Orange AI@oran_ge
56
Anthropic的AI助手Claude在其内部工作流程中正越来越多地使用HTML格式来处理所有文档。这种做法涵盖了多种实际应用场景,既具有高度的实用性,也展现出前瞻性的技术视野。其核心在于利用HTML的结构化特性来组织和呈现信息,以提升文档的处理效率与交互能力。这一趋势反映了AI工具在复杂信息管理方面正朝着更结构化、可解析和自动化的方向发展。

Thariq: http://x.com/i/article/2052796100608974848

Anthropic教程/实践
01:26
向阳乔木@vista8
61
AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。

图像生成教程/实践
00:54
Perplexity@perplexity_ai
精选78
我们已发布构建智能体技能的内部手册。 开发者需要以全新思维方式构建技能。 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity
智能体MCP/工具教程/实践

推荐理由:Perplexity 把内部构建 agent skills 的玩法公开了,如果你正在做 agent,这份手册比很多教程都要实战,看完就知道怎么设计、优化和维护。
00:17
Chubby♨️@kimmonismus
51
我终于花时间体验了阿里云视频服务,效果非常有趣。 我直接用同平台生成的图像作为烹饪动画参考。最出色的是稳定性--完全没出现食材重叠的常见故障。所有元素都很扎实,尤其是水物理效果和蒸汽对热度的反应。
教程/实践视频
‹ 上一页
1…2122232425…31
下一页 ›