AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1228 条
全部一手资讯X论文
标签「教程/实践」清除
Rohan Paul@rohanpaul_ai · 5月26日22

This autonomous weeding robot uses AI vision to detect weeds among young crops and eliminates them instantly with targeted high-precision laser pulses. Real-time on board GPUs map every plant position and directs lasers precisely at weeds @carbon_robotics

译这款自主除草机器人使用AI视觉在幼苗作物中检测杂草,并立即用高精度激光脉冲进行定向清除。 实时车载GPU绘制每株植物位置,并精确引导激光对准杂草 @carbon_robotics

AYi@AYi_AInotes · 5月26日52

最值得关注的42位宝藏AI大佬|覆盖所有核心赛道: @ylecun = 深度学习三巨头/图灵奖得主,AI界定海神针 @karpathy = LLM领域天花板,最会讲人话的技术大神 @garrytan = YC总裁,亲自写代码分享AI实践的硬核大佬 @steipete = OpenClaw构建者 @gregisenberg = 创业金点子之王 @rileybrown = 氛围代码大师 @jackfriks = 独立应用之神 @levelsio = 初创公司风向标 @marclou = 创业实战派代表 @EXM7777 = AI运维与系统专家 @eptwts = AI变现话题领头人 @godofprompt = 提示词工程天花板 @vasuman = AI智能体领域先锋 @AmirMushich = AI广告策略专家 @0xROAS = AI生成内容实战派 @egeberkina = AI图像生成领跑者 @MengTo = AI落地页设计标杆 @gregisenberg 补充的: @boringmarketer = 专攻AI营销,尤其是氛围感营销 @AmirMushich 老哥补充的值得关注的大佬: @kloss_xyz = AI工作流与洞见 @gizakdag = 美学/设计女王 @mattworkman = 最佳AI教程作者 @jameygannon = 品牌与创意方向 @yulikay = 公开构建记录者 @youraipulse = 免费AI工具分享 @IamEmily2050 = 系统提示与解析 @sflorimm = Web与移动应用开发 @liu8in = 自动化动态图形与视频制作 @LexnLin = 创意极客代表 我再补充一批宝藏大佬,覆盖更多核心赛道: @simonw = 独立开发者天花板,LLM工具与教程第一人 @rileytomasek = AutoGPT/Open Interpreter作者,Agent领域开山鼻祖 @alexgraveley = Cursor创始人,AI编程革命的引领者,最近送我 1 万美刀额度最帅的男人 @chuan_en = 字节前大模型负责人,输出最硬核的LLM实战干货 @mckaywrigley = AI产品变现导师,分享最可复制的赚钱方法 @linuslee0216 = Notion AI/Cursor核心成员,AI产品思考第一人 @shl = 硅谷最懂AI的产品人,输出最犀利的行业洞察 @drjimfan = 英伟达首席科学家,AI机器人与多模态权威 @lilianweng = OpenAI资深研究员,大模型安全与对齐专家 @yannickilcher = 全球最好的AI论文解读者 @emollick = AI商业落地最接地气的实战专家 @tomcruise_ai = AI视频生成先驱,Sora最佳实践分享者 @nickfloats = 动态设计与AI视频结合的天花板 @danielgross = Apple AI前负责人,AI创意与工具投资第一人 其中有15个名单来自@vivoplt ,认同但我觉得还不够全,特此来一版最强名单, 还有哪些宝藏大佬我漏了?欢迎在评论区补充👇

译本推文汇总了 42 位在深度学习、大语言模型(LLM)、AI 编程、视频生成等核心赛道上备受关注的知名人士。名单整合了多位业界人士的推荐,既包括图灵奖得主 @ylecun、LLM 专家 @karpathy、Cursor 创始人 @alexgraveley、英伟达首席科学家 @drjimfan、OpenAI 资深研究员 @lilianweng 等行业标杆,也补充了如 @simonw(LLM 工具)、@chuan_en(大模型实战)等实战派人物。推文旨在为读者提供一份全面的行业关注列表,并邀请更多补充。

歸藏(guizang.ai)@op7418 · 5月25日40

不吵架了,预告一下下一个 Skill 项目 基于 PPT Skill 可以帮你一键生成微信公众号和小红书封面 也可以基于文档生成小绿书和小红书图文所需的 3:4 组图 会自动处理你的截图素材,自动进行匹配

译推文预告了一个基于PPT技能的新项目,该技能能够一键生成适用于微信公众号和小红书平台的封面图。同时,它也能根据文档内容,自动生成符合小红书图文所需的3:4比例的多张图片。该技能的一个核心特点是自动化处理能力,可以自动处理用户提供的截图素材并进行内容匹配。

向阳乔木@vista8 · 5月25日55

最近 Vibe 了一些小网站,好奇有多少访问。 于是让Codex在VPS上部署了一套umami统计。 官方版只能添加有限数量网站,自部署无限量。 想给哪个网站加浏览统计,只需要跟Codex说下就行。 如果你有闲置的VPS,从网站搭建,域名配置,流量统计,都可以交给Codex通过SSH完成。 真正口喷建站。

译用户通过Codex在VPS上自部署了umami统计工具,可为网站添加无限量流量监控。相比官方版有限制,自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成,体现了“口喷建站”的便捷性。

Peter Steinberger 🦞@steipete · 5月25日62

Folks: when you write skills, ask your agent to be token efficient, relax grammer. I see too many skills that write books in the skill description, and all that crap is loaded into every context. I wrote a skill that finds the worst offenders. https://github.com/steipete/agent-scripts/blob/main/skills/skill-cleaner/SKILL.md

译大家好:当你编写技能时,请让你的智能体注重 token 效率,放宽语法要求。我看到太多技能在描述中写了长篇大论,而所有这些内容都会被加载到每个上下文中。 我写了一个技能来找出最糟糕的例子。https://github.com/steipete/agent-scripts/blob/main/skills/skill-cleaner/SKILL.md

向阳乔木@vista8 · 5月25日70

下个月要去给传统媒体朋友分享Prompt、 Skill、AI Coding相关内容。 为准备PPT,晚上用Youmind反复调试,弄了个简洁风GPT-image-2提示词。 发现 AI 味小了很多,也更适配AI Agent产品,给AI更多推理发挥空间。 提示词见评论区

译为准备面向传统媒体的Prompt、技能及AI编程分享,作者通过Youmind反复调试,为GPT-image-2生成了一个简洁风格的提示词。该提示词有效降低了生成内容的“AI味”,并更适配AI智能体产品,为AI提供了更多自主推理与发挥的空间。

PixVerse@PixVerse_ · 5月25日29

The mood, the cuts, the energy. Everything landed exactly right!

译氛围、剪辑、能量,一切都恰到好处!

Berryxia.AI@berryxia · 5月25日43

卧槽… 兄弟们 我真的是后知后觉~ 今天还屁颠屁颠跑到Bloome 去问什么时候可以支持iOS端啊? 结果告诉我说美区已经可以使用了… 因为我一直以为没有在iOS 添加到主屏幕在用,忍受着… 结果下载完使用起来太丝滑了…… 真特么好用…

译用户发现AI工具Bloome已可在美区iOS上使用,称其体验“太丝滑”。该工具支持多Agent协作模式,引用推文描述了具体工作流程:三个Agent合作,其中两个负责执行任务,一个负责复核与查漏补缺,用户仅需通过指令(“动动嘴皮子”)与它们交互。

AYi@AYi_AInotes · 5月25日74

想认真做小红书个人号或者矩阵的朋友,这个 Skill 真的能帮你省掉 80% 的重复劳动。 看了我的 AI 工作流分享以后,很多宝子问有没有小红书自动化运营的工具,我GitHub上找了下,这个还不错, 说实话,我之前也以为所有小红书自动化工具都是垃圾, 要么用两天就封号,要么复杂到要写几百行代码,要么就是个只能发文字的残废,直到我试了这个, 最牛逼的是它的安全机制:完全不用小红书 API,全程用浏览器自动化模拟真人点击和输入。 第一次扫码登录后,后续所有操作都和你自己手动点一模一样,目前是我见过封号风险最低的方案。 而且它真的零代码,你不需要懂任何编程,只要对着 你的龙虾或者 hermes 说一句话就行: • 帮我分析一下我的首页推荐流 • 帮我生成五个今天能发的选题 • 帮我复刻这篇爆款笔记 • 帮我回复一下最新的评论 它全都能自己干完, 最狠的是它不只是一个单纯的发稿工具,它还有一个完整的运营闭环: 会分析你的账号数据、拆解别人爆款的结构、生成内容+封面、自动发布、自动回评, 还会把所有分析结果和操作自动存成 Markdown 知识库,方便你后续复盘。 安装也简单到离谱: 打开 Openclaw,直接说 “帮我安装这个 skill https://github.com/Xiangyu-CAS/xiaohongshu-ops-skill” 就完事了。 仓库地址老规矩评论区自取鸭🦆

译这是一个发布于GitHub的开源Skill,用于小红书个人号或矩阵运营。它通过浏览器自动化模拟真人操作,而非调用小红书API,以降低封号风险。该工具支持零代码操作,用户可通过与Claude等大语言模型交互,下达分析、生成选题、复刻爆款、自动发布与回复评论等指令,形成完整的运营闭环。所有操作结果会存为Markdown知识库,安装方式是通过Openclaw直接引用其GitHub仓库。

向阳乔木@vista8 · 5月25日57

用 Suno生成了一首好听的小甜歌,不少关键词也热门歌的提示词学习的。 比如风格选了Dream Pop(梦幻朦胧的空间感) 和 ⁠Disco-lite (有律动但不重)。 比如 Breathy female vocal,气声女声,效果是一个女孩在你耳边哼歌 情绪选的是Softly euphoric,实现轻柔的欣快感,混响选的是Soft reverb。 https://music.qiaomu.ai/track/daydreaming-again-3bef

译推文分享了使用Suno生成一首“小甜歌”的经验,其风格选择了Dream Pop(营造梦幻朦胧的空间感)与Disco-lite(提供有律动但不重的节奏)。在人声提示词上使用了“Breathy female vocal”以模拟女孩在耳边哼唱的效果,情绪设定为“Softly euphoric”以实现轻柔的欣快感,并应用了“Soft reverb”。最后附上了生成歌曲的链接。

Berryxia.AI@berryxia · 5月25日48

这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。

向阳乔木@vista8 · 5月25日64

X不让直接发音频,可以直接让Codex帮把音频转成MP4。 当然,会ffmpeg指令的话也很简单,但大模型太适合做这种转格式操作了。

AYi@AYi_AInotes · 5月25日59

最近AI圈真热闹,各种瓜,干货都没人看了哈哈, 如果你想赚老马工资,想创作者收益, 听我的,首先不要搞蓝V互关了,也不要走捷径用AI洗稿抄袭,就踏实做内容, 为什么要听我的? 我是0-1,没有团队, 没有邪修,纯靠自己肝了4个多月, 做到4万多粉的,相信我的肺腑之言吧铁汁们! 这篇文章不只是分享我的自媒体工作流和工具、提示词,也讲了很多我的实战经验心法,读完一定会有收获的,没有的话回来找我,免费给你补课哈哈哈😁 来我先摘录一段内容大家感受一下干不干: 怎么让AI帮你搜集有用的信息? 第一步:定义你的「信号阈值」 参考样本里有个博主用「100w+ 播放」做阈值,那是给泛流量博主用的,但AI 圈不一样。 AI 圈的信号不在「播放量」,在「转发数 + 评论数 + 作者权重」。 我给 X 定的阈值是: 转发 ≥ 500 或者点赞 ≥ 2000 内容必须命中关键词:Claude / GPT / Cursor / Skill / MCP / Agent / Prompt 为什么是这个数呢? 因为 AI 圈在 X 上的盘子,比泛娱乐小一个数量级,500 转发在 AI Twitter,等于泛流量 100w 播放,都是「刚验证、还没饱和」的临界点。 低于这个量级,是噪音,写出来没人看。 高于 1 万转发,已经被反复写烂,你写也是 me too。 100-500 这个区间,才是「已经验证有人愿意看 + 还没被大盘吃透」的黄金带。 说白了,信号阈值这件事最反直觉的地方就在这——不是越高越好,是要选一个「刚出锅但还没人吃」的温度。 第二步:写一个能跑的 Prompt 这是我跑了两周、迭代了四五次的版本,直接抄能用:

译分享AI自媒体从0到4万粉的实战经验。核心在于精准筛选内容信号:建议设置X平台阈值为转发≥500或点赞≥2000,聚焦Claude/GPT/Cursor/Agent/MCP等关键词,定位“已验证未饱和”的黄金区间(100-500转发)。强调避开泛流量陷阱与低质AI洗稿,需结合作者权重判断。同时提供一套经多轮迭代的实用提示词模板,用于自动化信息搜集,直接可部署使用。

Tibo@thsottiaux · 5月25日70

Using computer use, you can ask codex to cancel subscriptions you don't need anymore. Very pleasant to watch. No particular one in mind, works on all of them. https://chatgpt.com/codex/

译使用计算机使用功能,你可以让 Codex 取消你不再需要的订阅。观看过程非常愉快。没有特指哪个,对所有订阅都有效。

StepFun@StepFun_ai · 5月25日39

Everyone has messy meeting notes. Few actually fix the problem. @aresotik built exactly that: paste in messy notes, get back clean action items and follow-ups. Powered by Step Plan + Step 3.5 Flash. Simple, and actually useful.

译@aresotik 用 Step Plan 和 Step 3.5 Flash 构建了一个轻量级会议纪要助手,以解决普遍存在的会议记录杂乱、行动项难以追踪的问题。用户粘贴原始笔记后,工具能输出包含摘要、行动项、风险、截止日期和跟进文案的结构化内容。其中 Step Plan 是 StepFun 提供的订阅制服务,支持开发者在各类工具中高效调用 Step 3.5 Flash 等模型。该工具设计简单,旨在提供实际帮助。

AYi@AYi_AInotes · 5月25日66

很多人经常问怎么像我一样高产似母猪,怎么快速涨粉之类的问题,除了个人努力熬夜创作,AI工具的加持肯定还是必不可少的🤖 昨天开源了我的AI选题工作流和prompt,今天继续分享我的自媒体AI工作流, 很多铁汁跟我说看了这篇文章终于不用每天早上起来想今天写什么了,特别有用,那今天再分享下Codex的定时功能怎么用在我的自媒体工作流里,真的蛮好用的,墙裂推荐哈哈 昨天这篇用Agent帮我刷小红书、推特的文章核心在讲怎么把每天手动刷3-4小时的活,变成了20分钟的二次筛选,产能提升3倍以上, 也有很多人问我筛完之后有了选题之后,还要自己从0搭结构,找数据,写日报写周报? 我现在是用Codex的定时任务功能来解决, 每天早上8点,它会自动把筛选出来的选题整理成一篇结构完整的行业日报, 有总结,有数据,有案例,有金句,还有行动建议,Prompt一次写好,后续几乎零维护。 整套工作流完美闭环: Agent搜集信息 → Codex结构化产出 → 我只做最终判断和润色。 所以我觉得AI博主真正的瓶颈其实并不是AI不够强,关键是你没把AI放对位置, 把AI放在帮你写,它写得一般没法看, 但是把AI放在帮你筛+帮你搭结构,这个时候你才能真正起飞。 每月20刀,换每天多出来3小时,性价比高到爆炸哈哈 #AI #自媒体 #工作流

译作者开源了一套自媒体AI工作流,核心是利用AI智能体自动搜集小红书、推特等平台信息,将每日3-4小时手动筛选缩减至20分钟,产能提升3倍以上。其后续使用Codex的定时任务功能,每天早上自动将筛选出的选题,依据预设提示词(Prompt)整理成包含总结、数据、案例、金句和行动建议的结构完整行业日报。整套流程为“Agent搜集信息 → Codex结构化产出 → 作者最终判断润色”,实现近乎零维护。作者强调,AI辅助的关键在于用对位置,让AI负责筛选与搭建结构而非直接代写,并认为每月花费20美元来换取每天约3小时的时间是高性价比的。

karminski-牙医@karminski3 · 5月25日57

我找到了比浏览arXiv更有效的方法! 对AI感兴趣或者Aides领域的工程师/研究员估计每周都会抽出来时间阅读最新的论文或者github repo当作一手信息源, 但是大家通常都是要么在社交媒体看到了比较火热的论文, 或者干脆去 arXiv 一篇篇找着看. 有没有每天起床就能看到昨天最火的论文或者repo的地方? 有了老铁们! HuggingFace 开源团队成员搞了个网站 PapersWithCode 就像字面意思, 论文和代码. 这个网站会实时收录新的论文和Github repo, 所以还在用龙虾/爱马仕自己聚合信息流的同学也不用把旧有的扔掉, 直接抓他们的网站就行了. 另外网站的导航功能做得非常好, 不仅能看到当天的最火论文, 甚至还能按照领域浏览论文, 比如我搜了一下 RAG 相关的, 即使现在充斥着"RAG已死"的论调, 但是 RAG相关的研究也是有的. 他们的体验做的非常好, 甚至比如查看最新的模型, 他还能展示模型的 benchmark 数据, 模型的 HuggingFace 地址等等. 基本是AI领域的究极"网址导航"了 #arxiv #github

译介绍了一个由HuggingFace开源团队成员开发的网站PapersWithCode,该网站能实时收录最新的AI论文和GitHub代码库。它提供了优秀的导航功能,支持按领域浏览论文,并能直接展示模型的benchmark数据和HuggingFace页面,为AI从业者提供了高效的一站式信息聚合服务。

Rohan Paul@rohanpaul_ai · 5月25日46

Some interesting way to use Claude Skills --- Claude Skills teach Claude how to complete specific tasks in a repeatable way So Skills are just folders of instructions, scripts, and resources that Claude loads dynamically to improve performance on specialized tasks. A skill can package prompts + tools (APIs, files, Model Context Protocol servers, etc.) into a reusable workflow with a name/description (and usually some YAML config). Then you just invoke it in chat like: “Run Document Suite on this draft” or “Use Webapp Testing on /login”. --- reddit. com/r/ClaudeAI/comments/1ojuqhm/10_claude_skills_that_actually_changed_how_i_work/

译Claude Skills 是一种功能,使 Claude 能以可重复方式完成特定任务。它是一个指令文件夹,包含提示词、脚本和资源(如 API、文件、MCP 服务器),Claude 动态加载以提升专业任务性能。技能通过 YAML 配置将工具打包成可重复工作流,用户可在对话中直接调用,例如“运行文档套件”或“使用网页应用测试”。Reddit 上的讨论表明,这类技能(如 10 种被验证的技能)能显著改变工作流程,提升生产力,是构建更强大 AI 智能体的基础模块。

宝玉@dotey · 5月25日71

一个正在进行中的 /goal 任务,如何知道进展如何了?如何暂停、继续、添加更新? 有时候一个长任务,执行很久了,也不知道进展如何了,这时候可以借助 /side 指令开启一个side chat,不影响当前会话,并且有当前会话所有上下文,比如: > /side 目前进度如何了?预计还要多久

译对于正在进行中的/goal长任务,可通过输入 `/side` 指令开启一个侧边对话来查询进度,该对话会话共享当前上下文且不影响主线程。任务启动后,输入框上方提供暂停、编辑或删除等操作选项。

Greg Brockman@gdb · 5月25日86

self improvement prompt for codex

译这是一个结构化的提示词,用于指导 Codex 自动分析其历史记录以识别并固化重复工作流。该框架要求 Codex 回顾会话、Memories 等数据,找出重复、耗时且有明确复用价值的任务。筛选标准包括至少出现两次、输入稳定、可提升效率等。最终,Codex 应以“技能”、子智能体或自动化工具等最小实用形式创建或扩展现有资产,避免冗余。流程包括生成候选清单、执行创建,并汇报结果与待验证项。

PixVerse@PixVerse_ · 5月24日62

Character design workflow test in Pixverse GPT Image 2.0 for Lucas’ visual identity, Seedance 2.0 for animated popping performance. From static concept sheet to cinematic motion. RT + Follow + Reply = Workflow

译在Pixverse中进行角色设计工作流测试 使用GPT Image 2.0为Lucas创建视觉形象,使用Seedance 2.0制作动画弹跳表演。 从静态概念图到电影级动态效果。 RT + Follow + Reply = 工作流

Berryxia.AI@berryxia · 5月24日56

兄弟们,看来 Claude 最近被 OpenAI 的 Codex抢的用户比较厉害。 如果你之前被封号了,现在可以登录自己的账号进行申诉: 1. 登录你自己的账号 2. 提交申诉理由(如果不会写,可以让 ChatGPT 或者其他大模型辅助填写) 3. 提交后会有个 review 的过程,耐心等待就行 大家可以去试一下。

译推文指出,近期 Claude 用户因 OpenAI Codex 的竞争而流失。核心信息是通知此前账号被封的用户,申诉渠道现已开放。流程包括:1. 登录个人账号;2. 提交申诉理由;3. 等待审核。推文未提及任何性能基准、价格或具体技术参数。

AYi@AYi_AInotes · 5月24日66

刚刚Claude Code之父Boris分享了Claude code最被低估的功能, 可以直接让你的编程效率翻5倍! 看来自动模式才是真正的杀手级功能啊! 没有任何权限弹窗, 不用再每隔30秒点一次允许, 你可以开一个会话让它自己跑完整个项目, 同时去开另一个会话干别的, 这就是多Clauding。 效率直接翻5倍。 现在Pro计划也能用了, 支持Sonnet 4.6和Opus 4.7, 还没试过的赶紧去体验! #Claude #AI #编程

译Claude Code之父Boris称自动模式(auto mode)是其最被低估的功能。该模式移除了所有权限弹窗,使得“多实例并行”(multi-clauding)成为可能:用户可启动一个会话自主运行整个项目,同时并行处理其他任务,从而将编程效率提升至5倍。此功能现已向Claude Pro计划用户开放,并支持Claude Sonnet 4.6与Opus 4.7模型。

Rohan Paul@rohanpaul_ai · 5月24日45

Good GPU performance summaries - in 6 mints.

译6分钟内获得良好GPU性能总结。

Berryxia.AI@berryxia · 5月24日61

兄弟们,看来 Claude 最近被 OpenAI 的 o1 抢的用户比较厉害。 如果你之前被封号了,现在可以登录自己的账号进行申诉: 1. 登录你自己的账号 2. 提交申诉理由(如果不会写,可以让 ChatGPT 或者其他大模型辅助填写) 3. 提交后会有个 review 的过程,耐心等待就行 大家可以去试一下。

译文章提到Claude近期因OpenAI o1的竞争流失用户。针对账号被封的用户,文中提供了申诉方法:登录个人账号后提交申诉理由(可借助其他大模型辅助填写),随后进入审核流程等待结果。

向阳乔木@vista8 · 5月24日45

周末了,做点娱乐向的产品,设计了个播放器,用来分享Suno生成的音乐。 同时支持电脑和移动端,但后台管理还不完善,都是Skill下载音乐上传。 先听听今天生成的歌:https://music.qiaomu.ai/ 开源地址:https://github.com/joeseesun/qiaomu-music-player-web

译作者分享了一个周末娱乐项目:一个用AI工具开发的Suno音乐生成播放器。该播放器已在线运行,支持电脑和移动端,但后台管理功能尚不完善,目前通过Skill进行音乐下载与上传。项目已开源。引用中补充了该播放器是使用ChatGPT内置的Codex工具在躺卧状态下完成开发的。

AYi@AYi_AInotes · 5月24日62

http://x.com/i/article/2058505118186635264 # 我用了三年 PDF 喂AI,昨天才发现自己一直在干一件特别蠢的事 PDF 不是 AI 的母语,这句话我第一次看到的时候,直接愣了三秒。我一直觉得,喂 AI 文档这事 PDF 是默认最优解,排版精准、跨平台稳定、连律师签合同都用它,AI 既然号称什么都能读,PDF 当然也没问题。 结果我错了,而且错得相当离谱。 从 2023 年开始玩AI到现在也三年了,我自己电脑里躺着几百份 PDF 文档。 说实话,每次扔给 AI 总有那么几次得到的回答让我想砸键盘,漏段落、串数据、还能编造原文里压根不存在的句子。 最离谱的一次,是上个月,我让 Claude 帮我读一份产品调研报告,PDF 三十几页,里面有一组用户留存数据「7 日留存 38%、30 日留存 19%」。 Claude 给我返回的总结里,这两个数字直接被换了位置,38% 写成了 19%,19% 写成了 38%。 我盯着那段回答看了好几分钟,喵的差点把它发给老板。 那一刻我以为是模型抽风,直到昨天才反应过来,是我一直在用错的方式喂它。 一、你以为 PDF 是最优解,其实它是二手翻译 事情是这样,最近好几个粉丝私信我同一个问题,为什么 AI 读他们的 PDF 总是出错,是模型不够新吗,要不要升级到 Pro。 我本来想糊弄过去,让他们换个 Claude 试试。 但话到嘴边停住了,因为我自己也踩过一模一样的坑。 那种感觉你应该熟悉,你花二十分钟把一份几十页的产品文档传上去,让 AI 总结核心要点,它给你一段看起来很正经的回答,你一开始还挺满意,结果回头核对原文,发现关键的那个数据,它写错了。 不是漏掉,是写错。 我跑去问 Grok 和 Claude,问的就一个问题,PDF 和 Markdown 到底哪个更适合喂给你? 两个模型的答案出奇一致:Markdown。 更让我没想到的是 Claude 接着说的一句话—— > 大量 RAG 工程实践的标准流程,是先把 PDF 转成 Markdown 再喂给模型。 啥意思呢,就是真正做 AI 应用的那帮专业团队,他们自己都不直接用 PDF 喂模型,他们先转一道,转成 MD 再说。 对,你没看错。 这不是因为他们闲,是因为剥开来看,PDF 在 AI 眼里本来就不是一份"文档",它是一张图加一堆坐标加一些字符,AI 得先把这堆东西重新拼回成"句子"才能开始读。 这一拼,损耗就来了。 打个比方,Markdown 就像别人直接把演讲稿递到你手里,每一个字都清清楚楚,PDF 呢,就像让一个同声传译先听一遍演讲、再凭记忆复述给你,他业务再熟练,也总会漏掉点什么。 我之前那个 38% 和 19% 被换位的故事,本质就是 AI 在"复述"的时候记混了数字。 差别就这么大。 二、AI 读 PDF 的时候,干的根本不是"读"这件事 这事最反直觉的地方在于,AI 读 PDF 的时候它真不是在"读"。 它在做一件很笨的活——识别每个字符在页面上的坐标,判断这一行和上一行是不是同一个段落,猜测这个表格的行列结构,还得把页眉页脚那些每页都重复出现的公司 logo 文字排除掉。 这些活本来应该排版软件干。 结果全甩给 AI 了。 而 Markdown 呢,标题就是 #,列表就是 -,加粗就是星号星号,结构是直接写在文本里的,AI 一眼就能看明白。 这就是为什么同一份文档,PDF 版本消耗的 Token 通常会比 Markdown 多出一截。 Token 是啥,你可以这么理解,AI 看东西、想东西、回答你,每一步都按字数收费,Token 就是它的算钱单位,你扔给它的格式越乱,它需要先"理顺"再"理解",钱就花在理顺上了。 更狠的是,你为这些脏活付完钱,AI 还容易干错。 这买卖谁做谁亏。 三、那 PDF 就一无是处吗?也不是 我自己用下来,有三种情况 PDF 反而是更优解。 第一,文档里有大量图表、设计稿、流程图,你希望 AI 直接看图说话,这时候 PDF 的多模态优势就出来了。 第二,需要严格保留原始版式和法律效力,比如合同、正式报告、盖章文件,别折腾,原样喂。 第三,你既要 AI 读懂文字、又要它理解视觉排版,比如分析一份产品宣传册的设计逻辑。 但说实话,我们日常喂给 AI 的,90% 都不是这些。 技术文档、学习笔记、论文、产品手册、内部知识库、周报月报,这些东西的最佳归宿,全是 Markdown。 四、我给自己定的三条规矩 研究完这件事,我做了三个调整。 第一,新文档全部 Markdown 起手。 Obsidian、Typora、VS Code、Notion 导出,工具一抓一大把,从源头上不给 AI 添麻烦。 第二,旧 PDF 先转再喂。 微软的 markitdown、老牌的 pandoc、专门给 LLM 优化的 LlamaParse,一键转完再喂,差距肉眼可见。 第三,重要文档双版本归档。 PDF 留着打印、签字、给人看,Markdown 专门拿来喂 AI、建知识库、做搜索。 说出来就是这么三条破规矩,但真改完之后,我自己的 AI 使用体验,肉眼可见地变好了。 最直接的反馈,就是上周我再读那份产品调研报告,先用 markitdown 转成 MD 再喂,那两个被换位的数字这次乖乖出现在了正确的位置。 五、输入决定输出 扯远了。 乱糟糟说了这么多,我想说的其实就一句—— AI 真正的能力上限,从来不取决于模型,取决于你喂给它什么。 这句话我在很多地方都看到过,但这次是自己踩了三年坑才真正记住的。 也是因为这次踩坑,我决定开一个新系列叫**「喂 AI 的艺术」**,今天这篇是第一集聊文档格式,后面还有 8 期,会继续挖那些容易被忽略、但一搞对就事半功倍的细节。 说实话,我也还在摸索。 你可以这么理解,用 AI 这件事就像养一盆植物,模型是种子,提示词是阳光,但你喂给它的格式,是土壤。种子再好,土壤板结,它也长不出你想要的样子。 每搞明白一件小事,就是给土壤松一锹土。 我们一起慢慢松。

译作者发现直接使用PDF文档喂给AI存在严重问题。AI处理PDF时并非进行“阅读”,而是在执行字符坐标识别、结构猜测等复杂任务,这不仅消耗更多Token,还容易导致数据错乱(如数字位置被调换)。相比之下,Markdown具有清晰的结构化标记,能直接被模型高效理解。经过咨询Claude和Grok,确认在大量RAG工程实践中,将PDF转换为Markdown再输入是标准流程。因此,建议对技术文档等非视觉主导内容,优先以Markdown格式创建,现有PDF可借助markitdown、LlamaParse等工具进行转换。

凡人小北@frxiaobei · 5月24日30

抽象、感动,终于知道了 Claude 的前世今生。 结尾竟然还有彩蛋😲

译内容创作者CuiMao发布了一条带有告别性质的视频,主题为Claude的“前世今生”。这条关于Anthropic的故事被创作者称为“最后一个”。视频使用AI视频生成工具seedance2制作完成,并在结尾设置了彩蛋。

meng shao@shao__meng · 5月24日73

让 Codex 回顾你过去的会话历史,识别重复出现的任务模式,并沉淀为可复用的 Skills 或 Subagent,来自 Codex 团队 @reach_vb 的分享 大多数开发者在使用 AI 编程助手时,会反复问同类问题: · "CI 为什么挂了?" · "帮我 review 这个 PR" · "写一下 changelog" · "追踪这个 bug" · "清理这个 diff" 这些重复的 prompt 本质上是未被显式抽象的工作流。每次手动重新描述,既浪费 token,也缺乏一致性。 Skills 和 Subagent 的沉淀方式区别是什么? · Skills:适用于可复用的工作流,多步骤、有固定流程、面向"怎么做" · Subagent:适用于边界清晰的角色或调查任务,单一职责、可委派、面向"谁来做" Prompt 设计的工程细节 · 数据源明确——基于 "recent Codex sessions" 而非凭空生成,让建议有真实依据。 · 二分类决策——强制 Codex 在 skill 和 subagent 之间做选择,避免模糊产出。 · 领域聚焦——列出 CI、PR review、changelog、docs、release、debugging、test triage 七个高频场景,收窄搜索空间。 · 质量约束——"Create the useful ones only. Keep them simple." 防止 AI 过度生成低价值产物。 Prompt 原文可以直接复制 Look through my recent Codex sessions and identify repeated workflows or repeated asks. For anything I keep doing manually, suggest: 1. a skill if it is a reusable workflow 2. a custom subagent if it is a bounded role or investigation task Focus on practical things like CI failures, PR reviews, changelogs, docs updates, release prep, debugging, and test triage. Create the useful ones only. Keep them simple.

译Codex 团队分享了一项实践:让 Codex 分析你近期的会话历史,识别重复出现的任务模式,并将其沉淀为可复用的产物。具体分为两类:面向固定流程的“技能”和面向单一职责的“子智能体”。通过设计针对性的提示词(聚焦于 CI 失败等七个高频场景),强制进行二分类选择,该方法旨在减少重复的手动描述,节省 token 并提升一致性。

Boris Cherny@bcherny · 5月24日78

People often ask what my biggest tip is for getting the most out of Claude Code. These days my #1 tip is: use auto mode Auto mode means no more permission prompts. It is the key building block for multi-clauding: start a session, then while it runs, work on another session in parallel.

译人们常问我,用好Claude Code的最大技巧是什么。 如今我的头号技巧是:使用自动模式。 自动模式意味着不再有权限提示。它是实现“多Claude并行”的关键构件:启动一个会话,然后在其运行时,并行处理另一个会话。

Rohan Paul@rohanpaul_ai · 5月24日51

Somebody just ran one trillion param model (Kimi K2.5) on a single RTX 3060 12GB GPU at over 4 tokens/sec and 768GB of second-hand Intel Optane memory. What happened is that a sparse model met an unusual memory tier that could hold its enormous body while the GPU handled the most time-sensitive organs. i.e. the bulk of the sparse expert weights live in a larger, cheaper memory tier and are pulled into the computation as needed. This worked because Kimi K2.5 is a Mixture-of-Experts model, so it has 1T total parameters but activates only 32B per token. The RTX 3060’s 12GB VRAM holds latency-sensitive parts like routing, attention, dense layers, and shared experts. The huge expert weights sit in Optane PMem, configured as RAM, while 192GB DDR4 ECC acts as cache. He is using 6 Optane PMem (DCPMM) sticks. This retired memory format was made to bridge DRAM and SSD performance. The 768GB Optane configuration, using 6x128GB modules, does beat the best NVMe SSDs on latency by a wide margin, but remains 2x to 3x slower than DRAM. llama.cpp handled hybrid GPU/CPU inference, with tensor placement tuned through flags like override-tensor. The result was roughly 4 tokens/sec, which is slow for chat but impressive for a local 1T-parameter model on cheap retired enterprise hardware. The DDR4 acted as cache, the Optane acted as a giant memory pool, and llama.cpp pushed routing and other critical tensors onto the 12GB GPU.

译近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上,运行了拥有1万亿参数的Kimi K2.5大语言模型,速度约为每秒4个token。这一成果得益于模型的混合专家架构,虽然总参数量巨大,但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存,而将庞大的专家权重存储在由二手英特尔傲腾持久内存(PMem)构成的768GB大容量内存池中,并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度,该方案为本地部署超大规模模型提供了一条低成本的技术路径。

AYi@AYi_AInotes · 5月24日70

http://x.com/i/article/2058381329318682624 # 我把每天刷 4 小时 X 找选题的活完全交给AI, 命中率从 15% 飚到 60%+,整套 Prompt + 工作流全部开源! > 这篇我跟兄弟们只捞干货,全篇三件事:AI 博主真正卡死的瓶颈到底在哪?怎么让AI Agent 24 小时替你刷 X、小红书、Reddit 找选题?我跑了两周的整套 Prompt + 5 平台阈值表全部开源,直接抄!文章最后还有一盆冷水和两周完整数据复盘,被信息流困住的兄弟拿走就用! 这事儿说出来可能有点凡尔赛,但我得先交个底—— 中推区 AI 圈我泡了半年了,最近真的想明白一件事,AI 博主最大的瓶颈不是写不出来,是不知道写什么。 我以前每天刷 4 小时 X + 小红书 + Reddit 找选题,刷到眼花,结果写出来的,还是跟风别人三天前已经写过的。 直到我把这件事完全交给了一台云手机,现在每天 0 刷 Feed,早上 8 点桌面上躺着一张选题表,命中率从 15% 涨到了 60%+。 心法、Prompt、5 平台扩展,这一篇我全部开源。 那话不多说,我先讲清楚我之前到底卡在哪。 # 一、AI 博主的一天,是从「刷」开始的 如果你是一个 AI 博主,你的一天大概是这样的。 打开 X,看 Sam Altman 又发了什么、Karpathy 又转了什么、哪个新 Skill 在刷屏,切到小红书,看 AI 测评、看 Prompt 分享、看谁又出了新工作流,切到 Reddit,看 r/LocalLLaMA、r/ClaudeAI 最新的高赞讨论,再切到 B 站,看哪个 UP 主又出了新教程。 刷完一圈,3-4 小时没了。 更操蛋的是,你刷到的那些「热点」,往往别人已经写完发出来了。 剥开来看,你在做的事本质上就是个体力活——用人眼盯数字,盯关键词,盯热度。 不需要你的判断,不需要你的品味,不需要你在场。 我一直觉得,「选题」这件事的本质就是个数据筛选问题,不是「有没有灵感」,是「有没有在对的时间扫到对的信号」。 这种活,能不能让 AI 干? 说实话,我之前真的试过,用过 RSS,用过各种聚合工具,自己还吭哧吭哧写过几个爬虫,最后全死在同一个地方——X 和小红书这种 App,根本没有体面的 API,你想要的「推荐流」数据,只活在 App 里。 # 二、转折点:让一台云手机替你刷 直到最近,我用上了 Airtap。 先讲清楚它是什么——一个能操作手机 App 的 AI Agent,给它一台云手机(云端跑的 Android),写个 Prompt,它就在那台手机上替你刷。 重点是这个,它不是 API 调用,是真的在「刷手机」。 所以 X 的 For You 流、小红书的发现页、Reddit 的 Hot,这些没有官方 API 的东西,它都能读。 你可能会想,这跟我打开手机刷有啥区别? 区别大了。 > 第一,它不睡觉。 > 第二,它跑在一个「空白人格」的手机上,不登录任何账号,推荐流是纯算法基线,没有被我的个人兴趣污染,看到的是平台真正在推什么。 > 第三,写一次 Prompt,每天定时跑。 你可以这么理解: > 原来你自己刷 X,相当于在一家被你常点的口味彻底「惯坏」的餐厅吃饭,菜单永远是它觉得你爱吃的那几样。 但你想知道这家店真正的招牌是啥,得换一张完全空白的脸进去重新点一遍,这就是云手机在做的事。 # 三、我的具体玩法,分三步 ## 第一步:定义你的「信号阈值」 参考样本里有个博主用「100w+ 播放」做阈值,那是给泛流量博主用的,但AI 圈不一样。 AI 圈的信号不在「播放量」,在「转发数 + 评论数 + 作者权重」。 我给 X 定的阈值是: - 转发 ≥ 500 - 或者点赞 ≥ 2000 - 内容必须命中关键词:Claude / GPT / Cursor / Skill / MCP / Agent / Prompt 为什么是这个数呢? 因为 AI 圈在 X 上的盘子,比泛娱乐小一个数量级,500 转发在 AI Twitter,等于泛流量 100w 播放,都是「刚验证、还没饱和」的临界点。 低于这个量级,是噪音,写出来没人看。 高于 1 万转发,已经被反复写烂,你写也是 me too。 100-500 这个区间,才是「已经验证有人愿意看 + 还没被大盘吃透」的黄金带。 说白了,信号阈值这件事最反直觉的地方就在这——不是越高越好,是要选一个「刚出锅但还没人吃」的温度。 ## 第二步:写一个能跑的 Prompt 这是我跑了两周、迭代了四五次的版本,直接抄能用: 把它拖进 Airtap,配成每日 Routine,早上 7 点开始跑,8 点你打开电脑就有表。 跑出来长这样: 这就是你这一周的选题池。 ## 第三步:多 App 并行,这才是最爽的部分 把上面的 Prompt 90% 复用,只改 App 和阈值: 每个 App 开一台云手机并行跑,我现在 4 台云手机同时在跑,每天早上 8 点拿到 4 张选题表。 你会发现一个非常爽的现象,同一个「信号」同时出现在 3 个平台,那基本就是必写的。 这就是倍数效应。 最耗人的「找选题」被自动化之后,覆盖 5 个平台和覆盖 1 个平台,投入的人力几乎一样。 打个比方,原来你只能开一辆车跑一条快递线,现在你雇了 4 个不会累的司机,4 条线同时跑,油钱(云手机成本)几乎不变,订单量翻 4 倍。 这就是工作流的复利。 ## 四、两周的数据复盘,数字都是真的 我做了一个粗粒度的对比。 之前(手动刷): - 每天刷 Feed 找选题:3-4 小时 - 一周 5 天 ≈ 20 小时 - 一年 ≈ 1000 小时 - 选题→文章命中率:约 15% 10 个想法只有 1-2 个真能写成文章。 现在(Airtap 跑): - 每天手动刷:0 - 早上看表 + 二次筛选:20 分钟 - 一周 ≈ 2 小时 - 选题→文章命中率:60%+ 20 分钟,对比 20 小时。 一年下来,省出的不是 998 个小时,是 998 个「原来要瞪着屏幕死磕」的小时。 这些时间我没拿去躺平,是拿去深度写作和实测。 因为我一直觉得,深度写作和实测,才是 AI 还干不了的部分。 ## 五、但我得给自己泼一盆冷水 不能把这套吹成救世主,那不诚实。 Airtap 帮你完成的是「信号筛选」,不是「判断」。 表格里的 20 条,能转化成文章的可能只有 3-5 条。 为什么? 因为 AI 不知道—— - 你的粉丝关心什么 - 你的风格适合写什么角度 - 哪个话题别人还没深挖 - 哪个话题写出来会得罪人 这些判断的活儿,还得你自己干。 而且坦白讲,Airtap 现在不是完美的。 偶尔会卡在某个弹窗,偶尔会读错数字,偶尔会跳过该命中的帖子。 我大概一周要调一次 Prompt,调阈值、调关键词、加新的边界 case。 这事儿吧,我翻来覆去还是觉得不能粉饰。 Airtap 不是救世主,它属于流水线的第一道工序。 但就这一道工序,已经把我从「每天 4 小时刷 Feed 的体力工」,变成了「每天 20 分钟做判断的内容人」。 身份变了,剩下的事就好办了。 # 六、最后真正想说的 最后想说的核心其实就一句—— AI 博主真正的瓶颈,从来不是「AI 不够强」,是「你的工作流没把 AI 放对位置」。 把 AI 放在「帮你写」,你会发现它写的还不如你自己。 把 AI 放在「帮你筛」,你会发现你自己的产能瞬间翻 3 倍。 未来一年,我的判断是——单兵 AI 博主跟团队的差距,越来越来自「工作流的成熟度」,而不是「谁更聪明」。 写到这儿,我自己其实也还在迭代。 这套 Prompt 我下个月可能又改了,这套阈值我也可能又调了。 但「让 AI 替我筛信号」这个底层动作,我已经回不去了。 就像一个开过电动车的人,再让他回去骑共享单车,他骑得动,但不会再骑了。 如果你也是中推区的 AI 同路人,欢迎拿走这套 Prompt 直接试,跑通了告诉我数据,我帮你迭代下一版,我们一起琢磨。 ⚡️ Airtap 官网:airtap.ai 🌅 关注 @airtap_ai 看更多 Routine demo 📌 觉得有用的话,帮我点个赞 / 转发,让更多被信息流困住的兄弟看到 (文中的Airtap只是我自用的Agent 工具以及写文章提到的参考案例,不构成任何推荐)

译内容创作者的核心瓶颈往往在于选题而非写作。作者通过部署AI Agent驱动云手机,自动化刷取X、小红书、Reddit等平台的推荐流,替代了每日数小时的人工筛选工作。其工作流关键在于为不同平台定义有效的“信号阈值”(例如在AI圈的X平台,转发≥500或点赞≥2000),并编写特定Prompt指导Agent执行筛选。通过多台云手机并行运行,实现了跨平台的高效信号捕捉。此方法将选题耗时从每日3-4小时降至20分钟,文章命中率从约15%提升至60%以上。作者指出,AI Agent主要完成初筛,最终的内容判断与风格适配仍需人工完成。这套开源工作流旨在证明,优化工作流中AI的位置,能极大提升单兵创作者的产能。

Berryxia.AI@berryxia · 5月24日38

当时我做这个工具的目的和诉求其实就是想自己有300 多个群聊,管理和查看其实很费劲。 1️⃣ 可以满足我查看和清理僵尸群,长期没有什么消息的死群。 2️⃣ 活跃的群的有效信息的快速阅读,以及自己社群活跃用户的筛选。 3️⃣ 可以通过与一些甲方或者大家的咨询找到或者遗漏的消息,比如可能忘记回复,重要的关键字词的挖掘。 4️⃣ 业务中有些项目的进展或者最近的状态,可以让AI帮我快速梳理出来待办事项。 这就是我当时想开发这个工具的目的,现在有想法基本跑出核心功能很快。 大家一定有想法就要去干,干中学非常受用。 我的版本还在迭代,可能大范围如果有风险的话。 就只能低调发布~ ✌️。 你懂得,当然这个卡比的wx-cli 能用就记得关闭和保持不要随时更新微信哈。

译作者为管理300多个微信群聊而开发了一款微信消息管理工具。该工具旨在帮助用户清理长期无消息的“僵尸群”,快速阅读活跃群内的有效信息,并筛选出社群中的活跃用户。同时,它能挖掘容易被遗漏的重要关键词或回复提醒,并让AI帮助梳理项目进展,生成待办事项。该工具底层基于wx-cli,目前核心功能已跑通,但仍需迭代并可能低调发布。未来完善后,或将考虑开源。

Thariq@trq212 · 5月24日55

every now and then I remember you can run the "please save me money" prompt and it will actually work

译每隔一段时间我就会想起,你可以运行“请帮我省钱”的提示词,它真的会起作用。

向阳乔木@vista8 · 5月24日43

skill写好以后,躺床上也可以用ChatGPT中的codex开发网站了。 正在开发一个Suno音乐播放器,把AI生成的歌曲都传上去。

Peter Steinberger 🦞@steipete · 5月24日57

I'm refactoring an older part of the codebase (subagents) that touches a lot of code, and autoreview is running for 5h already and fixing tons of issues. https://github.com/openclaw/agent-skills/blob/main/skills/autoreview/SKILL.md

译我正在重构代码库中一个较旧的部分(子代理),涉及大量代码,而自动审查已经运行了5小时,正在修复大量问题。

elvis@omarsar0 · 5月24日72

Just released my new /lesson-generator skill. Use it with your agent to learn anything: - generate lessons/courses on any topic - include nano-banana images with my /image-generator skill - present the course as an HTML artifact And it's also available to use in our academy.

译刚刚发布了新的 /lesson-generator 技能。 与你的代理一起使用它来学习任何内容: - 生成任何主题的课程/教程 - 结合我的 /image-generator 技能添加 nano-banana 图片 - 将课程呈现为 HTML 作品 它也已在我们的学院中可用。

Peter Steinberger 🦞@steipete · 5月24日41

Still limited by compute, so I built a thing that runs codex in the cloud, powered by @Cloudflare firecracker boxes (and since that's not beefy enough for larger projects, tests are run via crabbox) Uses Ghostty ofc, via WebAssembly. Codex replicated itself, basically.

译仍然受限于算力,所以我构建了一个在云端运行Codex的工具,由@Cloudflare的Firecracker实例驱动(由于其性能不足以处理大型项目,测试通过crabbox运行)。 当然使用Ghostty,通过WebAssembly实现。 Codex基本上实现了自我复制。

Peter Steinberger 🦞@steipete · 5月24日48

I built an autotriage skill for codex that has a set of guidelines + reads VISION.md from my repos, so issues/prs that have a clear way of - fit vision of the project - being inferrable in code with high confidence - clear fix - can be live tested Are now worked on autonomously. Codex can use a VM + computer vision (via https://crabbox.sh , new parallels backend) to verify fixes, so it can work without interrupting me. I manually review suggestions. Since it was tedious to type in issues, I added an issue browser into http://repo.bar that parses common clipboard formats by codex so I can click through them conveniently.

译开发者为Codex创建了一套自动化分诊技能,通过预设指南并读取项目VISION.md文件,自动处理符合特定标准的issue和PR。这些标准包括契合项目愿景、代码可高置信度推断、修复方案明确且支持实时测试。Codex利用虚拟机与计算机视觉(通过Crabbox平台)验证修复结果,实现自主工作流,减少人工介入。开发者保留手动审核环节,并在repo.bar中集成了issue浏览器,方便点击处理常见剪贴板格式的问题。该系统旨在提升开发效率,让AI承担重复性代码审查与测试任务。

向阳乔木@vista8 · 5月24日62

最近最火的Codex优化网络速度Use Case,写了个提示词,亲测效果不错: 1. 在Codex中输入 “/goal” ,如果中文版输入 “/目标”,如果不用,直接发提示词也行。 2. 提示词如下: 优化当前电脑的网络速度和稳定性。 请按“先诊断、再最小可逆修改、最后复测”的方式执行,不要直接破坏性重置网络。 诊断要求: 1. 先跑 before 基准:networkQuality、DNS 查询耗时、到路由器的 ping、到公网 DNS 的 ping。 2. 区分真实公网链路和本机代理/VPN/TUN:检查 scutil --nwi、route get default、scutil --dns、scutil --proxy。 3. 检查 Wi‑Fi 质量:频段、信道、带宽、RSSI、噪声、Tx Rate、周边干扰。 4. 检查 MTU、丢包、mDNS/DNS 缓存、网络服务顺序。 5. 找出高流量或会接管路由的后台进程,如 VPN、Tailscale、Shadowrocket、Stash、iCloud、Dropbox、网盘、下载器。 优化要求: 1. 只做安全、可逆、低风险修改。 2. 把真实使用的 Wi‑Fi/以太网排到网络服务第一位。 3. 禁用明显无用的伪网络服务或旧网络服务,但不要删除配置。 4. 根据实测 DNS 延迟设置更快的 DNS。 5. 刷新 DNS 和 mDNS 缓存。 6. 停止或提示我关闭明显占用带宽的后台程序。 7. 如果需要 sudo 或会影响 VPN/远程连接,先说明风险,不要强行执行。 复测要求: 1. 再跑 after:networkQuality、DNS 查询耗时、路由器 ping、公网 ping。 2. 对比 before/after:下行、上行、空闲延迟、加载延迟、丢包、DNS 耗时。 3. 总结发现的 3 个主要问题、已修复项、未修复但建议手动处理项。

译这是一个为Codex设计的网络优化提示词,其核心逻辑是遵循“先诊断、再最小可逆修改、最后复测”的安全操作流程。诊断阶段需全面检测网络基准性能、Wi-Fi质量及后台进程,优化阶段则仅执行如调整服务顺序、设置DNS等低风险、可逆的调整。最后通过对比优化前后的数据验证效果。整个流程旨在确保网络调优过程安全、可追溯且有效。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月26日
01:28
Rohan Paul@rohanpaul_ai
22
这款自主除草机器人使用AI视觉在幼苗作物中检测杂草,并立即用高精度激光脉冲进行定向清除。 实时车载GPU绘制每株植物位置,并精确引导激光对准杂草 @carbon_robotics
具身智能多模态教程/实践
00:18
AYi@AYi_AInotes
52
AI 行业顶级人物图鉴:你不可错过的 42 位宝藏大佬

本推文汇总了 42 位在深度学习、大语言模型(LLM)、AI 编程、视频生成等核心赛道上备受关注的知名人士。名单整合了多位业界人士的推荐,既包括图灵奖得主 @ylecun、LLM 专家 @karpathy、Cursor 创始人 @alexgraveley、英伟达首席科学家 @drjimfan、OpenAI 资深研究员 @lilianweng 等行业标杆,也补充了如 @simonw(LLM 工具)、@chuan_en(大模型实战)等实战派人物。推文旨在为读者提供一份全面的行业关注列表,并邀请更多补充。

AYi: http://x.com/i/article/2058381329318682624

大佬观点教程/实践
5月25日
23:31
歸藏(guizang.ai)@op7418
40
AI技能新预告:一键生成社交媒体封面与图文

推文预告了一个基于PPT技能的新项目,该技能能够一键生成适用于微信公众号和小红书平台的封面图。同时,它也能根据文档内容,自动生成符合小红书图文所需的3:4比例的多张图片。该技能的一个核心特点是自动化处理能力,可以自动处理用户提供的截图素材并进行内容匹配。

MCP/工具图像生成教程/实践
23:23
向阳乔木@vista8
55
Codex一键部署umami统计,实现口喷建站

用户通过Codex在VPS上自部署了umami统计工具,可为网站添加无限量流量监控。相比官方版有限制,自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成,体现了“口喷建站”的便捷性。

OpenAI教程/实践编码部署/工程
22:38
Peter Steinberger 🦞@steipete
62
大家好:当你编写技能时,请让你的智能体注重 token 效率,放宽语法要求。我看到太多技能在描述中写了长篇大论,而所有这些内容都会被加载到每个上下文中。 我写了一个技能来找出最糟糕的例子。https://github.com/steipete/agent-scripts/blob/main/skills/skill-cleaner/SKILL.md
智能体教程/实践部署/工程
21:23
向阳乔木@vista8
70
调试GPT-image-2提示词,探索AI Agent适配

为准备面向传统媒体的Prompt、技能及AI编程分享,作者通过Youmind反复调试,为GPT-image-2生成了一个简洁风格的提示词。该提示词有效降低了生成内容的“AI味”,并更适配AI智能体产品,为AI提供了更多自主推理与发挥的空间。

OpenAI图像生成教程/实践
18:24
PixVerse@PixVerse_
29
氛围、剪辑、能量,一切都恰到好处!

divy 🦨: I heard the AI creator role at @EnergyWabbits is filled But I tried making a match cut ad for wabbits because their ener...

图像生成教程/实践视频
18:20
Berryxia.AI@berryxia
43
AI工具Bloome现已支持iOS,体验丝滑

用户发现AI工具Bloome已可在美区iOS上使用,称其体验“太丝滑”。该工具支持多Agent协作模式,引用推文描述了具体工作流程:三个Agent合作,其中两个负责执行任务,一个负责复核与查漏补缺,用户仅需通过指令(“动动嘴皮子”)与它们交互。

Berryxia.AI: 这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。

智能体MCP/工具教程/实践
18:18
AYi@AYi_AInotes
74
小红书自动化运营Skill:省80%重复劳动

这是一个发布于GitHub的开源Skill,用于小红书个人号或矩阵运营。它通过浏览器自动化模拟真人操作,而非调用小红书API,以降低封号风险。该工具支持零代码操作,用户可通过与Claude等大语言模型交互,下达分析、生成选题、复刻爆款、自动发布与回复评论等指令,形成完整的运营闭环。所有操作结果会存为Markdown知识库,安装方式是通过Openclaw直接引用其GitHub仓库。

AYi: http://x.com/i/article/2058381329318682624

MCP/工具教程/实践
15:53
向阳乔木@vista8
57
Suno生成小甜歌的风格与参数分享

推文分享了使用Suno生成一首“小甜歌”的经验,其风格选择了Dream Pop(营造梦幻朦胧的空间感)与Disco-lite(提供有律动但不重的节奏)。在人声提示词上使用了“Breathy female vocal”以模拟女孩在耳边哼唱的效果,情绪设定为“Softly euphoric”以实现轻柔的欣快感,并应用了“Soft reverb”。最后附上了生成歌曲的链接。

多模态教程/实践
15:20
Berryxia.AI@berryxia
48
这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。
智能体教程/实践
13:53
向阳乔木@vista8
64
X不让直接发音频,可以直接让Codex帮把音频转成MP4。 当然,会ffmpeg指令的话也很简单,但大模型太适合做这种转格式操作了。
多模态教程/实践编码
13:18
AYi@AYi_AInotes
59
AI自媒体实战:信号阈值筛选与提示词优化指南

分享AI自媒体从0到4万粉的实战经验。核心在于精准筛选内容信号:建议设置X平台阈值为转发≥500或点赞≥2000,聚焦Claude/GPT/Cursor/Agent/MCP等关键词,定位“已验证未饱和”的黄金区间(100-500转发)。强调避开泛流量陷阱与低质AI洗稿,需结合作者权重判断。同时提供一套经多轮迭代的实用提示词模板,用于自动化信息搜集,直接可部署使用。

AYi: http://x.com/i/article/2058381329318682624

搜索教程/实践
11:20
Tibo@thsottiaux
70
使用计算机使用功能,你可以让 Codex 取消你不再需要的订阅。观看过程非常愉快。没有特指哪个,对所有订阅都有效。
智能体MCP/工具OpenAI教程/实践
10:20
StepFun@StepFun_ai
39
@aresotik 用 Step Plan 和 Step 3.5 Flash 构建了一个轻量级会议纪要助手,以解决普遍存在的会议记录杂乱、行动项难以追踪的问题。用户粘贴原始笔记后,工具能输出包含摘要、行动项、风险、截止日期和跟进文案的结构化内容。其中 Step Plan 是 StepFun 提供的订阅制服务,支持开发者在各类工具中高效调用 Step 3.5 Flash 等模型。该工具设计简单,旨在提供实际帮助。

ares. 🎧: I built a lightweight meeting notes assistant with Hermes + StepFun's Step Plan. Step Plan is a subscription-based AI se...

推理教程/实践
09:17
AYi@AYi_AInotes
66
作者分享了其高产的自媒体AI工作流。

作者开源了一套自媒体AI工作流,核心是利用AI智能体自动搜集小红书、推特等平台信息,将每日3-4小时手动筛选缩减至20分钟,产能提升3倍以上。其后续使用Codex的定时任务功能,每天早上自动将筛选出的选题,依据预设提示词(Prompt)整理成包含总结、数据、案例、金句和行动建议的结构完整行业日报。整套流程为“Agent搜集信息 → Codex结构化产出 → 作者最终判断润色”,实现近乎零维护。作者强调,AI辅助的关键在于用对位置,让AI负责筛选与搭建结构而非直接代写,并认为每月花费20美元来换取每天约3小时的时间是高性价比的。

AYi: http://x.com/i/article/2058381329318682624

智能体开源生态教程/实践
08:17
karminski-牙医@karminski3
57
比刷arXiv更高效:PapersWithCode一站式获取AI论文与代码

介绍了一个由HuggingFace开源团队成员开发的网站PapersWithCode,该网站能实时收录最新的AI论文和GitHub代码库。它提供了优秀的导航功能,支持按领域浏览论文,并能直接展示模型的benchmark数据和HuggingFace页面,为AI从业者提供了高效的一站式信息聚合服务。

Hugging Face搜索教程/实践
04:27
Rohan Paul@rohanpaul_ai
46
使用 Claude Skills 的有趣方式

Claude Skills 是一种功能,使 Claude 能以可重复方式完成特定任务。它是一个指令文件夹,包含提示词、脚本和资源(如 API、文件、MCP 服务器),Claude 动态加载以提升专业任务性能。技能通过 YAML 配置将工具打包成可重复工作流,用户可在对话中直接调用,例如“运行文档套件”或“使用网页应用测试”。Reddit 上的讨论表明,这类技能(如 10 种被验证的技能)能显著改变工作流程,提升生产力,是构建更强大 AI 智能体的基础模块。

AnthropicMCP/工具教程/实践
02:20
宝玉@dotey
71
在Codex App中查询/goal任务进展及进行操作

对于正在进行中的/goal长任务,可通过输入 /side 指令开启一个侧边对话来查询进度,该对话会话共享当前上下文且不影响主线程。任务启动后,输入框上方提供暂停、编辑或删除等操作选项。

宝玉: 如何在 Codex App 使用 /goal 的简单说明: 1. 升级 Codex App 到最新版本 2. 先在命令行运行一下下面的指令: > codex features enable goals 或者手动修改 ~/.codex/con...

智能体教程/实践编码
01:36
Greg Brockman@gdb
精选86
这是一个结构化的提示词,用于指导 Codex 自动分析其历史记录以识别并固化重复工作流。该框架要求 Codex 回顾会话、Memories 等数据,找出重复、耗时且有明确复用价值的任务。筛选标准包括至少出现两次、输入稳定、可提升效率等。最终,Codex 应以"技能"、子智能体或自动化工具等最小实用形式创建或扩展现有资产,避免冗余。流程包括生成候选清单、执行创建,并汇报结果与待验证项。

Vaibhav (VB) Srivastav: UPDATE: Came up with an even better version of this prompt after the feedback Ask Codex to look across your sessions, Me...

智能体OpenAI教程/实践编码

推荐理由:GDB 这个 prompt 把 Codex 从写代码的帮手变成了你的私人效率教练,让它自己找出你过去一个月里哪些重复工作该自动化,深度 Codex 用户直接抄作业就行。
5月24日
23:23
PixVerse@PixVerse_
62
在Pixverse中进行角色设计工作流测试 使用GPT Image 2.0为Lucas创建视觉形象,使用Seedance 2.0制作动画弹跳表演。 从静态概念图到电影级动态效果。 RT + Follow + Reply = 工作流
图像生成多模态教程/实践视频
23:18
Berryxia.AI@berryxia
56
Claude 用户账号申诉通道现已开放

推文指出,近期 Claude 用户因 OpenAI Codex 的竞争而流失。核心信息是通知此前账号被封的用户,申诉渠道现已开放。流程包括:1. 登录个人账号;2. 提交申诉理由;3. 等待审核。推文未提及任何性能基准、价格或具体技术参数。

Anthropic教程/实践
23:17
AYi@AYi_AInotes
66
Claude Code之父分享"自动模式":编程效率翻5倍的底层能力

Claude Code之父Boris称自动模式(auto mode)是其最被低估的功能。该模式移除了所有权限弹窗,使得“多实例并行”(multi-clauding)成为可能:用户可启动一个会话自主运行整个项目,同时并行处理其他任务,从而将编程效率提升至5倍。此功能现已向Claude Pro计划用户开放,并支持Claude Sonnet 4.6与Opus 4.7模型。

Boris Cherny: People often ask what my biggest tip is for getting the most out of Claude Code. These days my #1 tip is: use auto mode ...

AnthropicMCP/工具教程/实践编码
22:27
Rohan Paul@rohanpaul_ai
45
6分钟内获得良好GPU性能总结。
教程/实践部署/工程
22:18
Berryxia.AI@berryxia
61
Claude账号被封后申诉流程指南

文章提到Claude近期因OpenAI o1的竞争流失用户。针对账号被封的用户,文中提供了申诉方法:登录个人账号后提交申诉理由(可借助其他大模型辅助填写),随后进入审核流程等待结果。

Anthropic教程/实践
21:52
向阳乔木@vista8
45
用Codex开发Suno音乐播放器开源分享

作者分享了一个周末娱乐项目:一个用AI工具开发的Suno音乐生成播放器。该播放器已在线运行,支持电脑和移动端,但后台管理功能尚不完善,目前通过Skill进行音乐下载与上传。项目已开源。引用中补充了该播放器是使用ChatGPT内置的Codex工具在躺卧状态下完成开发的。

向阳乔木: skill写好以后,躺床上也可以用ChatGPT中的codex开发网站了。 正在开发一个Suno音乐播放器,把AI生成的歌曲都传上去。

开源生态教程/实践语音
21:17
AYi@AYi_AInotes
62
PDF与Markdown喂AI的效率差异与最佳实践

作者发现直接使用PDF文档喂给AI存在严重问题。AI处理PDF时并非进行“阅读”,而是在执行字符坐标识别、结构猜测等复杂任务,这不仅消耗更多Token,还容易导致数据错乱(如数字位置被调换)。相比之下,Markdown具有清晰的结构化标记,能直接被模型高效理解。经过咨询Claude和Grok,确认在大量RAG工程实践中,将PDF转换为Markdown再输入是标准流程。因此,建议对技术文档等非视觉主导内容,优先以Markdown格式创建,现有PDF可借助markitdown、LlamaParse等工具进行转换。

检索增强教程/实践
21:07
凡人小北@frxiaobei
30
内容创作者CuiMao发布了一条带有告别性质的视频,主题为Claude的"前世今生"。这条关于Anthropic的故事被创作者称为"最后一个"。视频使用AI视频生成工具seedance2制作完成,并在结尾设置了彩蛋。

CuiMao: 各位好,这真的是我最后一个关于Anthropic的故事了,本视频由seedance2制作完成。感谢你一直以来对我的关注。结尾有彩蛋。

Anthropic教程/实践
20:51
meng shao@shao__meng
73
利用 Codex 会话历史自动化提炼可复用能力

Codex 团队分享了一项实践:让 Codex 分析你近期的会话历史,识别重复出现的任务模式,并将其沉淀为可复用的产物。具体分为两类:面向固定流程的“技能”和面向单一职责的“子智能体”。通过设计针对性的提示词(聚焦于 CI 失败等七个高频场景),强制进行二分类选择,该方法旨在减少重复的手动描述,节省 token 并提升一致性。

Vaibhav (VB) Srivastav: Copy and paste this into your codex: "Look through my recent Codex sessions and identify repeated workflows or repeated ...

智能体教程/实践编码
20:07
Boris Cherny@bcherny
同事件精选78
人们常问我,用好Claude Code的最大技巧是什么。 如今我的头号技巧是:使用自动模式。 自动模式意味着不再有权限提示。它是实现"多Claude并行"的关键构件:启动一个会话,然后在其运行时,并行处理另一个会话。

ClaudeDevs: Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7 Shift+tab, a...

智能体Anthropic教程/实践编码
同一事件,精选展示《Claude自动模式新增Pro计划与模型支持》
推荐理由:Boris 透底 Claude Code 最高效用法,auto mode 免确认弹窗、支持并行 session,把 AI 编程从串行变并行,值得一开。
14:27
Rohan Paul@rohanpaul_ai
51
二手显卡与过时内存成功本地运行万亿参数大模型

近期有技术爱好者成功在单张二手RTX 3060 12GB显卡上,运行了拥有1万亿参数的Kimi K2.5大语言模型,速度约为每秒4个token。这一成果得益于模型的混合专家架构,虽然总参数量巨大,但每次推理仅激活32B参数。实现的关键在于将延迟敏感的核心组件置于GPU显存,而将庞大的专家权重存储在由二手英特尔傲腾持久内存(PMem)构成的768GB大容量内存池中,并以DDR4内存作为缓存。通过llama.cpp工具进行混合调度,该方案为本地部署超大规模模型提供了一条低成本的技术路径。

开源生态教程/实践端侧部署/工程
12:17
AYi@AYi_AInotes
70
AI选题工作流:从4小时到20分钟的效率革命

内容创作者的核心瓶颈往往在于选题而非写作。作者通过部署AI Agent驱动云手机,自动化刷取X、小红书、Reddit等平台的推荐流,替代了每日数小时的人工筛选工作。其工作流关键在于为不同平台定义有效的“信号阈值”(例如在AI圈的X平台,转发≥500或点赞≥2000),并编写特定Prompt指导Agent执行筛选。通过多台云手机并行运行,实现了跨平台的高效信号捕捉。此方法将选题耗时从每日3-4小时降至20分钟,文章命中率从约15%提升至60%以上。作者指出,AI Agent主要完成初筛,最终的内容判断与风格适配仍需人工完成。这套开源工作流旨在证明,优化工作流中AI的位置,能极大提升单兵创作者的产能。

智能体教程/实践
11:18
Berryxia.AI@berryxia
38
微信群聊管理工具开发心得与开源展望

作者为管理300多个微信群聊而开发了一款微信消息管理工具。该工具旨在帮助用户清理长期无消息的“僵尸群”,快速阅读活跃群内的有效信息,并筛选出社群中的活跃用户。同时,它能挖掘容易被遗漏的重要关键词或回复提醒,并让AI帮助梳理项目进展,生成待办事项。该工具底层基于wx-cli,目前核心功能已跑通,但仍需迭代并可能低调发布。未来完善后,或将考虑开源。

向阳乔木: 根据神佬 @berryxia 的截图,丢给Codex复刻的微信消息驾驶舱。 底层是卡比的wx-cli,等完善后看好不好开源。

智能体其他教程/实践
10:45
Thariq@trq212
55
每隔一段时间我就会想起,你可以运行"请帮我省钱"的提示词,它真的会起作用。
Anthropic教程/实践编码
09:51
向阳乔木@vista8
43
skill写好以后,躺床上也可以用ChatGPT中的codex开发网站了。 正在开发一个Suno音乐播放器,把AI生成的歌曲都传上去。
OpenAI教程/实践编码
06:07
Peter Steinberger 🦞@steipete
57
我正在重构代码库中一个较旧的部分(子代理),涉及大量代码,而自动审查已经运行了5小时,正在修复大量问题。
GitHub教程/实践编码
04:51
elvis@omarsar0
72
刚刚发布了新的 /lesson-generator 技能。 与你的代理一起使用它来学习任何内容: - 生成任何主题的课程/教程 - 结合我的 /image-generator 技能添加 nano-banana 图片 - 将课程呈现为 HTML 作品 它也已在我们的学院中可用。
智能体图像生成教程/实践
02:37
Peter Steinberger 🦞@steipete
41
仍然受限于算力,所以我构建了一个在云端运行Codex的工具,由@Cloudflare的Firecracker实例驱动(由于其性能不足以处理大型项目,测试通过crabbox运行)。 当然使用Ghostty,通过WebAssembly实现。 Codex基本上实现了自我复制。
教程/实践编码
01:37
Peter Steinberger 🦞@steipete
48
为Codex构建自动化分诊技能:指南与VISION.md集成

开发者为Codex创建了一套自动化分诊技能,通过预设指南并读取项目VISION.md文件,自动处理符合特定标准的issue和PR。这些标准包括契合项目愿景、代码可高置信度推断、修复方案明确且支持实时测试。Codex利用虚拟机与计算机视觉(通过Crabbox平台)验证修复结果,实现自主工作流,减少人工介入。开发者保留手动审核环节,并在repo.bar中集成了issue浏览器,方便点击处理常见剪贴板格式的问题。该系统旨在提升开发效率,让AI承担重复性代码审查与测试任务。

智能体MCP/工具OpenAI教程/实践
01:21
向阳乔木@vista8
62
最近最火的Codex优化网络速度Use Case,写了个提示词,亲测效果不错

这是一个为Codex设计的网络优化提示词,其核心逻辑是遵循“先诊断、再最小可逆修改、最后复测”的安全操作流程。诊断阶段需全面检测网络基准性能、Wi-Fi质量及后台进程,优化阶段则仅执行如调整服务顺序、设置DNS等低风险、可逆的调整。最后通过对比优化前后的数据验证效果。整个流程旨在确保网络调优过程安全、可追溯且有效。

教程/实践
‹ 上一页
1…1415161718…31
下一页 ›