AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1227 条
全部一手资讯X论文
标签「教程/实践」清除
SemiAnalysis@SemiAnalysis_ · 6月1日26

Ever wonder what L11 diags means? Let's break it into two components: L11 and diags. (1/5)

译好奇L11诊断是什么意思吗?让我们把它拆解成两个部分:L11和诊断。(1/5)

AYi@AYi_AInotes · 6月1日71

Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级 总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。 这可不是什么几块钱的优惠券啊宝子们, 这是GitHub给全球学生的生产力启动资金, 很多人毕业之后才知道这个东西 拍大腿后悔了好几年😭 2026年最新核心福利(最值钱的几个): • GitHub Pro 永久免费(直到毕业) • GitHub Copilot Pro 无限免费用(AI写代码神器) • Cursor Pro 1年免费(今年新增,现在最火的AI编辑器) • JetBrains 全家桶免费(IDEA/PyCharm/WebStorm全解锁) • DigitalOcean $200 云服务器额度(能用一整年) • Azure $100 云额度 + 免费域名 + SSL证书 • Canva Pro/1Password/Notion等50+工具免费/折扣 🆙划重点: 13岁以上就能领,高中生也可以 没有Star数要求,没有项目要求 有.edu邮箱基本秒过 没有的话拍个学生证照片也行 审核快的几分钟,慢的最多1天 💡 避坑指南(90%的人都会踩): • 认证通过后福利不会自动开通,要手动逐个领取 • 每年需要重新验证一次学生身份 • 毕业前一定要把能领的都领了,过期不补 • 非学生也能看页面里的教育折扣,很多工具都有优惠 申请入口放评论区了,感兴趣自取喔

译GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。

向阳乔木@vista8 · 6月1日66

基于开源的沉浸式翻译插件 read-frog。 让Codex开发了一套单词学习系统。 每天阅读英文网页收藏的单词,变成闪卡可复习,基于艾宾浩斯曲线遗忘曲线。 此单词学习模式,根据单词难度(如CET6+)旁边加上中文翻译,标记掌握情况。 如果一篇文章没生词翻译,说明掌握火候差不多了 原始Github见评论

译用户基于开源沉浸式翻译插件 read-frog,使用 Codex 开发了一套单词学习系统。该系统能将用户在阅读英文网页时收藏的单词自动生成闪卡进行复习,并基于艾宾浩斯遗忘曲线安排学习周期。系统会根据单词难度(例如 CET6+)在旁边添加中文翻译,并标记单词的掌握情况。通过此模式,当一篇文章不再显示生词翻译时,即表明学习者已基本掌握该文章词汇。

向阳乔木@vista8 · 6月1日59

用飞书+AI读书,划线就能对话!这个阅读法太上头了 测试了一种另类AI阅读方法,结合飞书CLI,相当有趣! 1. 让 Codex或CC 把Epub电子书按章节写入飞书文档。 2. 人肉阅读,有感触的地方划线、加粗,最好评论。 3. 让 Codex 读飞书文档中的标记和评论,让AI解释回复你。 探索差不多了,写个Skill

译推文介绍了一种结合飞书与AI的交互式阅读方法。核心流程为:1. 使用 Codex 或 CC 将 EPUB 电子书按章节导入飞书文档;2. 人工阅读时在文档中对有感触的内容进行划线、加粗或评论;3. 再次调用 Codex 读取这些标记与评论,由AI进行解释和回复。作者认为此方法有趣,并计划将其封装为可复用的 Skill。

meng shao@shao__meng · 5月31日74

Agent: OpenAI Codex + Tools: Google 全家桶、WhatsApp、电报、浏览器自动化等 + Data: Google Drive、Notion、AGENTS.md 等 + Skills: inbox-zero、contacts 等 == 个人生活自动化 Agent 工具栈 @nicbstme 提出的两个典型工作流 1. 介绍邮件(跨 5 个工具的「胶水活」) 朋友 WhatsApp 求助 → 搜 WhatsApp/Gmail 找邮箱 → 网页查公司融资 → 起草介绍信 → 等批准 → 发邮件 → WhatsApp 告知完成。 人工约 20 分钟、大量上下文切换;用户侧约 10 秒提需求。Agent 做的是跨 App 的编排,不是回答问题。 2. 车牌更新(行政连续性) 发照片给 Agent → 更新 Drive 里的 Markdown 车辆档案 → 保留 VIN、保险等字段 → 上传回 Drive → 必要时用浏览器自动化同步到 FasTrak、停车 App、保险门户等无 API 的系统。 体现的是行政连续性:同一份信息在多处保持一致,而非一次性问答。 最重要的架构决策:Drive 作为 Source of Truth Nicolas 刻意把知识从 Notion 迁到 Google Drive,原因很务实: · Notion 对人友好,对 Agent 不友好(嵌套页面、数据库属性、权限、UI 原生结构) · Drive + Markdown/CSV:可搜索、可 diff、可编辑、可上传、可引用 file ID · gogcli 提供统一的 CLI 面(Gmail、Drive、Calendar、Docs、Sheets 等) 组织知识不应只为人类 UI,而应面向 Agent 的工具路径。 稳定 file ID、纯文本、表格、返回 JSON 的命令——这些才是 Agent 友好的数据形态。 联系人 CSV(电话、邮箱、LinkedIn 等)被作者称为「最佳投资之一」,因为它是跨渠道 lookup 的枢纽。 工具优先级(可靠性层级) API / CLI > 本地文件 > 浏览器自动化 > 屏幕/UI 自动化 Agent 的可靠性上限取决于工具面。gog gmail messages list --json 比让模型在网页上点来点去更稳定、可重试、可推理。浏览器和屏幕自动化是必要时的兜底,不是主路径。 Skills:Agent 的「习惯」与「品味」 Skill 不是 fancy 架构,就是可迭代的操作手册。以 inbox-zero 为例: · 列出收件箱 → 区分自动归档 / 需人工审阅 · 展示重要邮件、引用原文、建议归档或回复 · 起草后等明确批准再发送 · 保留所有收件人、回复简短、不主动建议电话、签名用 "Nicolas" 没有 Skill,每次都要重新 prompt 所有偏好;有了 Skill,说「run inbox zero」即可。个人 Agent 的个性化,来自操作品味的累积,而非 cute voice。 反馈闭环: · 工具失败 → 修工具或加 guardrail · 判断失误 → 更新 Skill · 忘记偏好 → 写入 memory / AGENTS.md · 工作流重复 → 体系 compound 改进 批准门控:信任分级才是产品 Nicolas 明确反对「YOLO 全自动」: · 低 stakes 可直接发(如「告诉 Hugo 我下周在西雅图」) · 高 stakes 必须:读上下文 → 起草 → 展示 → 等批准 → 执行 → 确认。 有用 vs 可怕的分界,在于是否在正确时刻问人。 「杀手级」工作流:What did I miss? 比单点邮件更重要的,是生活收件箱 triage: · 每隔几小时问一句「我漏了什么?」→ Agent 扫描 WhatsApp、Telegram、Gmail、SMS、Calendar、Drive 变更 → 汇总:谁需要回复、什么 urgent、什么 stale、什么可忽略、什么该建日历、什么要查文档。 特点:上下文重、重复、跨工具、充满小决策——人讨厌做第一遍扫描,Agent 擅长第一遍,判断权仍在人。 复现清单(Nicolas 给出的路径) 1. 装 Agent 运行时 + 各渠道 CLI/连接器 2. 集中数据:Drive 为真相源,联系人 CSV,重要文档可搜索化 3. 谨慎授权:Full Disk Access、Screen Recording、Accessibility——必须配合同级 approval gates 4. 写 operating rules(AGENTS.md):draft before send、工具路由、隐私边界等 5. 为重复流程写 Skills,并在每次失误后更新

译该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。

StepFun@StepFun_ai · 5月31日80

A 198B vision model, running on a box that sits on a desk. This is what we built Step 3.7 Flash for. Brilliant breakdown @sudoingX — saved everyone a few hours of head-scratching 🎉

译阶跃星辰发布了Step 3.7 Flash,这是一款198B参数的视觉模型,旨在DGX Spark等桌面设备上运行。用户实测表明,128GB统一内存是运行门槛,模型占用约104GB。部署无需官方专用llama.cpp分支,主线版本即可。在上下文长度上存在权衡:启用视觉功能时,基于q8 KV cache的64K为上限;若要使用最高256K上下文,则需禁用视觉并切换至q4 KV cache,此时模型与缓存共占约114GB内存。该模型是推理模型,思考过程可能消耗大量max_tokens,需注意设置。

AYi@AYi_AInotes · 5月31日66

对大部分人来说,Codex就是目前最顶最好用的生产力工具,都全面拥抱用起来!! 那么Codex里的4个模型怎么选最省钱? 1️⃣先说最贵的那个,gpt-5.5 是质量优先的旗舰,它适合复杂编码、复杂推理、知识工作、研究流程,尤其是那种看着像写东西、背后却要走好几步判断的活,官方给它的定位就是旗舰级,价格也站在最高那一档,输入 $5.00、输出 $30.00 每 100 万 tokens。

译Codex(由OpenAI发布)提供四个可选模型。其中,gpt-5.5作为质量优先的旗舰模型,适用于复杂编码、推理及知识工作,其定价较高,为输入$5.00、输出$30.00每百万tokens。主推文旨在帮助用户根据任务类型与成本考量进行选择。

meng shao@shao__meng · 5月31日46

如何从 PDF 构建金融知识图谱? LandingAI 黑客松项目「ArthaNethra」,展示了从 PDF 到可查询、可溯源、可推理的知识图谱的完整流程: 上传 → ADE 提取 → 归一化 → 双库索引 → 风险检测 · Upload:文档进入 /api/v1/ingest,分配 ID、存储路径 · Extract:LandingAI ADE → 结构化 Markdown,>15MB 走异步任务 + 指数退避 · Normalize:按文档类型路由解析器,发票/贷款/合同:确定性解析,无 LLM;10-K/MD&A:Claude Haiku + 正则,必要时 Sonnet · Index:实体入 Weaviate,关系入 Neo4j,500 词分块、100 词重叠;all-mpnet-base-v2 向量化 · Risk Detect:规则 + LLM 异常检测,4 条阈值规则 + 图模式异常扫描 知识图谱设计 10 类实体:Company、Subsidiary、Loan、Invoice、Metric、Clause、Instrument、Vendor、Person、Location 26 种规范关系,分四类: · 金融:HAS_LOAN、FINANCED_BY、OWNS、GUARANTEES 等 · 运营:SUPPLIES_TO、PARTNERS_WITH 等 · 治理:REGULATED_BY、WORKS_FOR 等 · 交叉引用:MENTIONED_IN、REFERENCES 等 同义词归一化层:40+ 别名映射到 26 种规范类型(如 OWNER_OF / PARENT_COMPANY → OWNS),避免图谱碎片化。 每条实体/关系都带 citation 元数据(文档、页码、章节) 双库架构 · Weaviate:语义相似,「找关于 covenant 违约的文档」 · Neo4j:多跳遍历,「Company X 到 Vendor Y 经过哪些子公司和贷款的路径」

译LandingAI 黑客松项目「ArthaNethra」展示了从 PDF 到金融知识图谱的流程:上传后通过 ADE 提取为结构化 Markdown,超过 15MB 的文档异步处理。提取后按文档类型路由归一化:发票/贷款/合同采用确定性解析(无 LLM);10-K/MD&A 使用 Claude Haiku 结合正则。实体和关系分别存入 Weaviate 和 Neo4j(500 词分块,100 词重叠,all-mpnet-base-v2 向量化),图谱包含 10 类实体和 26 种规范关系,并通过别名映射进行同义词归一化。最后结合规则与 LLM 进行风险检测。

宝玉@dotey · 5月31日67

Codex/Claude Code 调试网络请求的技巧 在开发网页程序的时候,有时候会有一些服务端 API 交互代码,如果出现故障或者要优化,就需要根据网络请求的数据去分析问题,有两种简单的方法可以让 Agent 自己拿到这些数据而不需要你手动复制粘贴: 1. 打开 Chrome Dev Tool 后,切换到 Network 请求,有一个 Export HAR 的功能,可以把当前所有网络请求导出成一个 .har 文件,然后把文件路径发给 Codex,让它帮你分析网络请求。 2. 使用 Codex 的 Chrome Plugin,安装官方的 Chrome Plugin,安装 Chrome 的 Codex 浏览器扩展,直接在消息中 "@chrome" 就可以让 Codex 去使用你的浏览器自己调试、抓包

译本文介绍两种让 Codex/Claude Code 自动获取网页网络请求数据进行调试的方法,无需手动复制粘贴。方法一:使用 Chrome 的“Export HAR”功能导出 `.har` 文件,并将文件路径发给 Codex 分析。方法二:安装 Codex 的 Chrome 浏览器扩展,在对话中使用 `@chrome` 指令,让 Codex 直接操作浏览器进行调试与抓包。

Berryxia.AI@berryxia · 5月31日70

兄弟们,想认真学提示词工程,周末花这 25 分钟是非常值得! 这个就是来自于 Anthropic 官方的 Prompting 101 课程,带你从零搭建一个能落地的 prompt 任务: 1. 语气背景 2. XML 结构 3. Few-shot 示例 4. 输出格式化 5. 预填充与拓展思考 这些内容一次性都给你讲清楚了。 我做了中文字幕以及全程的章节化,每个章节都配好了核心要素的总结说明。 也可以不用从头看,挑重点跳读也可以。 #prompting101

译Anthropic 推出官方提示词工程课程 Prompting 101。课程聚焦从零搭建一个可落地的 prompt 任务,核心内容涵盖五个关键步骤:设定语气背景、使用 XML 结构、提供 Few-shot 示例、设计输出格式化、以及运用预填充与拓展思考。整套课程约 25 分钟,已配有中文字幕和章节化整理,每个章节附有核心要素总结,便于观众跳读重点。

AYi@AYi_AInotes · 5月30日72

http://x.com/i/article/2060676761914888194 # 一篇讲清楚 Codex 四个模型到底该怎么选! 我最近一直说Codex就是大多数普通人能用的最高生产力工具,但是刚上手 Codex 的人,第一笔冤枉钱多半一般不是栽在不会用,因为相比Claude code,上手使用实在太简单了,比office还简单,但有个事关Token的坑大家一定要注意。 有时候明明是个轻量小活,顺手点了最贵的旗舰,钱包只能替这一下手滑买单,这篇我们来聊怎么解决这个问题,依旧没有废话,全是干货: - 一句话口诀,先记住再说 - 四个模型,各自管哪段活 - 一张价格对照表,扫一眼就懂 - 丢进工作流,到底怎么串最省钱 - 公众号写作的实战三步 - 照抄就能用的选择口诀 ## 一、先把口诀甩给你 不知道选谁的时候,先用 gpt-5.4-mini 打底,如果扛不住或者不稳定,再升级到 gpt-5.5,只有那种特别简单、特别批量的小任务,才轮到 gpt-5.4-nano 上场。 这套逻辑跟官方建议是一个意思,复杂推理和编码优先从 gpt-5.5 起步,要是你更在意速度和成本,就往更小的模型走。 顺带说一句,Codex 本身就是 OpenAI 的编码代理,它干的活就是帮你写代码、读代码、理解项目结构、处理那些琐碎的软件工程任务。 ## 二、四个模型,各管一段活 先说最贵的那个,gpt-5.5 是质量优先的旗舰,它适合复杂编码、复杂推理、知识工作、研究流程,尤其是那种看着像写东西、背后却要走好几步判断的活,官方给它的定位就是旗舰级,价格也站在最高那一档,输入 $5.00、输出 $30.00 每 100 万 tokens。 往下一档是 gpt-5.4,平衡型选手,它比 gpt-5.5 便宜,照样扛得动编码和专业工作,价格是输入 $2.50、输出 $15.00 每 100 万 tokens,当你的任务不算太复杂、又不能太弱的时候,它就是那个很稳的中间项。 再往下是 gpt-5.4-mini,性价比首选,官方把它称作最强的 mini 模型之一,适合更轻量的编码、子代理、还有你每天都在干的内容整理活,价格压得很低,输入只要 $0.75、输出 $4.50 每 100 万 tokens,写教程、改文案、做结构化总结、整理 FAQ 这类活,它基本就够了。 最后是 gpt-5.4-nano,最省钱的批量小工,它专治简单、高频、批量的小任务,分类、抽取、压缩、排序、生成短标签都是它的主场,官方把它摆在最便宜、最轻量那一档,当你要把一个大任务拆成一堆小任务时,就该它登场了。 ## 三、一张表,扫一眼就懂 从上往下越来越便宜,但便宜不等于差,关键看你手里这活配得上哪一档。 ## 四、丢进工作流,怎么串最省钱 把这几个模型放进同一条流水线,最省钱的打法其实很朴素。 先让 gpt-5.4-mini 出第一版,提纲、初稿、结构整理、问答整理、标题优化都交给它,它便宜、跑得快,足够覆盖你大多数的日常内容生产。 内容里要是塞满了条件、边界、逻辑跳转,再把 gpt-5.5 请上来,比如让它理清多个步骤的先后关系,或者把一篇看着简单、实则容易翻车的教程写得更稳更完整,让它来做复核和收尾。 要是只剩拆分、摘要、分类、抽取这种轻活,就甩给 gpt-5.4-nano,它干最后一公里最合适,单独扛整篇长文它不行,但批量加工是真的省。 ## 五、公众号写作,实战三步 给大家说一个最实战的场景,公众号写作的实流程是怎么走的。 先用 gpt-5.4-mini 出框架和初稿,把标题、开头、分段、结论这套骨架先搭起来。 接着要是发现这篇里有不少容易被误解的地方,步骤顺序绕、规则边界多、或者需要更严谨的措辞,就把同一份提纲递给 gpt-5.5 重写一遍。 最后如果还想顺手做短视频口播版、评论区问答版、摘要版,就再用 gpt-5.4-nano 批量压一遍,这么一套下来,通常就是成本和质量最平衡的状态。 ## 六、照抄就能用的口诀 真要总结,就三句话,你直接抄走。 不知道选谁,先用 gpt-5.4-mini。 任务复杂、要求高,换 gpt-5.5。 任务特别简单、又特别多,才轮到 gpt-5.4-nano。 ## 写在最后 在 Codex 里有个反直觉的真相, 最贵的那个不一定最好,最适合你的那个,才最省钱。 如果你的目标是稳定产出内容、又不想让账单失控,最聪明的做法从来不是死盯着旗舰不放,是先让 gpt-5.4-mini 把大部分活扛下来,真正需要更高质量的那一下,再升级换枪。 这事就像下厨挑刀,切葱花你不会抡那把开骨的厚背砍刀,顺手的小刀三两下就利索了,真碰上整只硬骨头,再换那把重的也不迟。 模型这东西,称手永远比贵重要。 (本文涉及的模型定位与价格,综合自 OpenAI 官方开发者文档与产品页面公开信息,模型仅作举例说明,不构成使用推荐,具体价格以官方实时页面为准。)

译本文介绍了Codex平台的四个模型及其选择策略。其中,gpt-5.4-mini(输入$0.75、输出$4.50/百万tokens)是性价比首选,适合日常编码与内容整理;gpt-5.5(输入$5.00、输出$30.00/百万tokens)为旗舰,用于复杂推理与编码;gpt-5.4-nano专攻简单批量任务。核心建议是:大多数任务优先使用gpt-5.4-mini,仅在遇到复杂需求时升级至gpt-5.5,并用gpt-5.4-nano处理末端轻量工作,以此构建成本最优的流水线。

Xiaomi MiMo@XiaomiMiMo · 5月30日56

What’s new with MiMo-V2.5 series inference? We just published a blog on our full pipeline inference optimizations for MiMo-V2.5 series, including how we pushed hybrid SWA efficiency to the limit. Read the full blog here: https://mimo.xiaomi.com/blog/mimo-v2-5-inference

译MiMo-V2.5系列推理有哪些新进展? 我们刚刚发布了一篇博客,详细介绍了针对MiMo-V2.5系列的全链路推理优化,包括如何将混合SWA效率推向极限。 阅读全文请访问: https://mimo.xiaomi.com/blog/mimo-v2-5-inference

向阳乔木@vista8 · 5月30日33

王老师的新书,得下单学习下。 有机会还想去学校让王老师带着吃碗羊杂汤,哈哈。 天津地区有机会组团,丁师傅也在。

译《AI高质量论文写作法》新书上市。本书是@wshuyi在3年前《学术写作五步法》基础上的新作,重点补充了作者近年将AI深度融入知识生产工作流的心得与经验,旨在帮助读者提升研究推进与论文撰写效率。王老师推荐了此书。

Peter Steinberger 🦞@steipete · 5月30日66

I do this with codex all the time. Ask it to review code for bugs and it will tell you all good, tell it there is a bug and it will LOOP AND LOOP and will find issues.

译我一直用Codex做这个。让它审查代码找bug,它会说一切正常;告诉它有bug,它就会反复循环,然后找出问题。

向阳乔木@vista8 · 5月30日57

烦透了谷歌 Chrome CDP弹窗确认? 让AI写了个脚本,一劳永逸 Chrome 的 CDP 调试真的好用,但 Codex 或 Claude Code 调用时,每次都要弹出对话框确认。 尤其用Skill在远程服务器或Mac Mini运行时,这会影响自动化执行。 好像这个是强制的,还没有配置文件调整,所以让 Codex 写了个程序,自动点击确认。 可能不安全,但自己电脑无所谓。 沿着这个思路,电脑很多重复操作都可以写成软件或脚本。 每次用Computer Use还是太慢、太贵了。

译Chrome的CDP调试在使用Codex或Claude Code时,每次调用都弹出确认对话框,尤其在远程服务器或Mac Mini上运行技能时影响自动化执行。由于强制确认且无配置文件调整,用户让Codex编写脚本自动点击确认,虽可能不安全,但个人电脑上可接受。这启发将电脑重复操作脚本化,避免使用Computer Use等方案,因其速度慢且成本高。

Berryxia.AI@berryxia · 5月30日56

今天被这AI产品刷屏了~ GPT越贴心,学生大脑越懒! AI家教最大的陷阱不是不够聪明,是太贴心了。 现在用 Claude 或 GPT辅导的人越来越多。 问一道题,三秒出完整步骤,易错点标红,学生抄完觉得自己懂了,下周换个数字照样错。 这特么哪里是学习,简直就是“抄袭答案”。 脑科学早就验证过:大脑在适度挣扎时,前额叶皮层和海马体的连接强度会显著提升。 直接给答案等于跳过这个挣扎窗口,信息从短期记忆滑过,不会进入长期存储。 你以为自己懂了,其实只是熟悉了AI的笔迹。 Claude 和 DeepSeek 的默认模式,是走"最小阻力路径"。 你问,它答,越快越完整,满意度越高。但在教育场景里,这和教学目标正好相反。 学生说"这个AI真好用"的时候,通常意味着它让我很舒服地避开了思考。 Qwen 和 GPT展示完整思维链看起来透明,但观看别人的推导不等于自己推导。 Koji 和 Brilliant 做对了一件事:它们拒绝当答案打印机。 Koji 会问"你卡在哪一步了",Brilliant 要求你解一步才能解锁下一步提示。 但这只是产品层面的实现,核心认知是通用的,学习的本质是挣扎,不是观看。 如果你正在用AI辅导学生或孩子,直接做这三个动作: 1. 在 Claude 或 GPT的系统提示里加一条:"不要直接给出最终答案,每次只给最小提示。" 2. 学生问"怎么做"时,先让他暴露现有思路。错的也比空白强,推他先挣扎三十秒。 3. 答对后追加一步:"用另一种方法验证这个结果。"能交叉验证的理解,才是真理解。 所有人都在卷让 AI 更像真人老师——语气温柔、排版精美、步骤详细。 但教育产品的核心指标不是满意度,是知识到底有没有进脑子。 真正好用的 AI 家教,应该让学生觉得有点烦。

译本文批评当前AI家教产品(如Claude、GPT)直接给出完整答案的模式,认为这相当于“抄袭答案”,跳过了学习必需的“适度挣扎”过程,导致知识无法进入长期记忆。作者指出,研究显示适度挣扎能强化大脑记忆连接。而提供完整思维链(如Qwen、GPT展示CoT)或追求交互满意度并非关键。相比之下,Koji与Brilliant等产品通过追问卡点、分步解锁等方式鼓励学生主动思考。文章强调,优秀的AI家教核心应是帮助学生真正掌握知识,即便过程“有点烦”。

向阳乔木@vista8 · 5月30日62

我和姚老师组织的GEO公开课,到时候我负责一些AI工具和模型的问答分享。

译推文宣布了与姚老师合作举办的GEO公开课。姚老师将主讲GEO的底层逻辑、方法、系统原理及理念,并分享一系列核心资源,包括GEOFlow系统、用于创建技能的元Skill、17套GEO Skill合集,以及收录41篇最新论文的资料库。此外,分享内容还涵盖《GEO到底是什么》等多篇白皮书、红皮书、蓝皮书及AI营销提示词合集。该公开课将通过WaytoAGI进行直播,另一位主讲人将负责AI工具与模型相关的问答环节。

向阳乔木@vista8 · 5月30日52

Codex 制作的 Suno MTV,任意一首Suno歌曲自动转成带LRC歌词同步显示的 MV。 图片由Codex根据歌词内容自动生成,还挺符合意境。

宝玉@dotey · 5月30日70

我今天对群聊总结的 Skill 更新了个小功能,在群里 @bot,总结群聊记录的时候,就可以结合聊天记录的上下文,在总结的时候回复问题 具体参考:https://github.com/JimLiu/baoyu-skills/commit/a85c81e8db8a19a633e30dda0823e8a9c686263d

宝玉@dotey · 5月30日71

Q:我把数据库接入了 AI Agent,每次用手机发消息让它帮我查数据、导出文件,但 token 消耗特别大。我已经把工作流写进了 Agent 的 Memory 里,但它就是不按流程走,该怎么办? A:这是一个非常典型的问题。根本原因在于:Memory 只是“背景信息”,不是“执行指令”。Agent 每次对话都会重新理解意图、重新规划步骤,这个思考过程本身就是 token 消耗的大头。 解决方案:用 Agent Skill + Script 替代 Memory 里的工作流。 核心思路是把任务拆成两部分: - LLM 只做它擅长的事——把自然语言翻译成 SQL 查询语句 - 确定性的步骤全部用脚本——执行 SQL、格式化结果、上传文件,这些不需要 AI 思考,写成 Python/Shell 脚本直接跑 再进一步,在 Skill 里内嵌你的表结构说明和常用 SQL 模板,Agent 只需要填空而不是从零推理。 改完之后 token 消耗能降一个数量级。 一句话总结:能用脚本干的事别让 LLM 干,LLM 只负责翻译,不负责执行。

译指出将工作流写入Memory方案的根本问题在于Agent需每次重新理解意图,导致token消耗大且不稳定。最佳实践是采用“Agent技能+脚本”架构:LLM仅负责将自然语言转译为SQL,所有确定性步骤由脚本执行。此方案可大幅降低token消耗。

ginobefun@hongming731 · 5月30日70

小技巧:一键配置 Claude Code

译Anthropic 发布了官方插件 claude-code-setup,用于简化 Claude Code 的配置。它能自动扫描项目,一键推荐并配置 Hooks、技能、MCP 服务、子代理及自动化功能。该插件可将原本 30-60 分钟的手动配置过程,缩短至 3-5 分钟完成。安装命令为:`/plugin install claude-code-setup@claude-plugins-official`。

Google AI Developers@googleaidevs · 5月30日42

Good implementation of Managed Agents in the Gemini API by our friends at @Eigent_AI! Root causing CI failures at lightning speed. ⚡

译Eigent平台展示了集成Gemini Managed Agents API的实际效果。其开源协作工具Eigent使用Gemini 3.5 Flash和该API,快速定位了一个真实的megatron-lm CI故障,在几分钟内找到了根本原因。工作流程中,协调员智能体规划审计,开发员智能体加载`ml-failure-audit`技能并收集证据,随后Gemini智能体作为远程子智能体接手进行深度推理。这体现了Managed Agents在自动化复杂任务中的效率。

OpenAI Developers@OpenAIDevs · 5月30日54

Builders Unscripted with @0xmts Matias talked to @romainhuet about bringing Codex to work and into side-project workflows. 00:58 Codex at Alchemy 01:51 Code review catches bugs 08:04 Side projects with Codex 18:51 Codex App Server projects 24:01 Computer use, GPT-5.5, SnapCat

译Builders Unscripted with @0xmts Matias与@romainhuet探讨了将Codex应用于工作和副项目工作流。 00:58 Codex在Alchemy的应用 01:51 代码审查捕获错误 08:04 使用Codex进行副项目 18:51 Codex App Server项目 24:01 计算机使用、GPT-5.5、SnapCat

Google AI Developers@googleaidevs · 5月30日63

The team at @llama_index built an awesome template using LlamaParse and the new Managed Agents in the Gemini API. See how they built an agent that can tackle unstructured documents. 📄↓

译LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,使智能体能够访问 LlamaParse 和 LiteParse,从而自动处理非结构化文档。其工作流程为:配置数据与输出的 Git 仓库,将仓库克隆至智能体沙箱,安装 LiteParse CLI 与 LlamaParse SDK 及相关技能,最后通过提示词驱动智能体自主执行任务。该模板最终形成一个可直接使用 LlamaParse 和 LiteParse 处理真实世界文档的智能体。

宝玉@dotey · 5月30日66

对于 Claude Design 和实际代码的版本同步问题,我目前是这么处理的: 首先要有一个唯一源,就是把 Claude Design 的结果当做设计唯一的源,以它为准 然后在更新design的时候会让它写一个changelog,让 Claude Code 去根据Changelog 同步 尽可能先改 Claude Design 的设计再改代码。有时候临时在代码中修改了,时候去 Claude Design 那边同步一下。 如果有更好的办法也欢迎分享

译针对后续UI改动可能导致Claude Design与实际代码不一致的问题,分享的实践方法是:始终将Claude Design作为唯一设计源,并在更新时生成changelog供Claude Code同步。遵循先修改设计再改代码的原则,若临时修改了代码,事后也应同步回Claude Design。

Replit ⠕@Replit · 5月30日34

Here's everything you need to know about Replit in 60 seconds ⭐️ → Plain English prompts turned into real working software → End-to-end workflow from UI to deployment → Real-time team collaboration with just a link → Parallel AI agents building different parts of your app at once

译这是你需要在60秒内了解的关于Replit的一切 ⭐️ → 简单的英文提示词即可生成真实可用的软件 → 从UI到部署的端到端工作流 → 仅需一个链接即可实现实时团队协作 → 并行AI智能体同时构建应用的不同部分

Google AI Developers@googleaidevs · 5月30日43

We love this use of Managed Agents in the Gemini API by the team at @wandb. Silent bugs don't stand a chance. 🐛⬇️

译我们很欣赏@wandb团队在Gemini API中使用托管智能体的方式。隐蔽的bug无处遁形。🐛⬇️

宝玉@dotey · 5月30日68

我的原则: ✅ Reasoning Max ❌Speed Fast 慢就是快,多花点时间推理,你就少花一点时间去验证 快就是贵,Fast 不是不好,主要是性价比不高,不差钱当然无所谓

译推文对比了AI模型的两种推理模式。主张选择Reasoning Max模式,认为多花时间进行深入推理,反而能减少后续验证时间,即“慢就是快”。而Speed Fast模式虽快,但性价比不高,除非预算充足。被引用的推文进一步支持“选择Max”,并指出这样能最大化利用用户宝贵的时间。

宝玉@dotey · 5月30日68

借助 AI 去写 Mac App 完全没问题的。几点经验分享: 1. 尽可能选 AppKit 而不是 SwiftUI,SwiftUI 不如 AppKit 强大,做出来的界面也不好看。SwiftUI 相比 AppKit 的优势是开发简单,但这条已经被 AI 弥补了 2. 先用 Claude Design 去打磨 UI 设计和 UX 交互再去写代码可以事半功倍 3. Opus 比 GPT-5.5 做出来的 UI 要好看 4. Codex 有个官方 Plugin 叫 “Build macOS Apps”,可以用

译一位开发者分享了借助AI开发Mac应用的四点经验:建议优先使用AppKit而非SwiftUI,因后者界面较弱,而AI已弥补了AppKit开发复杂度高的短板;推荐在编码前先用Claude Design打磨UI与UX;指出Opus模型生成的UI优于GPT-5.5;并提到Codex提供了一个名为“Build macOS Apps”的官方插件可供使用。

Boris Cherny@bcherny · 5月30日62

Salesforce published a detailed writeup on going agentic with Claude Code. A couple things jumped out. A migration they'd scoped at 231 days shipped in 13. One PR delivered 21 endpoints at 100% test coverage.

译Salesforce发布了一篇关于使用Claude Code实现智能体化的详细文章。有几点引人注目。 他们曾评估需要231天的迁移工作,在13天内完成。其中一个PR交付了21个端点,测试覆盖率达到100%。

Kling AI@Kling_ai · 5月29日62

Kling AI Cannes Showcase — RAPHAEL: Behind the AI Workflow Go behind the scenes of RAPHAEL, an AI-powered feature film created with Kling AI. See how the creator used Kling AI across the filmmaking workflow, from creative ideation to final cinematic frames, streamlining production and unlocking new creative possibilities.

译Kling AI戛纳展示——RAPHAEL:AI工作流幕后 深入了解RAPHAEL,一部使用Kling AI创作的AI驱动故事片。看看创作者如何在整个电影制作流程中运用Kling AI,从创意构思到最终电影画面,简化制作并释放新的创作可能性。

向阳乔木@vista8 · 5月29日65

最近摸索出的PPT设计流程,效果好,制作效率也很高。 1. GPT 5.5 Pro和Grok搜索获取参考资料;通过大模型提问,回答添加自己的理解和想法。 2. 让 Codex 或 CC 基于这些信息加工,提炼方法论、添加金句,写成一篇经验贴,输出 Markdown。 3. 把 Markdown 上传到 Youmind,用自己写的PPT提示词,先生成大纲,再生成20页高清PPT页面和3张不同样式的空白背景页。 4. 导出zip图片压缩包,依次粘贴到Keynote中,用空白背景,制作自我介绍、FAQ、联系二维码。

译用户分享其AI驱动的PPT制作流程:先用GPT 5.5 Pro和Grok搜集资料并形成个人理解;再由Codex或CC加工成Markdown格式的经验帖;然后将内容上传至Youmind,生成大纲及20页高清PPT页面;最后导出图片包,在Keynote中完成自我介绍、FAQ等最终页面的制作。

歸藏(guizang.ai)@op7418 · 5月29日63

有了 Claude Code 和 Cursor 这种软件以后,真的不只是写代码厉害。 我之前拿到豆包手机以后,想给它装个谷歌框架,但一直在 Google Play 那有点问题,死活装不上。 今天突然想起来,打开让 Claude Code 帮我装。 打开 USB 调试模式后,它直接就帮我搞定了:自动下载安装包、自动安装、自动调试好 这个未来感觉很有用。

译推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

Runway@runwayml · 5月29日52

Go behind the scenes to learn more about how The Rogue was made in under a month, by a single person with Runway. The Rogue is part of Project Luxo: a new initiative exploring how AI-generated video has crossed the uncanny valley.

译深入幕后,了解《The Rogue》如何由一个人在一个月内使用 Runway 制作完成。 《The Rogue》是 Project Luxo 的一部分:这是一个探索 AI 生成视频如何跨越恐怖谷的新项目。

AYi@AYi_AInotes · 5月29日14

Claude Opus 4.7和Opus 4.8的区别

译本文探讨“以术入道”的AI使用哲学。作者将AI工具分为两类:自主运行的Agent型(如Claude Code),和需人工逐步判断的“实习生型”(如Cursor)。后者是培养用户判断力的关键,但受限于必须在场的瓶颈。文中介绍了网易的免费远程软件UU远程,它允许用户通过手机连接Mac运行Cursor,实现低延迟操作,包括原生终端支持,从而打破了物理距离的限制。作者认为,AI发展的当前阶段,更需要这种能随时与AI协同思考的连接方式。

OpenBMB@OpenBMB · 5月29日53

🚀 A 1.3B model handling real work at a mine site and in enterprise offices — faster than your annotation team. One recent community case shared by developer Jingdong, explored using MiniCPM-V 4.6 for: ✅ore sample counting in lab images ✅vehicle detection and counting from site images ✅mining zone identification from aerial maps ✅Go code completeness checking Here's what actually happened 🧵

译🚀 一个1.3B模型在矿山现场和企业办公室处理实际工作——比你的标注团队更快。 开发者Jingdong分享的一个近期社区案例,探索了使用MiniCPM-V 4.6进行: ✅实验室图像中的矿样计数 ✅现场图像中的车辆检测与计数 ✅航拍地图中的矿区识别 ✅Go代码完整性检查 以下是实际发生的情况🧵

向阳乔木@vista8 · 5月29日65

强烈建议下载你的 X 所有帖子,一方面备份,万一被 X 傻逼算法误封,还有历史数据。 另一方面 Codex 或 CC 能帮你总结经验,一些自己都意识不到的方法论。 X 提供全量数据下载,只有在网页端有入口: 更多->设置和隐私->你的账号->下载你的数据的存档。 提交申请,第二天下载,过期还需要再次申请

译推文强烈建议用户下载X平台的所有帖子进行备份,以防被算法误封后丢失历史数据。同时,可利用Codex或CC(可能指Claude)等工具分析这些内容,帮助自己总结出未曾意识到的个人方法论。推文指明了操作路径:需在X网页端通过“更多->设置和隐私->你的账号->下载你的数据的存档”提交申请,通常次日可下载,且过期需重新申请。

向阳乔木@vista8 · 5月29日49

如果你订阅了 X Premium +,现在可安装Grok Build的Cli curl -fsSL https://x.ai/cli/install.sh | bash 能在CLI中生成图片,但好像调用video_gen接口不行,但好像官方说可以生成视频,实际测试发现不行。 原以为能直接读 X上的帖子,发现也不行,哎。 编程打不过Codex和CC,得找别的亮点啊,着急!

译X Premium+订阅用户现已可以安装Grok Build CLI。实际测试显示,该工具能成功生成图片,但调用 `video_gen` 接口生成视频的功能目前不可用,尽管官方有相关表述。此外,直接读取X平台帖子的功能也尚未实现。在编程能力上,该工具被认为不及Codex与Claude Code。

Berryxia.AI@berryxia · 5月29日57

兄弟们,我搞出来。 就用Opus 4.8,大概两轮对话就能做出这个效果,可以 口喷绘制CAD。 比如:给我画个球,圈圈什么的。都可以 基础的演示肯定没问题,但真正到工业使用的话,肯定还有一个距离。 不过做一些 demo 演示,我觉得完全没有问题,大家可以去试试。

译用户展示使用 Opus 4.8 模型,仅通过约两轮自然语言对话即可生成基础 3D CAD 模型(如球体、圆圈等),初步演示效果良好,但离工业级应用尚有距离。该成果呼应了 AI 辅助设计从代码生成向自然语言直接驱动三维建模的演进趋势。

meng shao@shao__meng · 5月29日48

Coding Agent 在开发之外能做什么,这个问题昨晚我有了一些新的认识 昨天全天我的🪜都有问题,X Google ChatGPT Cursor 都没问题,就是 Codex 一直连接不上。。。 就让 Cursor 帮我分析我🪜的问题,以让 Codex 能正常跑起来为目标,几分钟时间,它分析了代理的实现,做了一些测试,帮我改了代理方式,又自己 CLI 调用 Codex 跑通了测试。 到这还没完,为了让我在🪜出问题时还能用 Codex,还给我接通了 DeepSeek API (我之前在 Cursor 给过 API Key),给我做了一键在 Codex 切换为 DeepSeek 的选项。 确实太贴心了,我都想给它🧎🏻‍♂️一个了。

译推文作者全天遭遇网络代理(🪜)问题,导致Codex连接失败。他使用Cursor分析代理设置,Cursor在几分钟内分析了代理实现、执行测试并修复了代理方式,随后亲自调用CLI测试Codex以确认修复。为预防未来问题,Cursor还集成了用户此前提供的DeepSeek API密钥,创建了一键切换至DeepSeek的选项,确保了服务可用性。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月1日
04:25
SemiAnalysis@SemiAnalysis_
26
好奇L11诊断是什么意思吗?让我们把它拆解成两个部分:L11和诊断。(1/5)

Michael Dell 🇺🇸: We have the first @DellTech + @nvidia Vera Rubin NVL72 @CoreWeave. Here we go! 🚀

教程/实践部署/工程
01:36
AYi@AYi_AInotes
71
GitHub学生大礼包2026年升级,总价值超$3500

GitHub 2026年学生大礼包全面升级,总价值提升至$3500+。核心福利包括:GitHub Pro永久免费、GitHub Copilot Pro无限使用、Cursor Pro 1年免费、JetBrains全家桶免费,以及DigitalOcean $200和Azure $100等云服务额度。申请门槛极低,13岁以上持有.edu邮箱即可,无项目要求。此外,开源项目维护者还可申请OpenAI提供的6个月免费ChatGPT Pro(价值$1200)。

AYi: 免费领6个月ChatGPT Pro, 价值$ 1200🤩 这可能是今年对开发者最实在的福利了, 没有硬性Star数要求, 有项目链接基本都能过, 只要你是任何一个公开开源项目的维护者,哪怕只有你一个人在维护, 都可以去申请试试: http...

GitHubOpenAI教程/实践编码
00:46
向阳乔木@vista8
66
基于开源翻译插件的沉浸式单词学习系统

用户基于开源沉浸式翻译插件 read-frog,使用 Codex 开发了一套单词学习系统。该系统能将用户在阅读英文网页时收藏的单词自动生成闪卡进行复习,并基于艾宾浩斯遗忘曲线安排学习周期。系统会根据单词难度(例如 CET6+)在旁边添加中文翻译,并标记单词的掌握情况。通过此模式,当一篇文章不再显示生词翻译时,即表明学习者已基本掌握该文章词汇。

开源/仓库教程/实践
00:16
向阳乔木@vista8
59
AI辅助交互式阅读:划线即可对话

推文介绍了一种结合飞书与AI的交互式阅读方法。核心流程为:1. 使用 Codex 或 CC 将 EPUB 电子书按章节导入飞书文档;2. 人工阅读时在文档中对有感触的内容进行划线、加粗或评论;3. 再次调用 Codex 读取这些标记与评论,由AI进行解释和回复。作者认为此方法有趣,并计划将其封装为可复用的 Skill。

MCP/工具教程/实践
5月31日
20:46
meng shao@shao__meng
74
OpenAI Codex 个人生活自动化智能体工具栈

该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。

Nicolas Bustamante: http://x.com/i/article/2060579190920110081

智能体MCP/工具教程/实践
15:16
StepFun@StepFun_ai
同事件精选80
阶跃星辰发布了Step 3.7 Flash,这是一款198B参数的视觉模型,旨在DGX Spark等桌面设备上运行。用户实测表明,128GB统一内存是运行门槛,模型占用约104GB。部署无需官方专用llama.cpp分支,主线版本即可。在上下文长度上存在权衡:启用视觉功能时,基于q8 KV cache的64K为上限;若要使用最高256K上下文,则需禁用视觉并切换至q4 KV cache,此时模型与缓存共占约114GB内存。该模型是推理模型,思考过程可能消耗大量max_tokens,需注意设置。

Sudo su: i am running stepfun's new step 3.7 flash on a dgx spark right now. 198b vision model, on a box that sits on a desk. her...

多模态教程/实践部署/工程
同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》
推荐理由:把 198B 的视觉模型塞进一台桌面盒子,还跑通了,这本身就是个小里程碑。更关键的是,这篇实战直接帮你绕开了三个大坑,省下的三小时够你喝杯咖啡慢慢试了。
13:35
AYi@AYi_AInotes
66
Codex四大模型选购指南:如何按需省钱

Codex(由OpenAI发布)提供四个可选模型。其中,gpt-5.5作为质量优先的旗舰模型,适用于复杂编码、推理及知识工作,其定价较高,为输入$5.00、输出$30.00每百万tokens。主推文旨在帮助用户根据任务类型与成本考量进行选择。

AYi: http://x.com/i/article/2060676761914888194

OpenAI推理教程/实践编码
08:45
meng shao@shao__meng
46
如何从 PDF 构建金融知识图谱?

LandingAI 黑客松项目「ArthaNethra」展示了从 PDF 到金融知识图谱的流程:上传后通过 ADE 提取为结构化 Markdown,超过 15MB 的文档异步处理。提取后按文档类型路由归一化:发票/贷款/合同采用确定性解析(无 LLM);10-K/MD&A 使用 Claude Haiku 结合正则。实体和关系分别存入 Weaviate 和 Neo4j(500 词分块,100 词重叠,all-mpnet-base-v2 向量化),图谱包含 10 类实体和 26 种规范关系,并通过别名映射进行同义词归一化。最后结合规则与 LLM 进行风险检测。

LandingAI: http://x.com/i/article/2060438013273108480

检索增强教程/实践数据/训练
08:13
宝玉@dotey
67
Codex/Claude Code 调试网络请求的技巧

本文介绍两种让 Codex/Claude Code 自动获取网页网络请求数据进行调试的方法,无需手动复制粘贴。方法一:使用 Chrome 的“Export HAR”功能导出 .har 文件,并将文件路径发给 Codex 分析。方法二:安装 Codex 的 Chrome 浏览器扩展,在对话中使用 @chrome 指令,让 Codex 直接操作浏览器进行调试与抓包。

MCP/工具教程/实践
00:34
Berryxia.AI@berryxia
70
Anthropic 官方 Prompting 101 中文课,25分钟讲清核心五步法

Anthropic 推出官方提示词工程课程 Prompting 101。课程聚焦从零搭建一个可落地的 prompt 任务,核心内容涵盖五个关键步骤:设定语气背景、使用 XML 结构、提供 Few-shot 示例、设计输出格式化、以及运用预填充与拓展思考。整套课程约 25 分钟,已配有中文字幕和章节化整理,每个章节附有核心要素总结,便于观众跳读重点。

Anthropic教程/实践
5月30日
22:34
AYi@AYi_AInotes
72
Codex平台模型选择指南

本文介绍了Codex平台的四个模型及其选择策略。其中,gpt-5.4-mini(输入$0.75、输出$4.50/百万tokens)是性价比首选,适合日常编码与内容整理;gpt-5.5(输入$5.00、输出$30.00/百万tokens)为旗舰,用于复杂推理与编码;gpt-5.4-nano专攻简单批量任务。核心建议是:大多数任务优先使用gpt-5.4-mini,仅在遇到复杂需求时升级至gpt-5.5,并用gpt-5.4-nano处理末端轻量工作,以此构建成本最优的流水线。

OpenAI教程/实践编码
19:44
Xiaomi MiMo@XiaomiMiMo
56
MiMo-V2.5系列推理有哪些新进展? 我们刚刚发布了一篇博客,详细介绍了针对MiMo-V2.5系列的全链路推理优化,包括如何将混合SWA效率推向极限。 阅读全文请访问: https://mimo.xiaomi.com/blog/mimo-v2-5-inference
推理教程/实践部署/工程
19:11
向阳乔木@vista8
33
《AI高质量论文写作法》新书上市。本书是@wshuyi在3年前《学术写作五步法》基础上的新作,重点补充了作者近年将AI深度融入知识生产工作流的心得与经验,旨在帮助读者提升研究推进与论文撰写效率。王老师推荐了此书。

Wang Shuyi: 我的新书《AI 高质量论文写作法》上市。刚拿到崭新样书,很兴奋。相对于3年前《学术写作五步法》,补充了我近几年尝试将 AI 深度融入知识生产工作流的心得和经验,希望对你的研究推进和论文撰写能有实际帮助。感谢老麦和储殷老师的推荐,谢谢大家的支...

产品更新教程/实践
18:49
Peter Steinberger 🦞@steipete
66
我一直用Codex做这个。让它审查代码找bug,它会说一切正常;告诉它有bug,它就会反复循环,然后找出问题。

Lea Verou, PhD: 💡Recent insight: gaslighting @claudeai seems to improve code quality >90% of the time. "You overengineered this, there ...

AnthropicOpenAI教程/实践编码
13:41
向阳乔木@vista8
57
AI自动化解决Chrome CDP调试弹窗确认问题

Chrome的CDP调试在使用Codex或Claude Code时,每次调用都弹出确认对话框,尤其在远程服务器或Mac Mini上运行技能时影响自动化执行。由于强制确认且无配置文件调整,用户让Codex编写脚本自动点击确认,虽可能不安全,但个人电脑上可接受。这启发将电脑重复操作脚本化,避免使用Computer Use等方案,因其速度慢且成本高。

教程/实践编码
13:34
Berryxia.AI@berryxia
56
AI家教的"贴心陷阱"

本文批评当前AI家教产品(如Claude、GPT)直接给出完整答案的模式,认为这相当于“抄袭答案”,跳过了学习必需的“适度挣扎”过程,导致知识无法进入长期记忆。作者指出,研究显示适度挣扎能强化大脑记忆连接。而提供完整思维链(如Qwen、GPT展示CoT)或追求交互满意度并非关键。相比之下,Koji与Brilliant等产品通过追问卡点、分步解锁等方式鼓励学生主动思考。文章强调,优秀的AI家教核心应是帮助学生真正掌握知识,即便过程“有点烦”。

Sue: AI is making kids dumber. It should be making them geniuses. Introducing Koji, the first AI tutor that gets kids to actu...

教程/实践现象/趋势
12:41
向阳乔木@vista8
62
推文宣布了与姚老师合作举办的GEO公开课。姚老师将主讲GEO的底层逻辑、方法、系统原理及理念,并分享一系列核心资源,包括GEOFlow系统、用于创建技能的元Skill、17套GEO Skill合集,以及收录41篇最新论文的资料库。此外,分享内容还涵盖《GEO到底是什么》等多篇白皮书、红皮书、蓝皮书及AI营销提示词合集。该公开课将通过WaytoAGI进行直播,另一位主讲人将负责AI工具与模型相关的问答环节。

姚金刚: 今晚八点,会通过WaytoAGI做第一场GEO直播分享,会把GEO的底层逻辑、方法、系统原理及理念做一轮讲解,相关的一些资料和系统如下,分享给大家: 1、GEOFlow,今晚主讲的系统和背后的GEO原理 https://github.com...

开源/仓库搜索教程/实践
12:11
向阳乔木@vista8
52
Codex 制作的 Suno MTV,任意一首Suno歌曲自动转成带LRC歌词同步显示的 MV。 图片由Codex根据歌词内容自动生成,还挺符合意境。
图像生成多模态教程/实践
12:10
宝玉@dotey
70
群聊总结技能更新:支持上下文问答

我今天对群聊总结的 Skill 更新了个小功能,在群里 @bot,总结群聊记录的时候,就可以结合聊天记录的上下文,在总结的时候回复问题 具体参考:https://github.com/JimLiu/baoyu-skills/commit/a85c81e8db8a19a633e30dda0823e8a9c686263d

宝玉: baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...

智能体教程/实践
10:10
宝玉@dotey
71
数据库接入AI Agent的Token消耗优化方案

指出将工作流写入Memory方案的根本问题在于Agent需每次重新理解意图,导致token消耗大且不稳定。最佳实践是采用“Agent技能+脚本”架构:LLM仅负责将自然语言转译为SQL,所有确定性步骤由脚本执行。此方案可大幅降低token消耗。

智能体教程/实践编码
06:42
ginobefun@hongming731
70
Anthropic 发布了官方插件 claude-code-setup,用于简化 Claude Code 的配置。它能自动扫描项目,一键推荐并配置 Hooks、技能、MCP 服务、子代理及自动化功能。该插件可将原本 30-60 分钟的手动配置过程,缩短至 3-5 分钟完成。安装命令为:`/plugin install claude-code-setup@claude-plugins-official`。

Dr. Moyu|摸鱼局长: 安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推...

AnthropicMCP/工具教程/实践
05:45
Google AI Developers@googleaidevs
42
Eigent平台展示了集成Gemini Managed Agents API的实际效果。其开源协作工具Eigent使用Gemini 3.5 Flash和该API,快速定位了一个真实的megatron-lm CI故障,在几分钟内找到了根本原因。工作流程中,协调员智能体规划审计,开发员智能体加载`ml-failure-audit`技能并收集证据,随后Gemini智能体作为远程子智能体接手进行深度推理。这体现了Managed Agents在自动化复杂任务中的效率。

Eigent AI: Gemini 3.5 flash + Gemini managed agents api just audited a real megatron-lm ci failure inside Eigent. root cause in min...

智能体GoogleMCP/工具教程/实践
04:55
OpenAI Developers@OpenAIDevs
54
Builders Unscripted with @0xmts Matias与@romainhuet探讨了将Codex应用于工作和副项目工作流。 00:58 Codex在Alchemy的应用 01:51 代码审查捕获错误 08:04 使用Codex进行副项目 18:51 Codex App Server项目 24:01 计算机使用、GPT-5.5、SnapCat
智能体OpenAI教程/实践编码
03:45
Google AI Developers@googleaidevs
63
LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,使智能体能够访问 LlamaParse 和 LiteParse,从而自动处理非结构化文档。其工作流程为:配置数据与输出的 Git 仓库,将仓库克隆至智能体沙箱,安装 LiteParse CLI 与 LlamaParse SDK 及相关技能,最后通过提示词驱动智能体自主执行任务。该模板最终形成一个可直接使用 LlamaParse 和 LiteParse 处理真实世界文档的智能体。

LlamaIndex 🦙: 🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed...

智能体GoogleMCP/工具教程/实践
03:09
宝玉@dotey
66
Claude Design与代码同步的实践方法

针对后续UI改动可能导致Claude Design与实际代码不一致的问题,分享的实践方法是:始终将Claude Design作为唯一设计源,并在更新时生成changelog供Claude Code同步。遵循先修改设计再改代码的原则,若临时修改了代码,事后也应同步回Claude Design。

CanCan: @dotey 这里有一个小问题,后续ui 改动怎们办?先改 claude design,有时候小改动直接改code,但是这样时间长了 design 和 code就 不一致了

智能体教程/实践编码
02:26
Replit ⠕@Replit
34
这是你需要在60秒内了解的关于Replit的一切 ⭐️ → 简单的英文提示词即可生成真实可用的软件 → 从UI到部署的端到端工作流 → 仅需一个链接即可实现实时团队协作 → 并行AI智能体同时构建应用的不同部分
智能体教程/实践编码
02:15
Google AI Developers@googleaidevs
43
我们很欣赏@wandb团队在Gemini API中使用托管智能体的方式。隐蔽的bug无处遁形。🐛⬇️

Weights & Biases: The scariest bug from a coding agent isn't the one that crashes. It's the one that runs cleanly, passes tests, and quiet...

智能体Google教程/实践编码
02:09
宝玉@dotey
68
推文对比了AI模型的两种推理模式。主张选择Reasoning Max模式,认为多花时间进行深入推理,反而能减少后续验证时间,即"慢就是快"。而Speed Fast模式虽快,但性价比不高,除非预算充足。被引用的推文进一步支持"选择Max",并指出这样能最大化利用用户宝贵的时间。

Rainman: @MomoseReina 选择Max 挽弓当挽强、用人当用长,你的时间比什么都宝贵

推理教程/实践
01:39
宝玉@dotey
68
用AI开发Mac应用的几点实用经验分享

一位开发者分享了借助AI开发Mac应用的四点经验:建议优先使用AppKit而非SwiftUI,因后者界面较弱,而AI已弥补了AppKit开发复杂度高的短板;推荐在编码前先用Claude Design打磨UI与UX;指出Opus模型生成的UI优于GPT-5.5;并提到Codex提供了一个名为“Build macOS Apps”的官方插件可供使用。

卫斯理: 今天想到一点,我是否可以去做 mac app? 理由如下 - 会 objective-c/swift 我是国内比较早进入 iOS 开发的那批人 - 正好有个 idea - 正好有 claude code ,以前总觉得 appkit 很难用,...

教程/实践编码
00:25
Boris Cherny@bcherny
62
Salesforce发布了一篇关于使用Claude Code实现智能体化的详细文章。有几点引人注目。 他们曾评估需要231天的迁移工作,在13天内完成。其中一个PR交付了21个端点,测试覆盖率达到100%。
智能体Anthropic教程/实践编码
5月29日
23:24
Kling AI@Kling_ai
62
Kling AI戛纳展示--RAPHAEL:AI工作流幕后 深入了解RAPHAEL,一部使用Kling AI创作的AI驱动故事片。看看创作者如何在整个电影制作流程中运用Kling AI,从创意构思到最终电影画面,简化制作并释放新的创作可能性。
教程/实践视频
23:10
向阳乔木@vista8
65
AI辅助PPT设计流程

用户分享其AI驱动的PPT制作流程:先用GPT 5.5 Pro和Grok搜集资料并形成个人理解;再由Codex或CC加工成Markdown格式的经验帖;然后将内容上传至Youmind,生成大纲及20页高清PPT页面;最后导出图片包,在Keynote中完成自我介绍、FAQ等最终页面的制作。

OpenAI教程/实践
22:42
歸藏(guizang.ai)@op7418
63
AI编程工具不止写代码:新实用场景涌现

推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

智能体Anthropic教程/实践端侧
22:40
Runway@runwayml
52
深入幕后,了解《The Rogue》如何由一个人在一个月内使用 Runway 制作完成。 《The Rogue》是 Project Luxo 的一部分:这是一个探索 AI 生成视频如何跨越恐怖谷的新项目。
图像生成教程/实践视频
21:34
AYi@AYi_AInotes
14
本文探讨"以术入道"的AI使用哲学。作者将AI工具分为两类:自主运行的Agent型(如Claude Code),和需人工逐步判断的"实习生型"(如Cursor)。后者是培养用户判断力的关键,但受限于必须在场的瓶颈。文中介绍了网易的免费远程软件UU远程,它允许用户通过手机连接Mac运行Cursor,实现低延迟操作,包括原生终端支持,从而打破了物理距离的限制。作者认为,AI发展的当前阶段,更需要这种能随时与AI协同思考的连接方式。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

其他开源/仓库教程/实践
21:30
OpenBMB@OpenBMB
53
🚀 一个1.3B模型在矿山现场和企业办公室处理实际工作--比你的标注团队更快。 开发者Jingdong分享的一个近期社区案例,探索了使用MiniCPM-V 4.6进行: ✅实验室图像中的矿样计数 ✅现场图像中的车辆检测与计数 ✅航拍地图中的矿区识别 ✅Go代码完整性检查 以下是实际发生的情况🧵
多模态教程/实践
18:10
向阳乔木@vista8
65
建议备份X帖子并借助AI总结经验

推文强烈建议用户下载X平台的所有帖子进行备份,以防被算法误封后丢失历史数据。同时,可利用Codex或CC(可能指Claude)等工具分析这些内容,帮助自己总结出未曾意识到的个人方法论。推文指明了操作路径:需在X网页端通过“更多->设置和隐私->你的账号->下载你的数据的存档”提交申请,通常次日可下载,且过期需重新申请。

教程/实践数据/训练
17:40
向阳乔木@vista8
49
X Premium+用户现可安装Grok Build CLI

X Premium+订阅用户现已可以安装Grok Build CLI。实际测试显示,该工具能成功生成图片,但调用 video_gen 接口生成视频的功能目前不可用,尽管官方有相关表述。此外,直接读取X平台帖子的功能也尚未实现。在编程能力上,该工具被认为不及Codex与Claude Code。

xAI教程/实践部署/工程
16:34
Berryxia.AI@berryxia
57
Opus 4.8 实现两轮对话生成基础 CAD 模型

用户展示使用 Opus 4.8 模型,仅通过约两轮自然语言对话即可生成基础 3D CAD 模型(如球体、圆圈等),初步演示效果良好,但离工业级应用尚有距离。该成果呼应了 AI 辅助设计从代码生成向自然语言直接驱动三维建模的演进趋势。

Berryxia.AI: 大家越来越叼了! 从原来的Coding软件已经无法满足大家的胃口了,现在都是开始自然文本-3D CAD 来Coding了。

Anthropic多模态教程/实践
15:10
meng shao@shao__meng
48
Cursor不只是编程助手:它解决了我的网络问题

推文作者全天遭遇网络代理(🪜)问题,导致Codex连接失败。他使用Cursor分析代理设置,Cursor在几分钟内分析了代理实现、执行测试并修复了代理方式,随后亲自调用CLI测试Codex以确认修复。为预防未来问题,Cursor还集成了用户此前提供的DeepSeek API密钥,创建了一键切换至DeepSeek的选项,确保了服务可用性。

智能体MCP/工具教程/实践编码
‹ 上一页
1…1112131415…31
下一页 ›