5月13日

17:13

SiliconFlow@SiliconFlowAI

精选69

通过@continuedev在VS Code中直接运行DeepSeek V4、GLM-5.1、Kimi K2.6等多款模型@SiliconFlowAI 支持标签自动补全、AI对话编辑和智能体功能以下是3步设置指南 🧵⬇️

智能体教程/实践编码

推荐理由：用 DeepSeek V4 等国产模型的开发者可以照抄这个 VS Code 配置，三步就能搞定，但本质上就是填个 API key，别期待魔法。

13:55

Simon Willison 博客

CSP允许列表实验

该工具展示了一项实验：将应用加载于受内容安全策略（CSP）保护的沙盒iframe中，并通过自定义的fetch()函数拦截CSP错误，将其传递至父窗口。父窗口随后可提示用户将受阻域名（如https://api.inaturalist.org）添加至允许列表，刷新页面后即可生效。工具界面包含源代码、预览面板及允许列表管理区，用户可手动添加如https://api.github.com等受信来源。此项目由作者在Codex桌面应用中借助GPT-5.5 xhigh协助构建完成。

教程/实践部署/工程

13:50

歸藏(guizang.ai)@op7418

Skills功能已更新，新增了带地图的版式和地图组件。用户可让各自的AI更新此技能。更新后的地图支持缩放、拖动等基本交互操作，并且AI能够在地图上进行任意标记。这增强了AI在空间信息处理和可视化方面的能力。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

MCP/工具教程/实践

13:50

Berryxia.AI@berryxia

AI Agent 得记忆科普是让铁锤讲明白了，看完后身心愉悦，后背从此不再发凉。【引用 @lxfater】：http://x.com/i/article/2054390427139383296

铁锤人: http://x.com/i/article/2054390427139383296

智能体大佬观点教程/实践

13:34

Peter Steinberger 🦞@steipete

Codex在调试Telegram问题时需要新令牌，于是使用Peekaboo打开Telegram Mac应用，联系botfather并完成了操作。计算机应用令人惊叹。https://peekaboo.sh

智能体 MCP/工具 OpenAI 教程/实践

12:50

歸藏(guizang.ai)@op7418

用交互式PPT讲述天津五大道历史故事

作者在游览天津五大道时，尝试利用AI查询该区域复杂的历史背景，发现众多近代名人事件与此地相关。为此，他创新了PPT制作方式，将历史人物的故事卡片与可交互的嵌入式地图相结合进行展示。这种新排版旨在让演示内容更丰富、信息更详实，并计划在未来进行更多类似尝试，以提升PPT的信息承载与呈现能力。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

多模态教程/实践

12:50

Berryxia.AI@berryxia

车主借ChatGPT诊断刹车异响，69元清洗剂替代4S店千元维修

车主发现刹车片在潮湿天气出现异响，未选择4S店建议的更换方案，转而通过ChatGPT分析问题。AI判断异响可能源于潮湿导致的锈迹，并推荐使用清洗剂处理。车主花费69元购买清洗剂后，喷洒试用成功消除异响。此前4S店曾以磨损为由建议更换整套刹车片，费用超千元。此事凸显了AI在日常生活问题诊断中的实用价值，帮助用户避免了不必要的开支。

OpenAI 推理教程/实践

11:50

Berryxia.AI@berryxia

BenchLoop：本地大模型一键基准测试与排行榜发布

BenchLoop 提供了一套对本地大模型进行基准测试的标准化流程。用户只需拉取模型并运行该工具，即可实时获取模型在质量、速度和可靠性方面的综合评分。平台支持对比不同提示框架（如原生模式与 Hermes 模式）下的性能表现。测试完成后，结果可自动发布至公开排行榜，便于横向比较不同模型的优劣。

推理教程/实践部署/工程

11:50

Berryxia.AI@berryxia

腾讯元宝群聊总结功能实测：手动操作欠智能，核心需求未满足

用户实测腾讯元宝的群聊总结功能，发现其与预期存在较大差距。该功能无法自动进群总结，需用户手动多选聊天记录并转发给元宝，且存在操作上限不明确的问题。生成的总结内容被批评为机械的文本拼凑，缺乏AI应有的智能分析与提炼能力。用户指出，最核心的需求是能将元宝直接拉入群聊并自动梳理每日重点，但目前这一简单需求并未得到实现。

教程/实践评测/基准

10:36

宝玉@dotey

Claude自动化架构解析：Skill、Agent、Connector与Plugin如何协同工作

Claude通过四大组件实现自动化任务：Skill是领域工作流指南（如nda-review），指导操作但不执行；Agent是执行主体，Subagent用于并行处理子任务，Scheduled agent则定时自动运行（如合同到期监控）；MCP connector连接外部数据源（如合同库），使Agent能访问真实数据；Plugin将上述组件打包，提供完整功能集（如commercial-legal plugin实现企业合同审查）。这些组件共同协作，使Claude能高效处理复杂工作流。

changbo: @dotey 大佬能否解释一下,这个 Claude 一会插件的,一会 Skills 的,一会这个 Agent 的,它他到底想干什么呀?

智能体 Anthropic MCP/工具教程/实践

09:49

ginobefun@hongming731

构建支持暂停、恢复且永不丢失上下文的长时间运行 AI 智能体（基于 ADK）

Google博客以“新员工入职协调Agent”为例，指出AI智能体从演示走向生产需完成三大架构转变，核心是上下文与状态解耦。首先，采用持久化状态机，通过明确进度节点替代对话历史记录状态，解决上下文污染、token成本爆炸和推理幻觉问题。其次，引入事件驱动休眠门控，使Agent在等待外部事件时挂起以零资源消耗。最后，通过多Agent委托机制，将专项任务交由独立子Agent处理，避免提示词膨胀并支持独立优化。完整示例代码已开源。

智能体 Google 教程/实践部署/工程

08:49

Berryxia.AI@berryxia

这位老哥的，Codex的使用小Tips！👇🏻 💡 小Codex技巧：你不必局限于一次只看一个线程。 🪟 并行打开多个完整窗口 💬 使用 /side 分支对话以提出临时后续问题 🛟 你还可以为Codex弹出窗口设置热键以快速发起新任务

dominik kundel: 💡 Small Codex tip: You don't have to be limited to looking at one thread at a time. 🪟 Open multiple full windows in pa...

智能体 OpenAI 教程/实践编码

07:49

Berryxia.AI@berryxia

精选75

90%的人在白白浪费"Token"！

Andrej Karpathy指出，AI编程账单的90%浪费在发送不必要的上下文上。常见浪费行为包括：过度加载文件、使用高价模型处理简单任务、Agent重复发送整个代码库、默认选用高价模型而非性价比更高的替代品。优化策略强调严格管理上下文、启用提示词缓存、采用多模型路由（如主力用Kimi 2.6，关键任务用Opus）、创建SKILL.md文件避免知识重建、先分析工具调用再优化提示。未来，开发者月花费的巨大差距将取决于其上下文和模型路由的管理能力，而非纯粹的技术水平。

Ronin: Andrej Karpathy: "90% of your AI coding bill is paying for context you didn't need to send" Here are 10 things senior AI...

教程/实践编码

推荐理由：Karpathy 这条推文把 AI 编程的浪费点戳穿了，10 条技巧每条都能直接省下真金白银，Vibe Coding 的人看完账单会沉默。

07:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

财务团队如何使用 Codex

财务团队能够利用 Codex，基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码，自动化处理财务数据整合、差异分析和模型验证等复杂任务，从而提升报告生成效率与准确性，并支持快速创建多版本规划场景。

OpenAI 教程/实践编码

推荐理由：金融团队终于有了一个正经的 AI 用例，用 Codex 自动生成 MBR、差异桥接和规划场景，比手工拉 Excel 高效太多了，做财务分析的建议点开看看。

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档，将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题，同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长，并系统化地融入了日常开发工作流。

OpenAI 教程/实践编码

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据（如电子邮件、会议记录和电子表格）自动转换为结构化的财务分析框架，从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间，使团队能更专注于高价值的分析与决策支持工作。

OpenAI 教程/实践编码

04:35

宝玉@dotey

Codex App 可以当 Typeless 用，开启全局快捷键设置正确权限后就可以在任意输入位置语音输入，效果还不错。比如说这一段文字就是Codex帮忙输入的。

OpenAI 教程/实践语音

02:54

Claude：Blog（网页）

精选58

Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统，包含 CLUE Triage 自动初筛警报，整合上下文信息分配处置建议；以及 CLUE Investigate 支持分析师用自然语言查询日志，由 Claude 自动生成并执行查询，将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证，一周内交付实现，显著提升了安全运营效率。

智能体 Anthropic 安全/对齐教程/实践

推荐理由：我一直好奇大模型公司自己怎么用 AI 做安全，这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天，数据比很多 PR 稿扎实。

01:05

Google Developers Blog（RSS）

精选73

使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体，以管理长达数天或数周的企业工作流程（如HR入职）。通过引入Agent Development Kit（ADK），其架构核心采用持久状态机和持久化会话存储，确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制，实现在暂停期间“休眠”，并在唤醒后以高推理准确性恢复复杂任务，从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体 Google 教程/实践部署/工程

推荐理由：Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent，状态机和持久会话是两个关键切入点，做过生产环境 agent 的都懂这东西有多刚需。

00:22

向阳乔木@vista8

调研最佳Markdown编辑器及HeavySkill多AI协作思路

作者完成了首个测试，调研了最佳的开源所见即所得Markdown编辑库，并得出结论：明确需求和数据模型是选择合适库的前提。同时，他参考了@vista8提及的HeavySkill论文思路，该论文提出让多个AI（如Claude、Codex）先并行独立推理，再通过另一轮推理整合思路，以显著提升回答质量。作者正基于此思路开发一个Skill进行实践。

向阳乔木: 读了一篇叫HeavySkill的论文,非常有意思。让多个 AI先并行"独立思考",生成多条独立推理。再用另一轮推理来综合所有思路,得出最终答案。按论文测试结果,回答质量会提升非常多。正在按这个思路写一个Skill,Claude Co...

智能体推理教程/实践

00:04

凡人小北@frxiaobei

飞书CLI新增百项能力，AI Agent重塑工作流

飞书CLI近期悄然更新了100多项能力，允许用户通过AI Agent自动化编排飞书内的多项功能，如Bot、画板、妙记、审批和知识库。这旨在将AI能力从开发层延伸至日常协作层，解决工作碎片化问题。引用推文指出，管理者可为下属配置专属Agent，实现Agent间的自动化沟通与任务处理，从而让人专注于核心决策，提升个人与团队效率。官方提供了能力清单和使用案例以供参考。

凡人小北: 我给每个下属都配了一个专属 Agent,跑在飞书上。现在是他们的 Agent 在跟我的 Agent 对话,我在旁边看着。带团队这些年,我最大的感受不是累,是碎。各种项目要跟,各种进展要盯,各种需求要确认。AI 让每个程序员的产出翻了好几...

智能体 MCP/工具教程/实践

5月12日

23:54

Xiaomi MiMo@XiaomiMiMo

重要提示：使用小米MiMo思考模式时需注意reasoning_content字段完整性

当在多轮代理会话中启用小米MiMo思考模式，且对话历史包含工具调用时，后续用户回合中传回的助手消息必须保留完整的reasoning_content字段，否则API将返回400错误。缺失该字段会导致模型上下文不完整，进而削弱指令跟随能力、增加幻觉并显著降低用户体验。受影响的框架包括TRAE、Cursor、Roo Code等，受影响模型涵盖MiMo-V2.5-Pro、MiMo-V2.5等多个系列。开发团队正与相关维护者合作推送兼容性更新以解决此问题。更多详情请参阅官方文档。

智能体 MCP/工具教程/实践

23:53

GitHub Blog

精选58

Dungeons & Desktops：使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序，能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成，实现了程序化关卡创建，展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub 教程/实践编码

推荐理由：用 GitHub Copilot CLI 把代码库变成 roguelike 地牢，玩法挺有脑洞，做 Copilot 扩展的开发者可以看一眼思路。

23:22

向阳乔木@vista8

本文介绍了在Claude Code中通过插件市场安装OpenAI官方Codex插件的具体步骤：添加库、安装插件、重新加载及配置。其核心实践动机源于HeavySkill论文提出的"重思考"方法，即让多个AI模型并行独立推理，再由一个模型（如Codex）作为主持人综合思路以提升回答质量。作者正依此构建由Claude Code推理、Codex主持的Skill。

Anthropic MCP/工具 OpenAI 教程/实践