AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 310 条
全部一手资讯X论文
标签「教程/实践」清除
5月15日周五
00:08Google Developers Blog(RSS)63精选加速设备端AI:Arm与Google AI Edge的优化实践
5月14日周四
22:45Hugging Face:Blog(RSS)59精选解锁连续批处理中的异步性
03:29Claude:Blog(网页)73精选Claude 电脑与浏览器使用的最佳实践
02:31OpenAI:官网动态(RSS · 排除企业/客户案例)62精选在 Windows 上构建安全有效的沙箱以启用 Codex
5月13日周三
07:09OpenAI:官网动态(RSS · 排除企业/客户案例)63精选财务团队如何使用 Codex
06:08OpenAI:官网动态(RSS · 排除企业/客户案例)25AutoScout24 通过 AI 驱动的工作流扩展工程能力
06:08OpenAI:官网动态(RSS · 排除企业/客户案例)51财务团队如何使用 Codex
02:54Claude:Blog(网页)58精选Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台
01:05Google Developers Blog(RSS)73精选使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体
5月12日周二
23:53GitHub Blog58精选Dungeons & Desktops: 使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏
18:00公众号:小红书技术(dots.llm)34QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾
07:43Hugging Face:Blog(RSS)58精选在AWS上进行基础模型训练与推理的核心构建模块
5月11日周一
17:58公众号:小红书技术(dots.llm)45打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路
5月9日周六
09:30公众号:MiniMax(稀宇科技)48大模型不认识马嘉祺?MiniMax做了一次全链路排查
03:43OpenAI:官网动态(RSS · 排除企业/客户案例)63精选在OpenAI安全运行Codex
5月8日周五
16:23Hugging Face:Blog(RSS)58精选MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型
07:30GitHub Blog72精选提升 GitHub Agentic Workflows 的 Token 使用效率
03:30GitHub Blog79精选Agent pull requests 无处不在:如何审查它们
5月7日周四
20:03公众号:豆包(字节)28科研工作者们如何用豆包?他们这样说
19:58公众号:龙猫LongCat(美团)56用Agent评测思路管理AI Coding -- 31万行代码AI重构的实践
05:30GitHub Blog56精选Validating agentic behavior when "correct" isn't deterministic
03:22Hugging Face:Blog(RSS)65精选vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性
00:35Cursor Blog53通过自动安装系统引导Composer开发
5月6日周三
03:28Claude:Blog(网页)71精选金融服务行业Claude部署指南发布
5月5日周二
23:03Runway:News(网页)55精选60倍速冷启动:将同级GPU视为权重服务器
02:59OpenAI:官网动态(RSS · 排除企业/客户案例)58精选OpenAI 如何大规模交付低延迟语音 AI
5月2日周六
01:18Claude:Blog(网页)64精选零基础项目经理借助Claude Code,六周内独立开发并上线压力管理应用
5月1日周五
04:16Claude:Blog(网页)64精选构建企业级AI智能体:领先企业的转型指南
02:15Claude:Blog(网页)64精选Claude Code 构建经验:提示缓存的优化实践
00:13GitHub Blog59精选GitHub Copilot CLI 入门指南:交互模式与非交互模式
4月30日周四
20:00Cursor Blog55精选持续优化智能体工具链:上下文演进与效果评估
08:30公众号:智谱(GLM)47Scaling Pain:智谱GLM超大规模Coding Agent推理实践
4月29日周三
23:40Claude:Blog(网页)58精选智能体时代的产品开发:Claude Managed Agents 如何解放产品经理
23:39Hugging Face:Blog(RSS)52Granite 4.1 LLMs:构建之道
00:36Claude:Blog(网页)72精选像培训新开发者一样引导Claude Code:来自17年开发的经验教训
4月28日周二
12:33Runway:News(网页)58精选无闲置GPU:Runway的研究计算管理
4月27日周一
22:28Hugging Face:Blog(RSS)53如何利用OpenAI的Privacy Filter构建可扩展的Web应用
21:22Google Blog:AI(RSS)50加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程
17:55公众号:通义实验室(千问)34搜对≠答对:EAPO用"证据奖励"让大模型不再靠猜
4月26日周日
11:30公众号:可灵AI(快手·视频)42可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月15日
00:08
Google Developers Blog(RSS)
精选63
加速设备端AI:Arm与Google AI Edge的优化实践

Arm第二代可扩展矩阵扩展(SME2)与Google AI Edge软件栈集成,将CPU转变为强大的矩阵计算加速器,从而实现高性能的设备端生成式AI。本文以Stability AI的“stable-audio-open-small”模型为例,阐述了利用LiteRT、XNNPACK和KleidiAI构建的“转换、优化、部署”自动化硬件加速流程。该方案在基于Arm架构的移动设备和笔记本电脑上,成功实现了音频生成速度提升2倍以上、内存使用减少4倍的显著效果,同时确保了高音频质量。这一集成方案为在资源受限的边缘设备上高效运行复杂AI模型提供了有效路径。

Google教程/实践端侧部署/工程

推荐理由:Google 和 Arm 在设备端 AI 上的联合优化案例很具体,给了开发者一套可复制的流程,2x 加速和 4x 内存节省对于做移动端生成式 AI 的人来说值得动手试一下。
5月14日
22:45
Hugging Face:Blog(RSS)
精选59
解锁连续批处理中的异步性

在连续批处理中,同步方式导致CPU与GPU交替工作,造成闲置浪费。测试显示,使用8B模型生成8K令牌时,GPU有24%的时间处于空闲状态。异步批处理通过分离工作负载,让CPU准备下一批次(N+1)的同时,GPU计算当前批次(N),从而消除闲置间隙。这可通过CUDA流实现操作并发,无需更改内核或模型,仅需协调硬件执行顺序。理论上,该方法可将总生成时间从300.6秒减少至228秒,实现24%的免费加速。相关技术已集成到transformers库的连续批处理中,显著提升推理性能。

Hugging Face推理教程/实践部署/工程

推荐理由:文章手把手拆解了异步批处理如何用CUDA流和事件消除CPU与GPU的互相等待,把推理吞吐提升22%,搞推理优化的工程师值得细读。
03:29
Claude:Blog(网页)
精选73
Claude 电脑与浏览器使用的最佳实践

Claude 最新模型在电脑与浏览器使用能力上显著提升,支持构建复杂智能体系统。本文针对Claude 4.6系列和Opus 4.7提供实践指南,重点优化截图分辨率:Claude 4.6系列API限制最大长边1568像素、总像素115万;Opus 4.7提升至最大长边2576像素、总像素375万。发送前将截图缩放到限制内是提升点击准确性的最有效方法。推荐起始分辨率为1280x720,Opus 4.7用户可优先使用1080p,并避免发送未经缩放的原始截图或过低分辨率图像。

智能体Anthropic教程/实践部署/工程

推荐理由:如果你正在让 Claude 操作桌面或浏览器,这篇官方指南把分辨率、token 压缩和缓存策略一次讲透了,附带代码和踩坑表,是那种"读完就能少写一堆 bug"的硬核文档。
02:31
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选62
在 Windows 上构建安全有效的沙箱以启用 Codex

OpenAI 为 Windows 平台上的 Codex 构建了一个安全沙箱环境。该沙箱通过严格控制文件访问权限和实施网络限制,确保了代码生成与执行过程的安全性。这一举措使得基于 Codex 的编码助手能够以高效且受控的方式运行,在提供强大编程辅助功能的同时,有效隔离了潜在风险,保障了用户系统的安全。

OpenAI安全/对齐教程/实践

推荐理由:OpenAI 首度公开 Codex 在 Windows 上的沙箱细节,控制文件访问和网络限制的架构设计讲得很实在,做自主编程代理安全的值得一读。
5月13日
07:09
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
财务团队如何使用 Codex

财务团队能够利用 Codex,基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码,自动化处理财务数据整合、差异分析和模型验证等复杂任务,从而提升报告生成效率与准确性,并支持快速创建多版本规划场景。

OpenAI教程/实践编码

推荐理由:金融团队终于有了一个正经的 AI 用例,用 Codex 自动生成 MBR、差异桥接和规划场景,比手工拉 Excel 高效太多了,做财务分析的建议点开看看。
06:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
25
AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档,将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题,同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长,并系统化地融入了日常开发工作流。

OpenAI教程/实践编码
06:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
51
财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据(如电子邮件、会议记录和电子表格)自动转换为结构化的财务分析框架,从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间,使团队能更专注于高价值的分析与决策支持工作。

OpenAI教程/实践编码
02:54
Claude:Blog(网页)
精选58
Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统,包含 CLUE Triage 自动初筛警报,整合上下文信息分配处置建议;以及 CLUE Investigate 支持分析师用自然语言查询日志,由 Claude 自动生成并执行查询,将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证,一周内交付实现,显著提升了安全运营效率。

智能体Anthropic安全/对齐教程/实践

推荐理由:我一直好奇大模型公司自己怎么用 AI 做安全,这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天,数据比很多 PR 稿扎实。
01:05
Google Developers Blog(RSS)
精选73
使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体Google教程/实践部署/工程

推荐理由:Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent,状态机和持久会话是两个关键切入点,做过生产环境 agent 的都懂这东西有多刚需。
5月12日
23:53
GitHub Blog
精选58
Dungeons & Desktops: 使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序,能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成,实现了程序化关卡创建,展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub教程/实践编码

推荐理由:用 GitHub Copilot CLI 把代码库变成 roguelike 地牢,玩法挺有脑洞,做 Copilot 扩展的开发者可以看一眼思路。
18:00
公众号:小红书技术(dots.llm)
34
QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾

小红书在 QCon 北京 2026 分享了 GUI Agent 实战经验,核心思路是将自动化测试当作 AI Coding 来做,通过工程化方式让 GUI Agent 在真实业务场景中“跑起来、跑得稳、跑得省钱”。

智能体教程/实践部署/工程
07:43
Hugging Face:Blog(RSS)
精选58
在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师,阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件:配备多代NVIDIA GPU(如H100、H200及新一代Blackwell B200/B300)的大显存加速计算实例;用于集体通信的高带宽、低延迟网络(节点内NVLink与节点间EFA);以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同,共同支撑预训练、后训练和推理工作负载,并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由:这篇把AWS上训大模型的全套基础设施串了一遍,从GPU选型到网络存储再到Slurm/K8s编排,是做云端大规模训练的工程师的必读参考。
5月11日
17:58
公众号:小红书技术(dots.llm)
45
打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路

小红书PMO团队探索AI智能体(Agentic)在项目管理中的落地路径,目标是从让AI理解项目管理,进化为为每个项目组打造一个专属BP(业务伙伴)。

智能体教程/实践
5月9日
09:30
公众号:MiniMax(稀宇科技)
48
大模型不认识马嘉祺?MiniMax做了一次全链路排查

开发团队发现大模型无法识别“马嘉祺”,随即对知识缺失原因进行了全链路排查。

教程/实践
03:43
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
在OpenAI安全运行Codex

OpenAI通过沙盒隔离、人工审批流程、严格网络策略与原生代理遥测四层防护机制,确保Codex代码生成模型的安全运行。沙盒环境完全隔离执行代码,所有生产请求需经人工审核批准,网络策略限制外部依赖访问,实时遥测系统监控代理行为异常。该安全框架使企业能够合规采用AI编程助手,在保障代码安全性的同时维持开发效率。

智能体OpenAI安全/对齐教程/实践

推荐理由:OpenAI 公开了内部安全运行 Codex 的完整流程,从沙箱隔离到审批策略,企业落地 AI 编码的可以直接拿去抄作业。
5月8日
16:23
Hugging Face:Blog(RSS)
精选58
MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型

该项目使用AMD Instinct MI300X(192 GB HBM3显存)和ROCm,通过LoRA微调Qwen3-1.7B模型实现医学问答。训练仅用2000条MedMCQA样本,约5分钟完成,仅更新约220万参数(占模型总参数的0.1443%),全程采用fp16精度,无需量化。HuggingFace生态(Transformers、PEFT、TRL、Accelerate)在ROCm上无缝运行,无需修改代码即可直接替代CUDA。模型已上传至HuggingFace Hub并提供在线Demo。

Hugging Face开源生态教程/实践数据/训练

推荐理由:一个月前的教程了,但如果你是 AMD 党想跑医疗微调,这篇把坑都踩完了,代码直接能复现,LoRA 适配器也挂在 Hub 上,拿来就能用。
07:30
GitHub Blog
精选72
提升 GitHub Agentic Workflows 的 Token 使用效率

GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流,定位了效率低下的环节,并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用,直接提升了工作流的经济性与运行效率。

智能体GitHubMCP/工具教程/实践

推荐理由:GitHub 把自己生产环境的 agentic workflow 扒了一遍,从 token 消耗里找浪费,再让 agent 自动修。不是 paper,是真踩过的坑,做 Copilot 集成的团队可以抄作业。
03:30
GitHub Blog
精选79
Agent pull requests 无处不在:如何审查它们

这份指南提供了审查由AI代理生成的pull requests的实用方法,重点包括审查时应关注的代码变更点、问题常见隐藏位置(如逻辑错误或安全漏洞),以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交,确保代码质量,避免缺陷流入生产环境。指南强调主动审查策略,以应对AI代理在软件开发中日益普及的趋势。

智能体GitHub教程/实践编码

推荐理由:AI代理生成的PR越来越多,审查它们不再是可选项。这篇官方指南从发现隐患到控制技术债务,给出了马上能用的检查清单,每个用Copilot的开发者都该看。
5月7日
20:03
公众号:豆包(字节)
28
科研工作者们如何用豆包?他们这样说
多模态教程/实践
19:58
公众号:龙猫LongCat(美团)
56
用Agent评测思路管理AI Coding -- 31万行代码AI重构的实践

美团技术团队在LongCat项目中实践AI编码管理,指出当90%以上代码由AI生成时,决定系统走向的不是谁写得更快,而是约束AI的能力。

智能体教程/实践编码
05:30
GitHub Blog
精选56
Validating agentic behavior when "correct" isn't deterministic

GitHub 探讨如何为 Copilot 编码智能体构建“信任层”。文章提出,在“正确”答案非确定性的场景下,可通过领域分析来验证智能体的自主行为,避免使用脆弱的脚本或黑盒判断。该方法旨在提升 AI 编码助手的可靠性与透明度,确保其行为符合预期标准。

智能体GitHub教程/实践编码

推荐理由:做coding agent最头疼的就是如何验证产出质量,GitHub这篇把他们的内部方法论开源了,用dominance分析替代脆弱的脚本,对正在折腾AI编程工具的团队是实打实的参考,值得逐帧学习。
03:22
Hugging Face:Blog(RSS)
精选65
vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性

为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后,在线强化学习训练结果与 V0 参考运行一致,团队优先修复后端行为而非调整 RL 目标。关键修复包括:将日志概率模式设为 processed_logprobs 以匹配采样器分布;禁用 V1 特有的前缀缓存和异步调度等运行时默认值;调整权重更新路径以匹配 V0 的缓存保留行为;并确保 rollout 后端使用 fp32 精度的 lm_head 进行最终投影。这些措施消除了策略比率均值偏差,使 V1 在 KL 散度、熵等指标上与 V0 达成一致。

Hugging Face推理教程/实践部署/工程

推荐理由:vLLM V1迁移时踩的四个坑全在这里,从logprob语义到fp32投影头,修完才调RL目标,做在线RL的团队可以直接抄这份配置清单。
00:35
Cursor Blog
53
通过自动安装系统引导Composer开发

团队开发了Composer自动安装系统,利用早期模型(如Composer 1.5)为强化学习训练自动配置可运行环境。该系统分两阶段工作:先由智能体设定成功环境的目标命令与描述,再由另一智能体执行具体配置,包括安装依赖、模拟缺失组件并进行测试。在一项针对区块链项目Celo的真实实验中,该系统成功处理了稀疏文档和复杂依赖。采用此方法后,Composer 2在环境设置基准测试中的得分从47.9%提升至61.7%,为后续训练提供了更优基础。

智能体教程/实践编码部署/工程
5月6日
03:28
Claude:Blog(网页)
精选71
金融服务行业Claude部署指南发布

Anthropic发布金融服务行业Claude部署指南,详细介绍了Claude系列产品在金融研究、交易、承销、理赔及月末结算等场景的应用方案。指南包含产品矩阵、10个预置金融智能体模板(如招股书生成器、KYC筛查器等),并分享了AIG、澳大利亚联邦银行等机构的实践案例。同时,提供基础、试点、扩展三阶段实施路线图,旨在协助企业决策者与工程师规划AI落地路径,提升运营效率。

智能体Anthropic教程/实践部署/工程

推荐理由:Claude 官方首次系统性给出金融行业的部署指南,从产品矩阵到预建代理模板再到三阶段路线图,做金融 AI 落地的可以直接拿过来对齐。
5月5日
23:03
Runway:News(网页)
精选55
60倍速冷启动:将同级GPU视为权重服务器

Runway平台团队开发的NCCLBack系统,通过P2P权重传输将模型冷启动时间从数分钟缩短至数秒。其核心创新在于让新启动的GPU推理节点直接从集群内已加载权重的同级GPU获取模型参数,而非从云存储重复下载。该系统利用GPU互连(如InfiniBand、NVLink)高达200-400 Gbps的带宽,相比传统存储下载的2-10 Gbps实现了数量级提升。通过Redis协调与NCCL广播原语,NCCLBack确保了数据传输的效率和正确性,使得大规模集群部署新模型时,冷启动时间不随节点数量线性增长,基本保持恒定。

推理教程/实践部署/工程

推荐理由:Runway 工程师把 GPU 冷启动从分钟压到秒级,原理是让已加载权重的 GPU 直接「喂」给新同伴,而不是各自从存储下载。做大规模推理部署的团队值得细读。
02:59
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选58
OpenAI 如何大规模交付低延迟语音 AI

OpenAI 重建了其 WebRTC 技术栈,以支持实时语音 AI 服务。新系统实现了低延迟、全球规模扩展和无缝的对话轮转。此次重构旨在为 ChatGPT 的语音模式等产品提供更流畅、更自然的实时语音交互体验,解决了大规模部署时面临的延迟与稳定性挑战。

OpenAI教程/实践语音

推荐理由:OpenAI 把语音 AI 的低延迟秘诀摊开了,做实时语音产品的可以看看他们的 WebRTC 优化思路,虽然不太能直接抄,但方向值得参考。
5月2日
01:18
Claude:Blog(网页)
精选64
零基础项目经理借助Claude Code,六周内独立开发并上线压力管理应用

毫无编程经验的项目经理Kostiantyn Vlasenko,借助Claude Code在72小时内独立开发出压力管理应用Respiro,并于六周后成功上线苹果应用商店。该应用能通过手机实时检测用户压力信号,并即时引导呼吸练习。其架构由15个以上并行运作的专用子智能体构成,涵盖设计、开发、审查等模块。Claude协助完成了从技术选型、代码重构到苹果账号注册、服务集成乃至界面调试等一系列复杂操作,甚至支持了后续的市场推广工作。

智能体Anthropic教程/实践

推荐理由:一个零编程经验的项目经理,用 Claude Code 六周做完压力管理 App 并上架。关键不在技术,而在「管人经验拿来管 AI agent」的思路,对非技术背景的创业者太有参考价值。
5月1日
04:16
Claude:Blog(网页)
精选64
构建企业级AI智能体:领先企业的转型指南

2025年数据显示,美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程,并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例,提出企业AI转型三大支柱:跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断,以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案,并包含六个月的落地框架。

智能体Anthropic教程/实践

推荐理由:从 L'Oréal、Lyft 这些案例看,企业怎么把 AI 智能体扎进业务流程,比泛泛而谈的 AI 转型文章实在得多。
02:15
Claude:Blog(网页)
精选64
Claude Code 构建经验:提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作,能显著降低延迟与成本,高命中率还能支持更宽松的订阅速率限制。关键实践包括:将静态系统提示和工具定义置于提示词前端以最大化共享前缀;通过消息而非修改提示词来传递更新信息,避免缓存失效;在会话中不切换模型、不增删工具,以维持缓存前缀稳定。此外,针对工具过多或“计划模式”等场景,可通过发送轻量存根或设计专用工具来规避缓存失效,从而在复杂功能中持续利用缓存优势。

智能体AnthropicMCP/工具教程/实践

推荐理由:Claude Code团队把提示缓存的坑和优化方法全盘托出,从提示顺序、工具加载到压缩技巧,每一个经验都是钱和延迟换来的,做agent的同行可以直接拿去做架构参考。
00:13
GitHub Blog
精选59
GitHub Copilot CLI 入门指南:交互模式与非交互模式

GitHub Copilot CLI 提供了交互与非交互两种主要使用模式。交互模式允许用户通过对话式指令逐步构建和调整命令,适合探索性任务。非交互模式则支持直接输入完整指令快速执行,适用于自动化脚本或已知命令。理解这两种模式的区别能帮助开发者更高效地利用该工具,提升命令行工作效率。

GitHub教程/实践编码

推荐理由:如果你总在 Copilot CLI 的交互和非交互模式之间犯迷糊,这篇官方教程算是清晰的速查手册,初学者花五分钟就能搞清楚。
4月30日
20:00
Cursor Blog
精选55
持续优化智能体工具链:上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链,核心围绕上下文窗口的演进。早期模型能力有限,工具链依赖大量静态上下文和防护机制;随着模型能力提升,团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合:通过CursorBench等基准测试进行标准化质量评估,同时进行线上A/B测试,使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误,以应对日益复杂的工具链状态。

智能体AnthropicOpenAI教程/实践

推荐理由:Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一,从上下文管理到多 agent 调度,全是实战迭代的血泪经验,做 agent 的团队该逐字读。
08:30
公众号:智谱(GLM)
47
Scaling Pain:智谱GLM超大规模Coding Agent推理实践

智谱GLM的超大规模Coding Agent推理实践,聚焦Scaling Pain(扩展痛点)及其应对经验。

推理教程/实践部署/工程
4月29日
23:40
Claude:Blog(网页)
精选58
智能体时代的产品开发:Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体,使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流:使用Claude进行开放式探索,然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务,如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作,让她能将更多时间投入到与团队和用户的创造性合作中。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程,对于想要用agent重构产品开发节奏的团队有实际参考价值,但不算爆炸性更新。
23:39
Hugging Face:Blog(RSS)
52
Granite 4.1 LLMs:构建之道

IBM Granite团队在Hugging Face上发布了Granite 4.1系列大型语言模型的构建细节。该系列模型专注于代码与自然语言任务,采用多阶段训练流程,包括大规模代码数据预训练、多样化指令微调以及强化学习对齐。模型架构基于改进的Transformer解码器,并针对长序列和工具使用进行了优化。新版本在多项基准测试中性能显著提升,特别是在代码生成与数学推理任务上,部分指标超越了同规模的开源模型。团队同时公开了部分训练数据集构建方法与评估框架。

教程/实践数据/训练
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
4月28日
12:33
Runway:News(网页)
精选58
无闲置GPU:Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。

教程/实践部署/工程

推荐理由:Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记,利用率翻倍的方案和踩坑细节都有,做大规模训练集群调度的团队可以直接抄作业。
4月27日
22:28
Hugging Face:Blog(RSS)
53
如何利用OpenAI的Privacy Filter构建可扩展的Web应用

OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。

OpenAI教程/实践部署/工程
21:22
Google Blog:AI(RSS)
50
加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程

Google 与 Kaggle 再度推出为期 5 天的 AI Agents 强化课程,现已开放注册。该课程旨在教授开发者如何构建和部署 AI 智能体,内容涵盖从基础概念到实际应用。课程形式为短期集中学习,参与者将通过 Kaggle 平台进行实践。

智能体Google教程/实践
17:55
公众号:通义实验室(千问)
34
搜对≠答对:EAPO用"证据奖励"让大模型不再靠猜
检索增强推理教程/实践
4月26日
11:30
公众号:可灵AI(快手·视频)
42
可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片

可灵AI推出4K实战评测,展示以“一杯奶茶钱”的低成本制作4K分辨率时尚大片的流程与效果,验证AI视频工具在影视级创作中的性价比与可行性。

教程/实践视频
‹ 上一页
123456…8
下一页 ›