AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
5月14日周四
22:45Hugging Face:Blog(RSS)59精选解锁连续批处理中的异步性
21:29Hacker News 热门(buzzing.cc 中文翻译)78精选克劳德代码与《代码书》技能:有针对性的技能培养
12:11公众号:数字生命卡兹克42现在,你可以在手机上用AI生成一个APP了。
08:55Simon Willison 博客45欢迎来到 Datasette 博客
03:29Claude:Blog(网页)73精选Claude 电脑与浏览器使用的最佳实践
02:31OpenAI:官网动态(RSS · 排除企业/客户案例)62精选在 Windows 上构建安全有效的沙箱以启用 Codex
5月13日周三
17:39IT之家(RSS)66Anthropic Claude Code 缔造者:数千个 AI 智能体夜间自动为我写代码
13:55Simon Willison 博客68CSP允许列表实验
07:09OpenAI:官网动态(RSS · 排除企业/客户案例)63精选财务团队如何使用 Codex
06:08OpenAI:官网动态(RSS · 排除企业/客户案例)25AutoScout24 通过 AI 驱动的工作流扩展工程能力
06:08OpenAI:官网动态(RSS · 排除企业/客户案例)51财务团队如何使用 Codex
02:54Claude:Blog(网页)58精选Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台
01:05Google Developers Blog(RSS)73精选使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体
5月12日周二
23:53GitHub Blog58精选Dungeons & Desktops: 使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏
18:00公众号:小红书技术(dots.llm)34QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾
12:25Hacker News 热门(buzzing.cc 中文翻译)54我让人工智能开发了一个工具,帮助我找出是什么在半夜吵醒我
10:08公众号:数字生命卡兹克53分享5个Claude Code + 飞书的超实用Agent办公玩法。
07:43Hugging Face:Blog(RSS)58精选在AWS上进行基础模型训练与推理的核心构建模块
03:52Simon Willison 博客80精选在脚本的shebang行中使用LLM
01:23Hacker News 热门(buzzing.cc 中文翻译)47使用 Swift 训练大型语言模型(LLM),第一部分:将矩阵乘法性能从 Gflop/s 提升至 Tflop/s
5月11日周一
20:23Hacker News 热门(buzzing.cc 中文翻译)27作为用户空间IP协议栈的Claude,对ping请求的响应速度有多快?
17:58公众号:小红书技术(dots.llm)45打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路
10:53Hacker News 热门(buzzing.cc 中文翻译)68在配备 24GB 内存的 M4 上运行本地模型
5月9日周六
16:21Hacker News 热门(buzzing.cc 中文翻译)66使用 Claude Code:HTML 的超乎寻常的强大功能
09:30公众号:MiniMax(稀宇科技)48大模型不认识马嘉祺?MiniMax做了一次全链路排查
03:43OpenAI:官网动态(RSS · 排除企业/客户案例)63精选在OpenAI安全运行Codex
5月8日周五
16:23Hugging Face:Blog(RSS)58精选MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型
15:16IT之家(RSS)63新研究点破 AI 生图弱点:透视线和阴影最容易露馅
12:36Hacker News 热门(buzzing.cc 中文翻译)58使用 Claude Mythos 预览版增强 Firefox 安全性
11:16IT之家(RSS)53揪出火狐 Firefox 浏览器 271 个漏洞,Mozilla 回应"AI 抓虫"质疑
10:16IT之家(RSS)67Win11 学院:如何阻止谷歌 Chrome 浏览器 147 静默下载 4GB 端侧 AI 模型
07:30GitHub Blog72精选提升 GitHub Agentic Workflows 的 Token 使用效率
03:30GitHub Blog79精选Agent pull requests 无处不在:如何审查它们
01:06Hacker News 热门(buzzing.cc 中文翻译)69借助 Unsloth 和 NVIDIA 加速大型语言模型的训练
5月7日周四
20:03公众号:豆包(字节)28科研工作者们如何用豆包?他们这样说
19:58公众号:龙猫LongCat(美团)56用Agent评测思路管理AI Coding -- 31万行代码AI重构的实践
05:30GitHub Blog56精选Validating agentic behavior when "correct" isn't deterministic
03:22Hugging Face:Blog(RSS)65精选vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性
00:35Cursor Blog53通过自动安装系统引导Composer开发
5月6日周三
05:31Hacker News 热门(buzzing.cc 中文翻译)63加速 Gemma 4:利用多令牌预测生成器实现更快的推理
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月14日
22:45
Hugging Face:Blog(RSS)
精选59
解锁连续批处理中的异步性

在连续批处理中,同步方式导致CPU与GPU交替工作,造成闲置浪费。测试显示,使用8B模型生成8K令牌时,GPU有24%的时间处于空闲状态。异步批处理通过分离工作负载,让CPU准备下一批次(N+1)的同时,GPU计算当前批次(N),从而消除闲置间隙。这可通过CUDA流实现操作并发,无需更改内核或模型,仅需协调硬件执行顺序。理论上,该方法可将总生成时间从300.6秒减少至228秒,实现24%的免费加速。相关技术已集成到transformers库的连续批处理中,显著提升推理性能。

Hugging Face推理教程/实践部署/工程

推荐理由:文章手把手拆解了异步批处理如何用CUDA流和事件消除CPU与GPU的互相等待,把推理吞吐提升22%,搞推理优化的工程师值得细读。
21:29
Hacker News 热门(buzzing.cc 中文翻译)
精选78
克劳德代码与《代码书》技能:有针对性的技能培养

开发者发布了一款名为“克劳德代码与《代码书》技能”的GitHub工具,旨在通过刻意练习提升编程技能。该工具利用AI模型生成特定主题的代码示例与解释,帮助用户进行针对性学习。项目在Hacker News上获得104点热度,关注度较高。其核心变化在于将传统的广泛学习转化为聚焦、可重复的技能训练模式,通过结构化练习提升学习效率。

教程/实践编码

推荐理由:这个skill把Claude Code变成一对一的代码教练,专门抓你代码里的坏习惯,对想用AI真正提升编码水平的人是个好东西。
12:11
公众号:数字生命卡兹克
42
现在,你可以在手机上用AI生成一个APP了。
产品更新教程/实践
08:55
Simon Willison 博客
45
欢迎来到 Datasette 博客

Datasette 项目正式推出官方博客,用于发布一系列即将到来的公告。博客的创建使用了 OpenAI Codex desktop,该工具具备 Markdown 会话转录导出功能,简化了开发流程。构建过程的完整会话记录已公开在 GitHub Gist 中,相关项目 issue 也提供了更多背景信息。此举标志着 Datasette 项目通过 AI 辅助编程工具扩展其沟通渠道。

OpenAI教程/实践
03:29
Claude:Blog(网页)
精选73
Claude 电脑与浏览器使用的最佳实践

Claude 最新模型在电脑与浏览器使用能力上显著提升,支持构建复杂智能体系统。本文针对Claude 4.6系列和Opus 4.7提供实践指南,重点优化截图分辨率:Claude 4.6系列API限制最大长边1568像素、总像素115万;Opus 4.7提升至最大长边2576像素、总像素375万。发送前将截图缩放到限制内是提升点击准确性的最有效方法。推荐起始分辨率为1280x720,Opus 4.7用户可优先使用1080p,并避免发送未经缩放的原始截图或过低分辨率图像。

智能体Anthropic教程/实践部署/工程

推荐理由:如果你正在让 Claude 操作桌面或浏览器,这篇官方指南把分辨率、token 压缩和缓存策略一次讲透了,附带代码和踩坑表,是那种"读完就能少写一堆 bug"的硬核文档。
02:31
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选62
在 Windows 上构建安全有效的沙箱以启用 Codex

OpenAI 为 Windows 平台上的 Codex 构建了一个安全沙箱环境。该沙箱通过严格控制文件访问权限和实施网络限制,确保了代码生成与执行过程的安全性。这一举措使得基于 Codex 的编码助手能够以高效且受控的方式运行,在提供强大编程辅助功能的同时,有效隔离了潜在风险,保障了用户系统的安全。

OpenAI安全/对齐教程/实践

推荐理由:OpenAI 首度公开 Codex 在 Windows 上的沙箱细节,控制文件访问和网络限制的架构设计讲得很实在,做自主编程代理安全的值得一读。
5月13日
17:39
IT之家(RSS)
66
Anthropic Claude Code 缔造者:数千个 AI 智能体夜间自动为我写代码

Anthropic工程师鲍里斯・切尔尼透露,他利用Claude Code的循环指令和例行任务功能,在夜间自动运行数千个AI智能体进行编程开发。他通常同时开启5至10个会话,每个会话包含多个智能体,并通过手机应用管理这些任务。这种模式标志着工程师将AI从聊天机器人转变为全天候自主助手。切尔尼此前在社交平台分享的智能体配置方案已获得超10.4万次收藏和810万次浏览。

智能体AnthropicMCP/工具教程/实践
13:55
Simon Willison 博客
68
CSP允许列表实验

该工具展示了一项实验:将应用加载于受内容安全策略(CSP)保护的沙盒iframe中,并通过自定义的fetch()函数拦截CSP错误,将其传递至父窗口。父窗口随后可提示用户将受阻域名(如https://api.inaturalist.org)添加至允许列表,刷新页面后即可生效。工具界面包含源代码、预览面板及允许列表管理区,用户可手动添加如https://api.github.com等受信来源。此项目由作者在Codex桌面应用中借助GPT-5.5 xhigh协助构建完成。

教程/实践部署/工程
07:09
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
财务团队如何使用 Codex

财务团队能够利用 Codex,基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码,自动化处理财务数据整合、差异分析和模型验证等复杂任务,从而提升报告生成效率与准确性,并支持快速创建多版本规划场景。

OpenAI教程/实践编码

推荐理由:金融团队终于有了一个正经的 AI 用例,用 Codex 自动生成 MBR、差异桥接和规划场景,比手工拉 Excel 高效太多了,做财务分析的建议点开看看。
06:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
25
AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档,将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题,同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长,并系统化地融入了日常开发工作流。

OpenAI教程/实践编码
06:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
51
财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据(如电子邮件、会议记录和电子表格)自动转换为结构化的财务分析框架,从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间,使团队能更专注于高价值的分析与决策支持工作。

OpenAI教程/实践编码
02:54
Claude:Blog(网页)
精选58
Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统,包含 CLUE Triage 自动初筛警报,整合上下文信息分配处置建议;以及 CLUE Investigate 支持分析师用自然语言查询日志,由 Claude 自动生成并执行查询,将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证,一周内交付实现,显著提升了安全运营效率。

智能体Anthropic安全/对齐教程/实践

推荐理由:我一直好奇大模型公司自己怎么用 AI 做安全,这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天,数据比很多 PR 稿扎实。
01:05
Google Developers Blog(RSS)
精选73
使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体Google教程/实践部署/工程

推荐理由:Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent,状态机和持久会话是两个关键切入点,做过生产环境 agent 的都懂这东西有多刚需。
5月12日
23:53
GitHub Blog
精选58
Dungeons & Desktops: 使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序,能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成,实现了程序化关卡创建,展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub教程/实践编码

推荐理由:用 GitHub Copilot CLI 把代码库变成 roguelike 地牢,玩法挺有脑洞,做 Copilot 扩展的开发者可以看一眼思路。
18:00
公众号:小红书技术(dots.llm)
34
QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾

小红书在 QCon 北京 2026 分享了 GUI Agent 实战经验,核心思路是将自动化测试当作 AI Coding 来做,通过工程化方式让 GUI Agent 在真实业务场景中“跑起来、跑得稳、跑得省钱”。

智能体教程/实践部署/工程
12:25
Hacker News 热门(buzzing.cc 中文翻译)
54
我让人工智能开发了一个工具,帮助我找出是什么在半夜吵醒我

作者利用人工智能开发了一款工具,用于监测和分析夜间可能吵醒他的声音。该工具通过记录和分析环境音频,识别并分类噪音来源,帮助作者找出睡眠中断的具体原因。这一实践展示了AI在解决个人生活问题上的实际应用潜力。

多模态教程/实践编码
10:08
公众号:数字生命卡兹克
53
分享5个Claude Code + 飞书的超实用Agent办公玩法。
智能体教程/实践
07:43
Hugging Face:Blog(RSS)
精选58
在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师,阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件:配备多代NVIDIA GPU(如H100、H200及新一代Blackwell B200/B300)的大显存加速计算实例;用于集体通信的高带宽、低延迟网络(节点内NVLink与节点间EFA);以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同,共同支撑预训练、后训练和推理工作负载,并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由:这篇把AWS上训大模型的全套基础设施串了一遍,从GPU选型到网络存储再到Slurm/K8s编排,是做云端大规模训练的工程师的必读参考。
03:52
Simon Willison 博客
精选80
在脚本的shebang行中使用LLM

本文介绍了一种创新方法,将LLM工具直接嵌入脚本的shebang行中执行指令。通过LLM的fragments模式,shebang行可执行简单任务,如生成SVG图像;使用-T选项能调用外部工具(如llm_time)创作包含当前时间的俳句;更复杂的是运行YAML模板,其中定义了Python函数作为工具进行数学计算,示例中演示了计算2344乘以5252加134的过程,并通过调试输出展示了分步结果,最终得到12,310,822。这展现了LLM作为脚本解释器的强大扩展性,能够支持从内容生成到数据查询的多样化任务。

MCP/工具教程/实践

推荐理由:Simon 这个 shebang 技巧让 LLM 直接变成脚本解释器,虽然是极客玩法,但对常写自动化脚本的开发者来说可以直接抄走,创意很妙。
01:23
Hacker News 热门(buzzing.cc 中文翻译)
47
使用 Swift 训练大型语言模型(LLM),第一部分:将矩阵乘法性能从 Gflop/s 提升至 Tflop/s

文章探讨了在Swift语言中训练大型语言模型时,如何将矩阵乘法的性能从每秒千兆次浮点运算(Gflop/s)提升至每秒万亿次浮点运算(Tflop/s)。这是系列文章的第一部分,聚焦于通过优化技术实现计算性能的数量级飞跃,旨在展示Swift在高效执行核心机器学习运算方面的潜力。

教程/实践数据/训练编码
5月11日
20:23
Hacker News 热门(buzzing.cc 中文翻译)
27
作为用户空间IP协议栈的Claude,对ping请求的响应速度有多快?

一项实验将Claude作为用户空间IP协议栈运行,测试其对ping请求的响应速度。结果显示,其平均往返延迟约为1.2秒,显著慢于传统内核协议栈的毫秒级响应。这一巨大延迟主要源于大语言模型固有的文本生成与处理开销,揭示了当前AI模型在需要低延迟网络交互的实际场景中存在的性能瓶颈。

Anthropic教程/实践
17:58
公众号:小红书技术(dots.llm)
45
打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路

小红书PMO团队探索AI智能体(Agentic)在项目管理中的落地路径,目标是从让AI理解项目管理,进化为为每个项目组打造一个专属BP(业务伙伴)。

智能体教程/实践
10:53
Hacker News 热门(buzzing.cc 中文翻译)
68
在配备 24GB 内存的 M4 上运行本地模型

在配备24GB统一内存的苹果M4芯片设备上成功运行了本地大语言模型。测试显示,该配置可流畅运行700亿参数模型,推理速度达到每秒30个token。这一性能表现主要得益于M4芯片强大的神经引擎和高效的内存带宽,使得在消费级硬件上部署大型模型成为可能,为开发者提供了成本更低的本地AI解决方案。

教程/实践端侧
5月9日
16:21
Hacker News 热门(buzzing.cc 中文翻译)
66
使用 Claude Code:HTML 的超乎寻常的强大功能

Anthropic发布了Claude Code工具,其HTML生成功能展现出超乎预期的强大效果。该工具能直接生成功能完整的HTML代码块,用户仅需复制粘贴即可运行,显著简化了前端开发流程。发布后在Hacker News社区获得102点热度,引发开发者关注。这一变化意味着通过自然语言指令快速构建网页界面正变得更为高效和直接。

智能体Anthropic教程/实践编码
09:30
公众号:MiniMax(稀宇科技)
48
大模型不认识马嘉祺?MiniMax做了一次全链路排查

开发团队发现大模型无法识别“马嘉祺”,随即对知识缺失原因进行了全链路排查。

教程/实践
03:43
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
在OpenAI安全运行Codex

OpenAI通过沙盒隔离、人工审批流程、严格网络策略与原生代理遥测四层防护机制,确保Codex代码生成模型的安全运行。沙盒环境完全隔离执行代码,所有生产请求需经人工审核批准,网络策略限制外部依赖访问,实时遥测系统监控代理行为异常。该安全框架使企业能够合规采用AI编程助手,在保障代码安全性的同时维持开发效率。

智能体OpenAI安全/对齐教程/实践

推荐理由:OpenAI 公开了内部安全运行 Codex 的完整流程,从沙箱隔离到审批策略,企业落地 AI 编码的可以直接拿去抄作业。
5月8日
16:23
Hugging Face:Blog(RSS)
精选58
MedQA:基于AMD ROCm与LoRA微调Qwen3-1.7B的临床问答模型

该项目使用AMD Instinct MI300X(192 GB HBM3显存)和ROCm,通过LoRA微调Qwen3-1.7B模型实现医学问答。训练仅用2000条MedMCQA样本,约5分钟完成,仅更新约220万参数(占模型总参数的0.1443%),全程采用fp16精度,无需量化。HuggingFace生态(Transformers、PEFT、TRL、Accelerate)在ROCm上无缝运行,无需修改代码即可直接替代CUDA。模型已上传至HuggingFace Hub并提供在线Demo。

Hugging Face开源生态教程/实践数据/训练

推荐理由:一个月前的教程了,但如果你是 AMD 党想跑医疗微调,这篇把坑都踩完了,代码直接能复现,LoRA 适配器也挂在 Hub 上,拿来就能用。
15:16
IT之家(RSS)
63
新研究点破 AI 生图弱点:透视线和阴影最容易露馅

《科学》最新研究指出,AI图像生成器虽已修复畸形手指等早期缺陷,但在光照、阴影、反射和透视几何上仍存在明显破绽。研究者指出,鉴别重点已转向“物理规则是否合理”。AI生成的图片因色彩鲜艳、戏剧感强,更接近大众对现实的想象,故易于传播。论文推荐通过检查“消失点”来鉴别:现实中平行线应汇聚于同一点,若图像中线条无法合理相交,则空间关系不成立。此方法同样适用于分析反射与阴影的平行光透视规律。

图像生成安全/对齐教程/实践
12:36
Hacker News 热门(buzzing.cc 中文翻译)
58
使用 Claude Mythos 预览版增强 Firefox 安全性

Mozilla在Firefox浏览器中整合了Claude Mythos预览版,以增强其安全性。这一集成主要带来了内存安全方面的关键改进,通过先进的内存分配器与漏洞缓解技术,旨在显著降低浏览器遭受内存相关攻击的风险。该更新是Firefox持续强化安全架构的一部分,目前已在预览版本中提供测试。

Anthropic安全/对齐教程/实践
11:16
IT之家(RSS)
53
揪出火狐 Firefox 浏览器 271 个漏洞,Mozilla 回应"AI 抓虫"质疑

Mozilla 工程师披露,其使用 Anthropic 的 Claude Mythos AI 模型在 Firefox 150 版本中共发现 271 个安全漏洞,其中 180 个为高危级别。为回应外界对 AI 有效性的质疑,团队公开了 12 份完整漏洞报告。他们通过自研的 Agent Harness 智能体套件引导 AI 分析代码并自主构造测试用例,同时引入第二个大模型进行结果打分以严格过滤误报,最终实现了极低的误报率,显著提升了漏洞排查效率。

智能体Anthropic安全/对齐教程/实践
10:16
IT之家(RSS)
67
Win11 学院:如何阻止谷歌 Chrome 浏览器 147 静默下载 4GB 端侧 AI 模型

谷歌 Chrome 浏览器 147 版本为支持端侧 AI 模型 Gemini Nano,会在用户不知情或未同意的情况下,静默下载并安装一个约 4GB 的 weights.bin 文件,且删除后会自动重新下载。科技媒体 NeoWin 指出,用户可通过修改 Windows 11 注册表来阻止这一行为。具体操作为:在注册表编辑器中定位至 HKLM\SOFTWARE\Policies\Google\Chrome\,将“GenAILocalFoundationalModelSettings”值设为 1。类似方法也适用于阻止 Microsoft Edge 浏览器下载端侧 AI 模型,只需在其对应路径下进行相同设置。

Google教程/实践端侧
07:30
GitHub Blog
精选72
提升 GitHub Agentic Workflows 的 Token 使用效率

GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流,定位了效率低下的环节,并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用,直接提升了工作流的经济性与运行效率。

智能体GitHubMCP/工具教程/实践

推荐理由:GitHub 把自己生产环境的 agentic workflow 扒了一遍,从 token 消耗里找浪费,再让 agent 自动修。不是 paper,是真踩过的坑,做 Copilot 集成的团队可以抄作业。
03:30
GitHub Blog
精选79
Agent pull requests 无处不在:如何审查它们

这份指南提供了审查由AI代理生成的pull requests的实用方法,重点包括审查时应关注的代码变更点、问题常见隐藏位置(如逻辑错误或安全漏洞),以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交,确保代码质量,避免缺陷流入生产环境。指南强调主动审查策略,以应对AI代理在软件开发中日益普及的趋势。

智能体GitHub教程/实践编码

推荐理由:AI代理生成的PR越来越多,审查它们不再是可选项。这篇官方指南从发现隐患到控制技术债务,给出了马上能用的检查清单,每个用Copilot的开发者都该看。
01:06
Hacker News 热门(buzzing.cc 中文翻译)
69
借助 Unsloth 和 NVIDIA 加速大型语言模型的训练

Unsloth与NVIDIA合作推出优化方案,显著加速大型语言模型训练。该方案通过集成NVIDIA TensorRT-LLM等工具,使模型训练速度提升最高达5倍,内存占用减少达80%,同时保持模型性能无损。此举旨在降低大模型训练的计算成本与时间门槛,助力开发者更高效地进行模型迭代与应用部署。

教程/实践数据/训练
5月7日
20:03
公众号:豆包(字节)
28
科研工作者们如何用豆包?他们这样说
多模态教程/实践
19:58
公众号:龙猫LongCat(美团)
56
用Agent评测思路管理AI Coding -- 31万行代码AI重构的实践

美团技术团队在LongCat项目中实践AI编码管理,指出当90%以上代码由AI生成时,决定系统走向的不是谁写得更快,而是约束AI的能力。

智能体教程/实践编码
05:30
GitHub Blog
精选56
Validating agentic behavior when "correct" isn't deterministic

GitHub 探讨如何为 Copilot 编码智能体构建“信任层”。文章提出,在“正确”答案非确定性的场景下,可通过领域分析来验证智能体的自主行为,避免使用脆弱的脚本或黑盒判断。该方法旨在提升 AI 编码助手的可靠性与透明度,确保其行为符合预期标准。

智能体GitHub教程/实践编码

推荐理由:做coding agent最头疼的就是如何验证产出质量,GitHub这篇把他们的内部方法论开源了,用dominance分析替代脆弱的脚本,对正在折腾AI编程工具的团队是实打实的参考,值得逐帧学习。
03:22
Hugging Face:Blog(RSS)
精选65
vLLM V0 到 V1:在线强化学习中优先确保后端行为正确性

为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后,在线强化学习训练结果与 V0 参考运行一致,团队优先修复后端行为而非调整 RL 目标。关键修复包括:将日志概率模式设为 processed_logprobs 以匹配采样器分布;禁用 V1 特有的前缀缓存和异步调度等运行时默认值;调整权重更新路径以匹配 V0 的缓存保留行为;并确保 rollout 后端使用 fp32 精度的 lm_head 进行最终投影。这些措施消除了策略比率均值偏差,使 V1 在 KL 散度、熵等指标上与 V0 达成一致。

Hugging Face推理教程/实践部署/工程

推荐理由:vLLM V1迁移时踩的四个坑全在这里,从logprob语义到fp32投影头,修完才调RL目标,做在线RL的团队可以直接抄这份配置清单。
00:35
Cursor Blog
53
通过自动安装系统引导Composer开发

团队开发了Composer自动安装系统,利用早期模型(如Composer 1.5)为强化学习训练自动配置可运行环境。该系统分两阶段工作:先由智能体设定成功环境的目标命令与描述,再由另一智能体执行具体配置,包括安装依赖、模拟缺失组件并进行测试。在一项针对区块链项目Celo的真实实验中,该系统成功处理了稀疏文档和复杂依赖。采用此方法后,Composer 2在环境设置基准测试中的得分从47.9%提升至61.7%,为后续训练提供了更优基础。

智能体教程/实践编码部署/工程
5月6日
05:31
Hacker News 热门(buzzing.cc 中文翻译)
63
加速 Gemma 4:利用多令牌预测生成器实现更快的推理

Google为Gemma 4模型引入了多令牌预测生成器技术,显著提升了推理速度。该技术允许模型在单次前向传递中预测多个未来令牌,而非传统的逐个令牌生成。在代码生成等任务中,这一方法实现了高达3倍的推理加速,同时保持了输出质量。这项优化旨在降低大语言模型的部署成本,提高响应效率,适用于需要快速生成较长文本的场景。

Google推理教程/实践
‹ 上一页
1…678910…13
下一页 ›