AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
5月31日周日
05:43Simon Willison 博客73精选在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用
5月30日周六
19:21IT之家(RSS)61小米 MiMo-V2.5 系列 API 永久降价并公开推理优化方案
18:39公众号:小米 MiMo59MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致
16:21IT之家(RSS)67AI 开始给人类打分:Claude 评分标准曝光,优秀人类得 7.5 分
11:41Hacker News 热门(buzzing.cc 中文翻译)61Show HN: Tiny-vLLM--基于 C 和 CUDA 的高性能大型语言模型推理引擎
08:48MarkTechPost(RSS)67如何使用AgentTrove:在Python中流式处理1.7M智能体轨迹并构建干净的ShareGPT SFT数据集
03:16TechCrunch:AI(RSS)41你听过这些AI术语但一知半解?让我们来弄清楚
03:08Google Blog:AI(RSS)55精选参与我们的 I/O 2026 测验:该测验由 Google AI Studio 氛围编程生成
5月29日周五
23:10Hacker News 热门(buzzing.cc 中文翻译)60在标准GPU上进行实时大语言模型推理:单次请求生成速度达3k tokens/s
19:30Hugging Face:Blog(RSS)71精选PyTorch 性能分析系列(一):torch.profiler 入门指南
19:10Hacker News 热门(buzzing.cc 中文翻译)73精选Claude Code--文档中未提及的所有可配置选项
17:44公众号:通义实验室(千问)64精选通义实验室发布教程:在 Android 手机部署 MCP 感知服务器
03:38Hacker News 热门(buzzing.cc 中文翻译)67我们更换了 Zendesk
00:00LMSYS:Blog(Chatbot Arena 团队)61精选LMSYS与Intel合作通过异构CPU+GPU EPD架构提升视觉语言模型服务性能
5月28日周四
23:41Google Developers Blog(RSS)64精选社区如何利用Tunix和TPU训练Gemma学会"思考"
21:11Cloudflare Blog41我们如何构建Cloudflare的数据平台及其上的AI智能体
16:10MarkTechPost(RSS)70精选pgvector驱动的语义、混合、稀疏与量化向量搜索系统构建编码指南
06:07Claude:Blog(网页)77同事件精选使用大语言模型保障源代码安全同一事件,精选展示《合作伙伴如何运用Opus强化网络安全》
02:06Claude:Blog(网页)67精选AI智能体的零信任安全框架
01:05Claude:Blog(网页)54CodeRabbit如何用Claude构建智能体编排系统
00:20Hugging Face:Blog(RSS)72精选Reachy Mini 实现完全本地化语音交互
5月27日周三
22:20Hugging Face:Blog(RSS)61精选TRL 新增 Delta Weight Sync:通过 Hub Bucket 传输权重变化,每步从 1.2 GB 降至 20-35 MB
22:10OpenAI:官网动态(RSS · 排除企业/客户案例)56精选使用 Codex 构建自改进税务智能体
21:07Artificial Intelligence News(RSS)26探讨 AI 智能体在外汇交易市场中的优势
20:32Hacker News 热门(buzzing.cc 中文翻译)63将 Claude Code 作为日常工具:Claude.md、技能、子代理、插件和 MCP
19:50公众号:面壁智能(MiniCPM)59面壁智能发布 MiniCPM5-1B 端侧基座模型,FlagOS 完成云到端跨芯片 Day-0 适配
17:51公众号:腾讯元宝33腾讯元宝推出高考备考助手:时间规划、试卷分析与思维导图功能
09:58公众号:数字生命卡兹克65精选从0到1速通OpenAI Codex:安装、设置与实操教程
07:37MarkTechPost(RSS)67使用 ZeroEntropy Zerank-2 Reranker 设计高精度检索-重排流水线
5月26日周二
20:12公众号:百度智能云(文心)50百度伐谋2.0赋能排产排程,产能提升20%
15:36MarkTechPost(RSS)62设计完整的多模态 RLVR 流程,涵盖 Open-MM-RL、视觉-语言提示、奖励评分与 GRPO 导出
04:36MarkTechPost(RSS)66使用 NVIDIA FLARE 在非独立同分布 CIFAR-10 上构建与比较 FedAvg 和 FedProx 联邦学习的分步指南
00:18Hugging Face:Blog(RSS)58精选Harness、Scaffold 与 AI 智能体术语辨析
5月25日周一
19:28Hacker News 热门(buzzing.cc 中文翻译)52用树莓派搭建树莓派
18:36MarkTechPost(RSS)652026年AI智能体与MCP服务器的最佳认证平台
07:06MarkTechPost(RSS)65构建完整的 Langfuse 可观测性与评估流水线以实现追踪、提示词管理、评分与实验
5月24日周日
18:27The Decoder:AI News(RSS)66为何不应在Copilot等AI工具中依赖默认模型选择
12:57Hacker News 热门(buzzing.cc 中文翻译)25醒醒!16b
03:05MarkTechPost(RSS)67构建基于SuperClaude框架的工作流:融合命令、代理、模式与会话记忆
01:57Hacker News 热门(buzzing.cc 中文翻译)63从第一性原理出发,让深度学习"嗡嗡"作响
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月31日
05:43
Simon Willison 博客
精选73
在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用

作者展示了如何在浏览器中通过 Pyodide 和 Service Worker 运行 Python ASGI 应用。此前的 Datasette Lite 使用 Web Workers,但无法执行 <script> 标签中的 JavaScript。新方案由 Claude Opus 4.8 协助完成开发,解决了这一问题。作者已展示了基础的 ASGI FastCGI 演示和运行 Datasette 1.0a31 的演示,并计划后续将此方法应用于升级 Datasette Lite。

GitHub教程/实践端侧部署/工程

推荐理由:Simon Willison 用 Service Worker 让 Python ASGI 在浏览器里真正跑了起来,这个技巧补上了 Datasette Lite 长期缺的 JS 执行能力,搞 Pyodide 的值得看看。
5月30日
19:21
IT之家(RSS)
61
小米 MiMo-V2.5 系列 API 永久降价并公开推理优化方案

小米 MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%。其技术基础是公开的推理系统全链路优化方案:针对 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了 KVCache 管理、分级缓存、前缀缓存与调度策略。核心优化包括将 KVCache 存储压缩至约 1/7,线上前缀缓存命中率平均达 93%,TTFT P90 降低 30%,Prefill 性能提升约 40%,Decode 阶段前 128 token 加速比达 2.3×。多模态视频处理端到端延时从 156 秒降至 23 秒。该方案宣称是业内首篇全面覆盖此类复合架构的大规模工程落地方案,模型能力无缩减。

推理教程/实践部署/工程
18:39
公众号:小米 MiMo
59
MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致

小米发布 MiMo-V2.5 系列模型(含 MiMo-V2.5、MiMo-V2.5-Pro),采用 Hybrid Sliding Window Attention(Hybrid SWA)架构,KVCache 存储与计算量均降至 Full Attention 的约 1/7。以 MiMo-V2.5-Pro 为例,70 层中仅 10 层为 Full Attention,60 层为 SWA(窗口大小 128)。团队围绕 KVCache 系统重构(双池管理、按层异步拉取、SWA-aware 前缀缓存树)及分布式缓存 GCache 等环节优化,使存储效率提升约 7×,显著降低长上下文推理成本。

推理教程/实践部署/工程
16:21
IT之家(RSS)
67
AI 开始给人类打分:Claude 评分标准曝光,优秀人类得 7.5 分

Anthropic 正在测试 Claude 的一项新功能,它能基于 11 项行为指标分析用户与 AI 的历史对话,为用户生成“AI 流利度”评分(满分 11 分)。该功能源于其《AI 流利度指数报告》,该研究分析了 9830 段匿名对话,提出了包含“描述”、“委托”和“辨别”维度的 4D 框架。有用户分享自己获得了 7.5 分,报告还会指出弱点并提供优化建议。该功能目前处于灰度测试阶段。

Anthropic产品更新教程/实践现象/趋势
11:41
Hacker News 热门(buzzing.cc 中文翻译)
61
Show HN: Tiny-vLLM--基于 C 和 CUDA 的高性能大型语言模型推理引擎

Tiny-vLLM 是一个用 C 和 CUDA 编写的高性能大语言模型推理引擎,项目代码已开源至 GitHub。

开源/仓库教程/实践部署/工程
08:48
MarkTechPost(RSS)
67
如何使用AgentTrove:在Python中流式处理1.7M智能体轨迹并构建干净的ShareGPT SFT数据集

AgentTrove是目前最大的开源智能体交互轨迹集合,包含1.7M行数据,采用ShareGPT风格布局。该Python教程展示了如何在不下载完整数据的情况下流式处理该数据集,具体步骤包括规范化智能体轮次、提取命令、分析轨迹,并将成功的轨迹导出为干净的SFT微调数据集。

智能体教程/实践数据/训练
03:16
TechCrunch:AI(RSS)
41
你听过这些AI术语但一知半解?让我们来弄清楚

AI的兴起带来了大量新术语与行话。文章提供了一份术语表,对其中最重要的一些词汇和短语进行了解释。

推理教程/实践
03:08
Google Blog:AI(RSS)
精选55
参与我们的 I/O 2026 测验:该测验由 Google AI Studio 氛围编程生成

Google 使用其开发工具 Google AI Studio,通过氛围编程(vibe coding)方式,创建了一个关于 Google I/O 2026 主要公告的在线测验。

Google教程/实践

推荐理由:Google 用 AI Studio 自己 vibe code 了个 I/O 测验,是想展示普通人也玩得转,但 quiz 本身信息量不大,想体验 vibe coding 的可以顺手玩玩。
5月29日
23:10
Hacker News 热门(buzzing.cc 中文翻译)
60
在标准GPU上进行实时大语言模型推理:单次请求生成速度达3k tokens/s

该技术成果展示了在标准GPU硬件上实现大语言模型实时推理的可能性。核心性能指标为单次请求的生成速度可达到3000个tokens每秒(3k tokens/s per request)。这一结果表明,对于特定场景或模型配置,即使在非专用集群的常规计算设备上,也能实现高速的模型输出,对于降低大语言模型的使用门槛和成本具有参考意义。

推理教程/实践部署/工程
19:30
Hugging Face:Blog(RSS)
精选71
PyTorch 性能分析系列(一):torch.profiler 入门指南

本文是 PyTorch profiling 系列的开篇,从最简单的矩阵乘法加偏置操作出发,逐步讲解如何使用 torch.profiler 进行性能分析。涵盖 profiler 设置、导出统计表格与 Chrome trace、解读 CPU 和 GPU 活动的时序关系,以及 torch.compile 对底层 CUDA kernel 调用链的影响。实验基于 NVIDIA A100-SXM4-80GB GPU 运行,面向基本掌握 PyTorch 但缺乏 profiling 经验的读者。

Hugging Face教程/实践部署/工程

推荐理由:PyTorch profiling 的陡峭学习曲线劝退了很多人,这篇用从零开始的方式把 trace 拆解得明明白白,想做性能优化的同学该收藏。
19:10
Hacker News 热门(buzzing.cc 中文翻译)
精选73
Claude Code--文档中未提及的所有可配置选项

该篇文章标题涉及“Claude Code”的可配置选项,但提供的正文内容仅包含一张图片和一个外部链接,未给出任何关于模型版本、参数、性能、价格或功能的具体信息。根据规则,无法在摘要中提及原文不存在的细节。

Anthropic教程/实践编码

推荐理由:如果你在用 Claude Code,这份从源码里扒出的隐藏配置清单能让你摆脱默认模式,好多选项官方文档压根没提。
17:44
公众号:通义实验室(千问)
精选64
通义实验室发布教程:在 Android 手机部署 MCP 感知服务器

通义实验室发布教程,演示如何在 Android 手机上部署 MCP 感知服务器,使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型(约 1.3GB),摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON,再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据,仅传输语义提取结果。项目已开源,实测可识别红绿灯状态等场景。

MCP/工具多模态教程/实践端侧

推荐理由:如果你做Agent总觉得AI对物理世界是瞎子,这篇教程就是解药。把Qwen3-VL塞进手机当本地眼睛,不传原始视频只给结构化文字,隐私友好又能被Claude直接调用。
03:38
Hacker News 热门(buzzing.cc 中文翻译)
67
我们更换了 Zendesk

tradecore 在48小时内完成了其客户服务工具 Zendesk 的替换。原文仅提及此项迁移在极短时间内完成,未涉及更具体的替换原因、新平台选择或迁移过程的细节。

教程/实践编码部署/工程
00:00
LMSYS:Blog(Chatbot Arena 团队)
精选61
LMSYS与Intel合作通过异构CPU+GPU EPD架构提升视觉语言模型服务性能

LMSYS团队(Intel与SGLang)通过Dynamo和SGLang框架,为视觉语言模型(VLM)启用了异构编码-预填充-解耦(EPD)架构。该方案将视觉编码任务从GPU卸载至CPU(如Intel Xeon 6747P),与GPU协同工作。在Qwen3-VL-8B-Instruct模型的测试中,采用4 CPU + 1 GPU作为编码器、4 GPU作为预填充解码器(能力比R=12)的配置,在ISL/OSL 128/256、1080p 8张图像的负载下,实现了P99 TTFT和请求吞吐量约1.2倍至1.3倍的提升,并将P99 TPOT降低了约1.3倍至30倍。

多模态推理教程/实践部署/工程

推荐理由:做VLM服务部署的可以认真看一下,用CPU头节点做异构EPD分离,几乎零成本换来了TTFT和TPOT的显著提升,有完整脚本和benchmark,能直接上手试。
5月28日
23:41
Google Developers Blog(RSS)
精选64
社区如何利用Tunix和TPU训练Gemma学会"思考"

Google在Kaggle举办的Tunix黑客马拉松,挑战开发者利用TPU和有限算力,将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标,该流程结合了监督微调(SFT)与GRPO、SimPO等先进对齐技术。比赛结果表明,社区能够借助开源资源成功训练出高能力的结构化推理模型。

Google开源生态教程/实践数据/训练

推荐理由:Google 官方比赛总结,证明用 Kaggle TPU 和开源工具就能把 Gemma 训练出不错推理能力,对想自己微调模型的小团队是个实用参考。
21:11
Cloudflare Blog
41
我们如何构建Cloudflare的数据平台及其上的AI智能体

Cloudflare构建了名为Town Lake的统一分析平台,并基于此开发了内部AI智能体Skipper。

智能体教程/实践数据/训练部署/工程
16:10
MarkTechPost(RSS)
精选70
pgvector驱动的语义、混合、稀疏与量化向量搜索系统构建编码指南

本教程在Google Colab中构建一个完整的pgvector实验环境,展示PostgreSQL如何作为向量数据库服务于现代AI应用。内容涵盖安装PostgreSQL、编译pgvector扩展、通过Psycopg建立连接,并注册向量类型以实现与Python的平滑集成。最后使用SentenceTransformers创建并存储嵌入向量。

检索增强开源生态教程/实践部署/工程

推荐理由:这份教程把 pgvector 的稀疏向量、量化搜索等高级功能打包成 Colab 代码,用 PostgreSQL 做向量数据库的团队可以直接复制粘贴跑起来。
06:07
Claude:Blog(网页)
同事件精选77
使用大语言模型保障源代码安全

本文分享了使用 Claude Opus 构建威胁模型、发现代码漏洞并进行验证、分类和修复的最佳实践。其核心流程是一个六步循环:威胁建模、沙箱隔离、漏洞发现、验证、分类和修复。作者指出,漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。以他们对开源软件的扫描为例,截至2026年5月22日已披露1,596个漏洞,其中97个已修补。指南建议结合代码库文档和专家访谈来构建准确的威胁模型,以降低误报,提升发现的可利用性。

智能体Anthropic安全/对齐教程/实践
同一事件,精选展示《合作伙伴如何运用Opus强化网络安全》
推荐理由:Anthropic把这套用Claude扫代码漏洞的方法全公开了,1596个已披露漏洞,验证成了最大瓶颈,安全工程师的饭碗可能要重新定义。
02:06
Claude:Blog(网页)
精选67
AI智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。

智能体Anthropic安全/对齐教程/实践

推荐理由:当漏洞利用从数月压缩到数小时,安全架构必须同步进化。这篇框架把零信任落地到Agent场景,八阶段路线图和三级成熟度模型比泛泛的安全声明具体得多,企业安全团队值得细读。
01:05
Claude:Blog(网页)
54
CodeRabbit如何用Claude构建智能体编排系统

AI代码审查平台CodeRabbit发现,AI生成的代码常能通过编译与测试,却不符合开发者真实意图,根源在于开发者隐含假设AI理解上下文。为此,团队基于Claude构建了一个智能体编排系统,置于编码请求与智能体之间。该系统在代码生成前协调多个Claude模型进行结构化规划,输出可审查的产品需求文档,使需求显式化。系统每周助力审查超过200万个PR。

智能体Anthropic教程/实践编码
00:20
Hugging Face:Blog(RSS)
精选72
Reachy Mini 实现完全本地化语音交互

Reachy Mini 机器人现可通过 speech-to-speech 库实现完全本地化的语音交互,无需依赖云端。该方案采用级联流水线架构,对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问(Qwen3-TTS)作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理,保障了隐私且无 API 费用。

智能体Hugging Face教程/实践语音

推荐理由:小众硬件的本地语音实战,但HF这套开源管线证明端到端对话已完全可用,所有组件都可自由替换,想做本地化语音助手的人可以照抄。
5月27日
22:20
Hugging Face:Blog(RSS)
精选61
TRL 新增 Delta Weight Sync:通过 Hub Bucket 传输权重变化,每步从 1.2 GB 降至 20-35 MB

异步强化学习中,训练器每步需将完整模型权重(如1T参数checkpoint约1 TB)传输给推理引擎。TRL新增PR利用相邻RL优化步骤间约99%的bf16权重比特相同的特点,仅将变化的权重编码为稀疏safetensors文件,上传至Hugging Face Bucket并通知vLLM获取。在Qwen3-0.6B上,每步传输从1.2 GB降至20–35 MB。实验还展示了完全分离的训练场景:训练器、vLLM和Wordle环境分别位于不同机器和Hugging Face Space中,权重通过单个Hub bucket流动,无需共享集群、RDMA或VPN。

Hugging Face教程/实践数据/训练部署/工程

推荐理由:异步RL训练中权重同步的瓶颈被HuggingFace用稀疏增量方案解决了,带宽直接省了两个数量级,还给了可运行的TRL分支,做RL训练的可以直接上手试。
22:10
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选56
使用 Codex 构建自改进税务智能体

OpenAI、Thrive 与 Crete 合作,使用 Codex 构建了一个自改进的税务智能体。该智能体能够自动处理报税流程,提升工作准确性并加速整体工作流。

智能体OpenAI教程/实践
关联讨论 1 条X:OpenAI Developers (@OpenAIDevs)
推荐理由:OpenAI 联合 Thrive 把 Codex 塞进税务流程,做出了能自我纠错的申报 agent,金融自动化的同学可以看看他们的错误反馈循环怎么设计的。
21:07
Artificial Intelligence News(RSS)
26
探讨 AI 智能体在外汇交易市场中的优势

外汇市场正从纯粹依赖直觉,转向一个由速度、数据和精确性塑造的领域。在日常交易中使用自动化系统(如 AI 交易机器人),可以在市场波动中保持交易纪律,这是手动交易难以做到的。交易的每一次入场和出场都可以基于明确的规则,而非个人情绪。

教程/实践数据/训练
20:32
Hacker News 热门(buzzing.cc 中文翻译)
63
将 Claude Code 作为日常工具:Claude.md、技能、子代理、插件和 MCP

文章探讨了将 Claude Code 作为日常开发工具的实践,重点介绍了其核心配置文件 Claude.md、技能系统、子代理功能、插件扩展以及通过 MCP(模型上下文协议)进行集成的方法,旨在提升开发者的工作流效率。

智能体AnthropicMCP/工具教程/实践
19:50
公众号:面壁智能(MiniCPM)
59
面壁智能发布 MiniCPM5-1B 端侧基座模型,FlagOS 完成云到端跨芯片 Day-0 适配

5月25日,面壁智能发布并开源端侧基座模型MiniCPM5-1B。该模型以1B参数在AA-Index获17.9分,超越所有4B以下开源基座模型。INT4量化后权重仅0.5GB,可在90%以上终端运行。FlagOS社区通过vLLM-plugin-FL推理插件完成跨芯片适配,覆盖英伟达、华为昇腾等8类AI芯片及ARM端侧,支持int8、bf16、fp32精度。多款芯片首token延迟低于NVIDIA H20原生基线;平头哥真武810E在长序列场景下单位算力token吞吐量达H20的93.3%和95.3%。

开源生态教程/实践端侧
17:51
公众号:腾讯元宝
33
腾讯元宝推出高考备考助手:时间规划、试卷分析与思维导图功能

腾讯元宝上线高考备考辅助功能,提供考前24小时备考管家,可帮助考生规划每日学习任务、一键导出时间表格并打印,还能设置任务提醒,如“该背单词啦”“全真模考时间到”。试卷分析功能支持上传考卷,快速梳理全卷题型与分值分布,帮助考生主攻提分核心考点。此外,元宝能将历史、政治等科目知识点转化为思维导图,并生成押韵记忆口诀,辅助考前快速复习。

教程/实践
09:58
公众号:数字生命卡兹克
精选65
从0到1速通OpenAI Codex:安装、设置与实操教程

近日OpenAI的AI智能体Codex热度飙升。教程涵盖完整使用流程:从官网下载安装,支持从Claude Code和Cowork一键导入配置;界面分对话区和项目区,权限可选默认、自动审查或完全访问;模型推荐GPT-5.5,推理等级用高或超高,速度可选快速(1.5倍速度、2倍token消耗)或标准;建议开启引导模式、记忆功能,并设置全局AGENTS.md规则(卡帕西模板);通过Skills和插件管理扩展能力;演示了开发网页(使用计划模式、批注功能圈选修改)和开发用药提醒App(需安装Xcode编译到手机)。

智能体OpenAI教程/实践编码

推荐理由:如果你还在观望要不要入坑Codex,这篇保姆级教程把安装、设置、开发网页到打包APP全流程踩了一遍,那个@Computer Use帮你装Xcode的操作一看就懂,想动手的现在就能跟做。
07:37
MarkTechPost(RSS)
67
使用 ZeroEntropy Zerank-2 Reranker 设计高精度检索-重排流水线

介绍如何使用基于 Qwen3、参数规模为 4B 的交叉编码器重排器 Zerank-2 Reranker 构建检索-重排流水线。该流水线先通过快速双编码器检索候选文档,再由 Zerank-2 进行重排以提升检索精度。

检索增强教程/实践部署/工程
5月26日
20:12
公众号:百度智能云(文心)
50
百度伐谋2.0赋能排产排程,产能提升20%

百度伐谋2.0产业决策智能体落地排产场景,业务人员用自然语言描述优先级和现场变化(如设备故障、工人请假),系统自动将约束转化为优化模型并迭代求解,将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案,隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中,产能提升20%。

智能体教程/实践部署/工程
15:36
MarkTechPost(RSS)
62
设计完整的多模态 RLVR 流程,涵盖 Open-MM-RL、视觉-语言提示、奖励评分与 GRPO 导出

该教程以 TuringEnterprises/Open-MM-RL 数据集为实践基础,构建多模态推理与可验证奖励强化学习(RLVR)流程。内容涵盖数据集加载、结构分析(包括领域、格式、问题长度、答案类型和图像分布),并可视化各领域示例。同时实现了一个轻量级奖励函数,用于检查精确匹配等条件,并演示了如何将流程导出为 GRPO 格式。

MCP/工具多模态教程/实践
04:36
MarkTechPost(RSS)
66
使用 NVIDIA FLARE 在非独立同分布 CIFAR-10 上构建与比较 FedAvg 和 FedProx 联邦学习的分步指南

本教程展示如何使用 NVIDIA FLARE 框架构建一个联邦学习实验,以比较 FedAvg 和 FedProx 两种算法。实验在非独立同分布(non-IID)的 CIFAR-10 数据集上进行,通过狄利克雷分布划分客户端数据,以模拟现实联邦场景中的标签不平衡问题。内容涵盖如何利用 NVFlare Job API 来定义和启动联邦学习任务。

开源生态教程/实践数据/训练
00:18
Hugging Face:Blog(RSS)
精选58
Harness、Scaffold 与 AI 智能体术语辨析

本文旨在厘清 AI 智能体领域中易混淆的关键术语。文章指出,模型(如 Claude、GPT)本身是无记忆、无循环的大语言模型。其行为由“Scaffolding”(行为定义层,如系统提示、工具描述)塑造,而“Harness”(执行层)负责调用模型、处理工具调用与控制循环,是智能体运行的核心。两者结合,模型才能成为智能体。文章以 Claude Code、Codex 为例,说明同一模型搭配不同 Harness 会产生迥异体验,并提出了 Agent = Model + Harness 的常见理解框架。术语尚未统一,本文旨在提供一个实用的心智模型。

智能体MCP/工具教程/实践

推荐理由:Agent圈术语混乱的文章很多,但HF这篇把harness、scaffold、context engineering的关系讲得最透,做agent开发的读完至少能少吵一半的架。
5月25日
19:28
Hacker News 热门(buzzing.cc 中文翻译)
52
用树莓派搭建树莓派

有作者分享了一个技术实践,其核心是利用一台树莓派来构建(或安装、设置)另一个树莓派的操作系统。这本质上是一个计算机领域的“自举”(bootstrapping)过程,即系统用自身来构建或启动自身。该文章(原英文标题为“Building Pi with Pi”)的分享在 Hacker News 社区获得了关注。此摘要严格依据原文信息生成。

教程/实践部署/工程
18:36
MarkTechPost(RSS)
65
2026年AI智能体与MCP服务器的最佳认证平台

随着MCP月SDK下载量超过9700万且AI智能体进入生产工作流,认证已成为团队面临的关键基础设施决策。文章评估了八家领先平台——WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry和Cloudflare在规范合规性、企业身份深度、集成广度以及2026年部署的现实适用性方面的表现。

智能体MCP/工具教程/实践部署/工程
07:06
MarkTechPost(RSS)
65
构建完整的 Langfuse 可观测性与评估流水线以实现追踪、提示词管理、评分与实验

本教程详细演示了如何使用 Langfuse(一个开源大语言模型工程平台)构建一套完整的可观测性与评估流水线。内容覆盖了追踪、提示词管理、评分、数据集与实验等核心功能。教程设计了一个可独立运行的完整工作流,用户既可接入真实的 OpenAI API 密钥,也可使用确定的模拟大语言模型,以便在无需付费模型访问的前提下,理解 Langfuse 的所有主要特性。

开源生态教程/实践部署/工程
5月24日
18:27
The Decoder:AI News(RSS)
66
为何不应在Copilot等AI工具中依赖默认模型选择

数学家Adam Kucharski的实验表明,当向Microsoft Copilot输入两组仅国家标签不同但数据完全相同的分析请求时,Copilot并未能识别其本质一致,反而虚构并输出了基于国家的刻板印象分析。这暴露了当前许多AI工具在默认配置下存在的系统性偏差风险。尽管具备推理能力的“思维模型”能识别此类数据陷阱,但用户需要主动知晓并选择启用它们。这一现象警示我们,在进行关键数据分析时,不能盲目依赖AI工具的默认模型,而应审慎选择并评估其分析结果。

GoogleMicrosoft推理教程/实践
12:57
Hacker News 热门(buzzing.cc 中文翻译)
25
醒醒!16b

一个名为“Wake up! 16b”的项目或工具近期发布,其详细技术说明已对外公开。该项目名称中的“16b”可能指向其核心特性或版本。信息发布于2026年5月24日,并在Hacker News等技术社区获得关注,取得了107个积分,显示出一定的行业讨论热度。

教程/实践
03:05
MarkTechPost(RSS)
67
构建基于SuperClaude框架的工作流:融合命令、代理、模式与会话记忆

一篇技术教程详细介绍了如何构建一个高级工作流系统。该系统以SuperClaude框架为核心,作为一层结构化中间件部署在Anthropic API之上。教程核心内容围绕如何整合命令解析、智能代理调度、多种操作模式切换以及跨会话的上下文记忆能力,从而打造出一个功能更全面、上下文连贯性更强的AI应用工作流。文章旨在指导开发者利用这些组件,提升基于大型语言模型构建的应用的复杂任务处理与交互体验。

智能体AnthropicMCP/工具教程/实践
01:57
Hacker News 热门(buzzing.cc 中文翻译)
63
从第一性原理出发,让深度学习"嗡嗡"作响

文章介绍了一项名为“让深度学习嗡嗡作响”的技术探索,该项目从计算机体系结构的第一性原理出发,深入分析并优化深度学习计算流程。作者通过底层硬件视角审视现代深度学习框架,指出了当前系统中存在的计算瓶颈与效率损失,并提出了针对性的软硬件协同优化思路。该研究旨在通过理解计算本质来释放硬件潜力,最终实现深度学习任务执行效率的显著提升。

教程/实践部署/工程
‹ 上一页
1…45678…13
下一页 ›