全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 520 条

全部一手资讯 X 论文

标签「教程/实践」清除

6月12日周五

15:26MarkTechPost（RSS）58基于MONAI与UNet的医学CT三维脾脏分割端到端实现教程

05:05OpenRouter：Announcements（RSS）54什么是 LLM 网关？应用与 AI 模型之间缺失的一层

03:35OpenRouter：Announcements（RSS）48什么是 LLM Gateway？你的应用与 AI 模型之间的缺失层

6月11日周四

18:59Hugging Face：Blog（RSS）46PyTorch 剖析系列（二）：从 nn.Linear 到融合 MLP

18:50公众号：卡尔的AI沃茨77开源「鲁班」Skill：用 Claude Fable 5 打磨 AI Skill 的工作流

18:30公众号：火山引擎48银河证券×火山引擎：TRAE嵌入研发全流程，交付周期缩短一半

17:31IT之家（RSS）54WPS 笔记发布：AI 原生多模态，重新定义个人知识管理

10:50公众号：数字生命卡兹克70精选从0到1速通WorkBuddy：国内通用Agent产品教程

10:30IT之家（RSS）56初探苹果iPadOS 27快捷指令：AI生成完整工作流，复杂任务仍需手动调整

06:22MarkTechPost（RSS）55Microsoft SkillOpt 编码实现：仪表化提示优化、技能演化分析与基线比较

04:29OpenRouter：Announcements（RSS）64精选Gemini 2.5 Flash API - 定价、快速入门与提供商比较

00:23GitHub Blog68精选通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

6月10日周三

17:20公众号：卡尔的AI沃茨65实测小米MiMo-V2.5-Pro UltraSpeed：万亿参数MoE推理模型输出速度达1000 token/s

14:50公众号：千问APP（阿里）21千问高考志愿Agent上线，帮助考生估分选志愿

13:45MarkTechPost（RSS）61NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程：流式读取、Pandas 分析与 tiktoken 估算

07:44The Verge：AI（RSS）59我试用了 Siri AI，目前来看确实好用

06:19Simon Willison 博客71精选在 AgentsView 中为 Claude Fable 5 设置自定义价格

05:55Hugging Face：Blog（RSS）74精选将 GitHub CI 迁移到 Hugging Face Jobs

00:18GitHub Blog68精选GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

00:00OpenRouter：Announcements（RSS）60同事件精选Gemini 2.5 Flash API：定价、快速入门与提供商对比同一事件，精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》

6月9日周二

19:55Hugging Face：Blog（RSS）76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

17:55Hugging Face：Blog（RSS）68精选NeuroBait：微调AI助手，为ADHD大脑点燃多巴胺火花

17:40公众号：通义实验室（千问）67同事件精选仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

16:42MarkTechPost（RSS）70精选NVIDIA cuTile Python 教程：在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

04:48OpenRouter：Announcements（RSS）66精选EU AI Act 合规：面向 AI 智能体的人工监督

03:11MarkTechPost（RSS）50ClawHub Security Signals：AI技能数据集的端到端安全信号分析与判定分类编程指南

6月8日周一

20:00OpenRouter：Announcements（RSS）63同事件精选OpenRouter Agent SDK 推出 HITL 工具：满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

19:50Hugging Face：Blog（RSS）74精选Pakistan Notice Helper：一款面向本地安全问题的轻量 AI 工具

18:00公众号：通义实验室（千问）68同事件精选Agent 辅助开发，一站式打通 Qwen3-VL Android 端侧推理同一事件，精选展示《Agent辅助开发：通义实验室教程打通Qwen3-VL Android端侧推理》

17:53公众号：通义实验室（千问）67精选Agent辅助开发：通义实验室教程打通Qwen3-VL Android端侧推理

12:59Hacker News 热门（buzzing.cc 中文翻译）65你能构建的最简单的人工神经网络：用 Python 实现的感知器

04:58Hacker News 热门（buzzing.cc 中文翻译）20Linear 为何如此快？技术解析

01:05MarkTechPost（RSS）50使用GEPA构建反思性提示优化：多组件提示、结构化反馈与保留验证

6月7日周日

13:34MarkTechPost（RSS）67NVIDIA garak 教程：构建完整的防御性 LLM 红队工作流，支持自定义探针和检测器

11:56Hacker News 热门（buzzing.cc 中文翻译）67Harness 工程：在智能体优先的世界中运用 Codex

03:50Hugging Face：Blog（RSS）66精选五个实验室，五个心智：用小模型构建多模型金融剧情游戏

6月6日周六

23:48Hugging Face：Blog（RSS）65精选Job Searcher

22:17IT之家（RSS）66联合国大学报告：精简AI指令中礼貌用语可让ChatGPT能耗降低25%

07:21Hacker News 热门（buzzing.cc 中文翻译）62我用于测试驱动开发的代理技能

06:57MarkTechPost（RSS）57Qualcomm AI Hub实战教程：使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月12日

15:26

MarkTechPost（RSS）

58

基于MONAI与UNet的医学CT三维脾脏分割端到端实现教程

该教程使用MONAI框架在Medical Segmentation Decathlon Task09数据集上搭建了端到端的三维医学图像分割流程。处理对象为脾脏的CT容积扫描，依次应用方向对齐、体素间距归一化、强度窗值调整、前景裁剪和基于补丁的采样等医学影像变换，最后训练一个3D UNet模型用于分割。

教程/实践数据/训练

05:05

OpenRouter：Announcements（RSS）

54

什么是 LLM 网关？应用与 AI 模型之间缺失的一层

缺少 LLM 网关时，供应商中断会直接变成用户可见的错误，AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。

教程/实践部署/工程

03:35

OpenRouter：Announcements（RSS）

48

什么是 LLM Gateway？你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误，并让 AI 费用变得透明。通过路由、合规性和设置时间等维度，可以对比市面上最佳的网关方案。

教程/实践部署/工程

6月11日

18:59

Hugging Face：Blog（RSS）

46

PyTorch 剖析系列（二）：从 nn.Linear 到融合 MLP

本部分将手写 matmul-add 对替换为 nn.Linear（bias=True），堆叠三层 Linear 与激活函数构成多层感知机（MLP）块，在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm，将 bias 加法作为 epilogue 融合进矩阵乘法核，避免额外 HBM 访问；transpose 操作（aten::t）仅改写 CPU 端张量元数据（shape 和 stride），不启动 GPU 核。

Hugging Face 教程/实践部署/工程

18:50

公众号：卡尔的AI沃茨

77

开源「鲁班」Skill：用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5（Mythos 安全公开版）6月22日前对 Pro/Max/Team 订阅用户开放，之后转 API。作者用 100 美元/月的 Max 会员，让 Fable 5 开发了开源“鲁班 Skill”，专用于打磨其他 AI Skill。该 Skill 通过前提验证（真实问题、安装理由、唯一性）、并行搜索同类（GitHub/ClawHub/skills.sh 等）、横纵分析、Darwin 式 9 维度评分（权重最高的实测表现）、SkillOpt 式单方向改写等步骤，将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑，追加了热点模式和时间轴模式，改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill，强调 Skill 本质是清晰提示语而非复杂脚本。

智能体 Anthropic GitHub 开源/仓库

关联讨论 31 条X：Perplexity (@perplexity_ai)Nathan Lambert：Interconnects（RSS）Tomer Tunguz 博客（VC 分析）X：Kim (@kimmonismus)TechCrunch：AI（RSS）Ethan Mollick：One Useful Thing（RSS）X：小互 (@xiaohu)Claude Code：GitHub Releases（RSS）X：OpenRouter (@OpenRouter)X：Testing Catalog (@testingcatalog)X：Elvis Saravia (@omarsar0, DAIR.AI)X：Claude Devs (@ClaudeDevs)X：Artificial Analysis (@ArtificialAnlys)X：宝玉 (@dotey)X：Andrej Karpathy (@karpathy)X：卡兹克 (@Khazix0918)IT之家（RSS）X：歸藏 (@op7418)The Verge：AI（RSS）X：Berry Xia (@berryxia)Anthropic：Newsroom（网页）X：Vista (@vista8)The Decoder：AI News（RSS）X：Claude (@claudeai)X：Boris Cherny (@bcherny)Simon Willison 博客X：Rohan Paul (@rohanpaul_ai)X：Dario Amodei (@DarioAmodei)Hacker News 热门（buzzing.cc 中文翻译）X：Eric Zakariasson (@ericzakariasson)公众号：数字生命卡兹克

18:30

公众号：火山引擎

48

银河证券×火山引擎：TRAE嵌入研发全流程，交付周期缩短一半

银河证券与火山引擎合作，引入TRAE企业版并推进SDD（规格驱动开发）范式，将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2，AI代码采纳率最高达87%，前端UI还原度稳定在90%以上（H5/Vue页面达98%以上）。子账户与融券系统重构周期从4个月压缩至2个月，Bug率降低25%，单元测试覆盖率提升30%，券池规模扩大10倍，服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链，组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位，累计培训超130名研发人员。

MCP/工具教程/实践编码

17:31

IT之家（RSS）

54

WPS 笔记发布：AI 原生多模态，重新定义个人知识管理

6月5日，金山办公发布AI原生多模态笔记产品WPS笔记，摒弃传统文件夹，采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入；语音转写具备AI实时纠正和声纹区分发言人功能，图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手，能完成整理、摘要、润色、创建任务清单等操作，支持自定义Skill和记忆设置。开放外部MCP接入，允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践

10:50

公众号：数字生命卡兹克

精选70

从0到1速通WorkBuddy：国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品，支持Windows和Mac，提供免费版和58元/月个人专业版，企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek（推荐V4 Pro）、GLM、Kimi等国产大模型，也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态，可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体 MCP/工具教程/实践

关联讨论 1 条公众号：数字生命卡兹克

推荐理由：补上那批「好是好但用不了」的遗憾，WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面，这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。

10:30

IT之家（RSS）

56

初探苹果iPadOS 27快捷指令：AI生成完整工作流，复杂任务仍需手动调整

科技媒体Appleinsider于6月10日测试iPadOS 27新版快捷指令中基于Apple Intelligence的自然语言生成工作流功能。简单任务如“开启低电量模式并启动计时器”效果理想。但涉及多条件判断或跨应用联动的复杂工作流仍需手动调整。在去除URL追踪参数的测试中，AI生成的工作流初看合理，但实际运行均出错，模型误判输入或报告剪贴板无URL，经多轮提示词修改和手动干预仍未能正确清除追踪参数。

教程/实践端侧

06:22

MarkTechPost（RSS）

55

Microsoft SkillOpt 编码实现：仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流，包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线，运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环，检查训练历史，可视化准确率、编辑预算行为和 token 用量，并将进化后的技能与基线进行比较。

MCP/工具 Microsoft 教程/实践部署/工程

04:29

OpenRouter：Announcements（RSS）

精选64

Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算（thinking budgets），用户可跨提供商进行比较，并在5分钟内完成首次API调用。

Google 推理教程/实践部署/工程

推荐理由：这是 OpenRouter 上接入 Gemini 2.5 Flash 的保姆级指南，把三家 Google 提供商的延迟和定价差异摆在明面上，需要做模型选型和成本估算的开发者可以直接抄里面的 quickstart 代码。

00:23

GitHub Blog

精选68

通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP（Language Server Protocol）服务器来替代原始的暴力 grep 或反编译方式，从而获得真正的代码智能。

GitHub 教程/实践编码

推荐理由：虽然只是 Copilot CLI 的一个功能指南，但用 LSP 替代 grep 带来的代码理解提升是实打实的，搞 CLI 开发的可以直接抄作业。

6月10日

17:20

公众号：卡尔的AI沃茨

65

实测小米MiMo-V2.5-Pro UltraSpeed：万亿参数MoE推理模型输出速度达1000 token/s

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s，峰值达2140 token/s，是普通版的3倍，且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后，可调度12个Agent在11分钟内完成项目升级报告并打包成Skill；3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

智能体教程/实践部署/工程

14:50

公众号：千问APP（阿里）

21

千问高考志愿Agent上线，帮助考生估分选志愿

高考结束后，考生可通过千问完成志愿填报第一步：打开千问，点击首页底部【千问高考】，创建个人档案，然后跟随千问的指引选择志愿。

13:45

MarkTechPost（RSS）

61

NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程：流式读取、Pandas 分析与 tiktoken 估算

教程以 NVIDIA Nemotron-Pretraining-Code-v3 数据集为大规模元数据索引，采用流式方式而非完整下载，检查数据集 schema 并构建可管理样本。通过分析编程语言、文件扩展名、仓库频率及目录深度来理解索引结构，随后重构原始 GitHub URL 以获取真实源代码文件，并利用 tiktoken 估算所获代码的 token 规模。

教程/实践数据/训练编码

07:44

The Verge：AI（RSS）

59

我试用了 Siri AI，目前来看确实好用

苹果新版 Siri AI 终于能一次性从邮件或排版混乱的传单中提取足球赛或“精神周”主题日并添加到日历上。它还支持对话式交互，例如讨论花园玫瑰病害、整理五金店购物清单、设置花床堆肥提醒，并能引用邮件和日历中的信息来生成推荐。

教程/实践语音

06:19

Simon Willison 博客

精选71

在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库，作者利用 Fable 逆向工程，找到了为该模型设置自定义价格的方法，并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由：如果你也用 coding agent 且在乎成本，Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪，简单但实用。

05:55

Hugging Face：Blog（RSS）

精选74

将 GitHub CI 迁移到 Hugging Face Jobs

本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行，以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接，将 GitHub Actions 的 job 转为临时自托管运行器：GitHub App 监听 workflow_job.queued webhook，dispatcher Space 验证后启动对应硬件（CPU 或 t4-small、h200 等 GPU）的 HF Job，由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地，CPU 作业时间减少约 30%，并新增了 GPU 测试套件。文章分步说明了复制 dispatcher Space、创建并安装 GitHub App、配置 webhook 和 HF_TOKEN 的具体步骤。

Hugging Face 教程/实践部署/工程

推荐理由：HF 直接把 CI 桥接器开源了出来，教你把 GitHub Actions 迁到 HF Jobs 上跑 GPU 测试，ML 项目终于可以低成本配上显卡 CI，步骤清晰到能直接抄作业。

00:18

GitHub Blog

精选68

GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能，使 CLI 能够理解开发者的技术栈和团队工作流，将一次性终端提示转变为可重复、可审查的流程。

智能体 GitHub 教程/实践编码

推荐理由：GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流，相当于给命令行配了个 AI 副驾驶，做自动化的朋友值得一试。

00:00

OpenRouter：Announcements（RSS）

同事件精选60

Gemini 2.5 Flash API：定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南，指导用户配置 thinking budgets、比较不同提供商，并在 5 分钟内完成首次 API 调用。

Google 推理教程/实践部署/工程

同一事件，精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》

推荐理由：Gemini 2.5 Flash 最值得关注的是 thinking budget，这篇教程把怎么用、怎么省都讲清楚了，但对早已熟悉文档的开发者来说新东西有限。

6月9日

19:55

Hugging Face：Blog（RSS）

精选76

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space，从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像，再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点（.ply），自动完成坐标系校正、取景、压缩为.ksplat（体积缩小约3倍），并构建基于Three.js的滚动切换、拖拽旋转查看器，最终部署为静态Space。整个过程无需客户端库，每个Space通过agents.md暴露可调用API。

智能体 Hugging Face MCP/工具多模态

推荐理由：Hugging Face 把 agents.md 做成每个 Space 的标准说明书，agent 能直接读懂并链式调用图像和 3D 模型，这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了，做 AI 工具链的可以立刻照着试。

17:55

Hugging Face：Blog（RSS）

精选68

NeuroBait：微调AI助手，为ADHD大脑点燃多巴胺火花

NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手，旨在帮助ADHD患者克服“知道该做什么但无法开始”的执行功能障碍。采用16-bit LoRA（r=16, alpha=16）在Unsloth上训练3个epoch，学习率2e-4，最大序列长度2048，使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space（ZeroGPU），使用Gradio和标准transformers+peft，运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单，而是根据用户上下文给出3-6句温暖流畅的回复，引导用户找到一件微小可立即执行的动作，从而激发多巴胺、降低启动阻力。

Hugging Face 教程/实践数据/训练

推荐理由：对ADHD群体来说，这是一次真正从需求出发的AI尝试。它不做计划列表，而是用一个温暖的动感火花打破僵局，让AI从理论走向陪伴。如果你或身边人容易'卡住'，可以试试这个Space。

17:40

公众号：通义实验室（千问）

同事件精选67

仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下，Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档，于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付，单端耗时约 4 小时，中途无人工接管。模型不具备图像理解能力，通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统：任务拆分为规划、架构、编码等阶段，验收覆盖静态检查、编译自检（0 error）、路由完整性（Web 端 34 条路由全部可达）、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试，使模型数小时内收敛。移动端产出可安装 APK，Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程

同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

推荐理由：通义实验室没有炫技分数，而是把 Agent 逼到了长程交付的极限，约束闭环这套方法论比模型本身更值钱，所有做 Agent 开发的都该读一遍。

16:42

MarkTechPost（RSS）

精选70

NVIDIA cuTile Python 教程：在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流，在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后，分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数，并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性，并基准测试了各阶段的中位运行时间。

教程/实践编码

推荐理由：NVIDIA cuTile把GPU tiled kernel编程的门槛拉低到Python，这个Colab教程从环境搭建到矩阵乘法全链路，想自己写算子的人可以跟着跑一遍。

04:48

OpenRouter：Announcements（RSS）

精选66

EU AI Act 合规：面向 AI 智能体的人工监督

使用智能体 SDK 的人机协作（HITL）工具，可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。

MCP/工具安全/对齐教程/实践

推荐理由：虽然讲的是合规，但直接把监管要求翻译成可落地的代码模式，对做高风险Agent的团队来说是一份照着改就能过审的实操手册。

03:11

MarkTechPost（RSS）

50

ClawHub Security Signals：AI技能数据集的端到端安全信号分析与判定分类编程指南

该教程使用ClawHub Security Signals数据集分析扫描器如何评估AI技能。从Hugging Face Parquet格式加载数据，检查判定结果、扫描输出和严重性标签，通过Jaccard分数和Cohen's kappa衡量VirusTotal、静态分析和SkillSpector之间的重叠与分歧，最后将SKILL.md文本与扫描信号结合，训练逻辑回归模型预测ClawScan判定。

安全/对齐教程/实践

6月8日

20:00

OpenRouter：Announcements（RSS）

同事件精选63

OpenRouter Agent SDK 推出 HITL 工具：满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环（HITL）工具，用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法（SB26-189）以及 NIST AI 风险框架（NIST AI RMF）的监管要求。

智能体教程/实践部署/工程

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：8 月就是欧盟 AI 法案高风险的生效日，这个教程把三个监管框架的 HITL 要求变成可直接复用的代码，做金融医疗代理的开发者该收藏。

19:50

Hugging Face：Blog（RSS）

精选74

Pakistan Notice Helper：一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具，帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入，返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语，乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型（通过 llama.cpp + CUDA），在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B（质量高但成本高）和 MiniCPM-V 4.6 Q8（速度慢且不稳定），最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。

Hugging Face 多模态教程/实践

推荐理由：一个只有4B的小模型，把巴基斯坦本地诈骗文案分析得明明白白，比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具，这才是AI落地的真节奏。

18:00

公众号：通义实验室（千问）

同事件精选68

Agent 辅助开发，一站式打通 Qwen3-VL Android 端侧推理

通义实验室教程演示了如何用 Agent（Qoder）辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括：检查 JDK 21、NDK 27、CMake 3.18.1 等环境；创建 arm64-v8a 的 Native C++ 工程（minSdk 29、compileSdk 35）；通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型；编译开启 LLM 视觉支持（MNN_BUILD_LLM、LLM_SUPPORT_VISION）的 libMNN.so；构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面，输出 MNN 版本（v3.5.0）、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。

多模态推理教程/实践端侧

同一事件，精选展示《Agent辅助开发：通义实验室教程打通Qwen3-VL Android端侧推理》

推荐理由：用Agent辅助走通Qwen3-VL安卓端侧推理全流程，从环境搭建到JNI桥接一步到位。如果你在做移动端AI应用，这可能是目前最详细的实战指南，可以直接抄作业。

17:53

公众号：通义实验室（千问）

精选67

Agent辅助开发：通义实验室教程打通Qwen3-VL Android端侧推理

通义实验室第二期教程展示如何利用Agent（如Qoder）自动完成Android端侧AI App开发全流程。Agent依次执行：检查并配置Android环境（JDK 21、NDK 27等）、创建Native C++工程PhotoTaggerMNN、下载约1.4GB的Qwen3-VL-2B-Instruct-MNN模型、编译支持视觉能力的libMNN.so、将MNN接入工程、构建APK、推送模型至手机私有目录，最终确认MNN版本3.5.0及模型文件全部ok。核心思路是开发者定义业务目标，Agent负责环境检查、代码编写、编译构建与排错。

多模态教程/实践端侧

推荐理由：这是一篇手把手教程，用 Agent 简化 Qwen3-VL Android 部署，对想试端侧 VL 的开发者实用，但绑定阿里生态，通用性有限。

12:59

Hacker News 热门（buzzing.cc 中文翻译）

65

你能构建的最简单的人工神经网络：用 Python 实现的感知器

一篇关于用 Python 构建最简单人工神经网络——感知器（Perceptron）的文章在 Hacker News 上获得 108 个用户点赞。

教程/实践数据/训练

04:58

Hacker News 热门（buzzing.cc 中文翻译）

20

Linear 为何如此快？技术解析

performance.dev 上发布的一篇技术解析文章，探讨项目管理工具 Linear 实现快速性能的原理，在 Hacker News 上获得 111 个点赞。

01:05

MarkTechPost（RSS）

50

使用GEPA构建反思性提示优化：多组件提示、结构化反馈与保留验证

本教程展示如何利用GEPA这一反思性提示进化框架，改善小型语言模型在多步算术应用题上的表现。从弱种子提示出发，构建确定性基准并定义能返回可操作反馈的结构化评估器。多组件设置同时进化指令字段与输出格式规则，最后在保留验证集上对比基线提示与优化提示，检验优化效果是否泛化。

推理教程/实践

6月7日

13:34

MarkTechPost（RSS）

67

NVIDIA garak 教程：构建完整的防御性 LLM 红队工作流，支持自定义探针和检测器

NVIDIA garak 教程演示了端到端的防御性 LLM 红队工作流，包括框架设置、插件发现、模拟运行、在 Hugging Face 生成器上对真实模型进行扫描以及多探针评估。流程随后分析安全评分与攻击成功率，审查被标记的输出，并通过自定义探针和检测器扩展 garak 功能，最后以 AVID 格式导出结构化漏洞报告。

Hugging Face 开源生态教程/实践

11:56

Hacker News 热门（buzzing.cc 中文翻译）

67

Harness 工程：在智能体优先的世界中运用 Codex

Harness 工程在智能体优先的世界中利用 OpenAI Codex 的实践文章，6月6日发布于 openai.com，在 Hacker News 上获得 102 点热度。

智能体 OpenAI 教程/实践编码

03:50

Hugging Face：Blog（RSS）

精选66

五个实验室，五个心智：用小模型构建多模型金融剧情游戏

Thousand Token Wood v2使用四个不同实验室的小模型（gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B及微调Qwen 0.5B）驱动金融模拟游戏的智能体。核心发现是异构服务层摩擦在于vLLM 0.22.1需CUDA工具包，而非模型本身。通过容忍性JSON解析层，添加模型只需一条配置。信息隔离确保内幕标志不在提示词中，扫描测试验证无泄露。记忆用情绪摘要截断避免淹没。微调0.5B模型实现0%自成交、100%有效报价，真相防火墙零泄露。小模型是可靠格式生成器但不可靠推理器，可通过结构化、提示词和微调弥补。

智能体 Hugging Face 教程/实践

推荐理由：不是那种「我用 GPT 写了个游戏」的浅显分享，真在四个小模型上跑出了博弈感，里面 vLLM 踩坑和防火墙测试方法可以直接抄作业。

6月6日

23:48

Hugging Face：Blog（RSS）

精选65

Hugging Face 发布 Job Searcher，一个基于 AI 的求职搜索工具。用户上传简历并设定偏好后，系统使用教师模型 DeepSeek V4 Pro 生成 LinkedIn 搜索查询，通过 JobSpy 抓取职位，再对学生模型 Qwen3-8B（8B 参数）进行 LoRA 微调，对每个职位从技能匹配、经验相关性、教育背景、行业领域契合度和资历对齐五个维度给出评分和推理。训练在 Modal 平台单张 A100 上完成。推理部署于 Hugging Face ZeroGPU Space，使用 llama.cpp 实现流式输出。项目开源。

智能体 Hugging Face 教程/实践数据/训练

推荐理由：这个 hackathon 项目把教师蒸馏和 LoRA 微调 8B 模型的流程全部开源在 HF 上，做模型定制和部署的开发者能直接抄作业，尤其是推理部署踩的坑（ZeroGPU 上下文重用）很实用。

22:17

IT之家（RSS）

66

联合国大学报告：精简AI指令中礼貌用语可让ChatGPT能耗降低25%

联合国大学水、环境与健康研究所报告显示，精简ChatGPT提示中的“请”“谢谢”等礼貌用语，可使能耗降低25%，每年节约87至98吉瓦时电能，相当于撒哈拉以南非洲地区76万人全年生活用电。研究人员建议指令应简洁凝练，避免无意义闲聊循环，不要与AI建立拟人化情感关系。原理上，精简指令减少了模型需解析和回复生成的token数量，部分场景降低任务复杂度。报告同时警示，AI普及正快速增加电能、土地与水资源消耗。

教程/实践现象/趋势

07:21

Hacker News 热门（buzzing.cc 中文翻译）

62

我用于测试驱动开发的代理技能

作者分享了一个用于测试驱动开发（TDD）的Agent技能，该技能在Hacker News上获得100个HN点数，于6月4日发布。

智能体教程/实践编码

06:57

MarkTechPost（RSS）

57

Qualcomm AI Hub实战教程：使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

该教程演示如何配置Qualcomm AI Hub Models，运行MobileNet-V2推理与YOLOv7目标检测，并在真实设备上完成模型编译。

教程/实践端侧部署/工程

1 2 345 6…13