AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
6月12日周五
15:26MarkTechPost(RSS)58基于MONAI与UNet的医学CT三维脾脏分割端到端实现教程
05:05OpenRouter:Announcements(RSS)54什么是 LLM 网关?应用与 AI 模型之间缺失的一层
03:35OpenRouter:Announcements(RSS)48什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层
6月11日周四
18:59Hugging Face:Blog(RSS)46PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP
18:50公众号:卡尔的AI沃茨77开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流
18:30公众号:火山引擎48银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半
17:31IT之家(RSS)54WPS 笔记发布:AI 原生多模态,重新定义个人知识管理
10:50公众号:数字生命卡兹克70精选从0到1速通WorkBuddy:国内通用Agent产品教程
10:30IT之家(RSS)56初探苹果iPadOS 27快捷指令:AI生成完整工作流,复杂任务仍需手动调整
06:22MarkTechPost(RSS)55Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较
04:29OpenRouter:Announcements(RSS)64精选Gemini 2.5 Flash API - 定价、快速入门与提供商比较
00:23GitHub Blog68精选通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能
6月10日周三
17:20公众号:卡尔的AI沃茨65实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s
14:50公众号:千问APP(阿里)21千问高考志愿Agent上线,帮助考生估分选志愿
13:45MarkTechPost(RSS)61NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程:流式读取、Pandas 分析与 tiktoken 估算
07:44The Verge:AI(RSS)59我试用了 Siri AI,目前来看确实好用
06:19Simon Willison 博客71精选在 AgentsView 中为 Claude Fable 5 设置自定义价格
05:55Hugging Face:Blog(RSS)74精选将 GitHub CI 迁移到 Hugging Face Jobs
00:18GitHub Blog68精选GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流
00:00OpenRouter:Announcements(RSS)60同事件精选Gemini 2.5 Flash API:定价、快速入门与提供商对比同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
6月9日周二
19:55Hugging Face:Blog(RSS)76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊
17:55Hugging Face:Blog(RSS)68精选NeuroBait:微调AI助手,为ADHD大脑点燃多巴胺火花
17:40公众号:通义实验室(千问)67同事件精选仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
16:42MarkTechPost(RSS)70精选NVIDIA cuTile Python 教程:在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核
04:48OpenRouter:Announcements(RSS)66精选EU AI Act 合规:面向 AI 智能体的人工监督
03:11MarkTechPost(RSS)50ClawHub Security Signals:AI技能数据集的端到端安全信号分析与判定分类编程指南
6月8日周一
20:00OpenRouter:Announcements(RSS)63同事件精选OpenRouter Agent SDK 推出 HITL 工具:满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
19:50Hugging Face:Blog(RSS)74精选Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具
18:00公众号:通义实验室(千问)68同事件精选Agent 辅助开发,一站式打通 Qwen3-VL Android 端侧推理同一事件,精选展示《Agent辅助开发:通义实验室教程打通Qwen3-VL Android端侧推理》
17:53公众号:通义实验室(千问)67精选Agent辅助开发:通义实验室教程打通Qwen3-VL Android端侧推理
12:59Hacker News 热门(buzzing.cc 中文翻译)65你能构建的最简单的人工神经网络:用 Python 实现的感知器
04:58Hacker News 热门(buzzing.cc 中文翻译)20Linear 为何如此快?技术解析
01:05MarkTechPost(RSS)50使用GEPA构建反思性提示优化:多组件提示、结构化反馈与保留验证
6月7日周日
13:34MarkTechPost(RSS)67NVIDIA garak 教程:构建完整的防御性 LLM 红队工作流,支持自定义探针和检测器
11:56Hacker News 热门(buzzing.cc 中文翻译)67Harness 工程:在智能体优先的世界中运用 Codex
03:50Hugging Face:Blog(RSS)66精选五个实验室,五个心智:用小模型构建多模型金融剧情游戏
6月6日周六
23:48Hugging Face:Blog(RSS)65精选Job Searcher
22:17IT之家(RSS)66联合国大学报告:精简AI指令中礼貌用语可让ChatGPT能耗降低25%
07:21Hacker News 热门(buzzing.cc 中文翻译)62我用于测试驱动开发的代理技能
06:57MarkTechPost(RSS)57Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
15:26
MarkTechPost(RSS)
58
基于MONAI与UNet的医学CT三维脾脏分割端到端实现教程

该教程使用MONAI框架在Medical Segmentation Decathlon Task09数据集上搭建了端到端的三维医学图像分割流程。处理对象为脾脏的CT容积扫描,依次应用方向对齐、体素间距归一化、强度窗值调整、前景裁剪和基于补丁的采样等医学影像变换,最后训练一个3D UNet模型用于分割。

教程/实践数据/训练
05:05
OpenRouter:Announcements(RSS)
54
什么是 LLM 网关?应用与 AI 模型之间缺失的一层

缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。

教程/实践部署/工程
03:35
OpenRouter:Announcements(RSS)
48
什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。

教程/实践部署/工程
6月11日
18:59
Hugging Face:Blog(RSS)
46
PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP

本部分将手写 matmul-add 对替换为 nn.Linear(bias=True),堆叠三层 Linear 与激活函数构成多层感知机(MLP)块,在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm,将 bias 加法作为 epilogue 融合进矩阵乘法核,避免额外 HBM 访问;transpose 操作(aten::t)仅改写 CPU 端张量元数据(shape 和 stride),不启动 GPU 核。

Hugging Face教程/实践部署/工程
18:50
公众号:卡尔的AI沃茨
77
开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。

智能体AnthropicGitHub开源/仓库
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
17:31
IT之家(RSS)
54
WPS 笔记发布:AI 原生多模态,重新定义个人知识管理

6月5日,金山办公发布AI原生多模态笔记产品WPS笔记,摒弃传统文件夹,采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入;语音转写具备AI实时纠正和声纹区分发言人功能,图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手,能完成整理、摘要、润色、创建任务清单等操作,支持自定义Skill和记忆设置。开放外部MCP接入,允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践
10:50
公众号:数字生命卡兹克
精选70
从0到1速通WorkBuddy:国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品,支持Windows和Mac,提供免费版和58元/月个人专业版,企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek(推荐V4 Pro)、GLM、Kimi等国产大模型,也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态,可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体MCP/工具教程/实践
关联讨论 1 条公众号:数字生命卡兹克
推荐理由:补上那批「好是好但用不了」的遗憾,WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面,这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。
10:30
IT之家(RSS)
56
初探苹果iPadOS 27快捷指令:AI生成完整工作流,复杂任务仍需手动调整

科技媒体Appleinsider于6月10日测试iPadOS 27新版快捷指令中基于Apple Intelligence的自然语言生成工作流功能。简单任务如“开启低电量模式并启动计时器”效果理想。但涉及多条件判断或跨应用联动的复杂工作流仍需手动调整。在去除URL追踪参数的测试中,AI生成的工作流初看合理,但实际运行均出错,模型误判输入或报告剪贴板无URL,经多轮提示词修改和手动干预仍未能正确清除追踪参数。

教程/实践端侧
06:22
MarkTechPost(RSS)
55
Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程
04:29
OpenRouter:Announcements(RSS)
精选64
Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。

Google推理教程/实践部署/工程

推荐理由:这是 OpenRouter 上接入 Gemini 2.5 Flash 的保姆级指南,把三家 Google 提供商的延迟和定价差异摆在明面上,需要做模型选型和成本估算的开发者可以直接抄里面的 quickstart 代码。
00:23
GitHub Blog
精选68
通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。

GitHub教程/实践编码

推荐理由:虽然只是 Copilot CLI 的一个功能指南,但用 LSP 替代 grep 带来的代码理解提升是实打实的,搞 CLI 开发的可以直接抄作业。
6月10日
17:20
公众号:卡尔的AI沃茨
65
实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

智能体教程/实践部署/工程
14:50
公众号:千问APP(阿里)
21
千问高考志愿Agent上线,帮助考生估分选志愿

高考结束后,考生可通过千问完成志愿填报第一步:打开千问,点击首页底部【千问高考】,创建个人档案,然后跟随千问的指引选择志愿。

教程/实践
13:45
MarkTechPost(RSS)
61
NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程:流式读取、Pandas 分析与 tiktoken 估算

教程以 NVIDIA Nemotron-Pretraining-Code-v3 数据集为大规模元数据索引,采用流式方式而非完整下载,检查数据集 schema 并构建可管理样本。通过分析编程语言、文件扩展名、仓库频率及目录深度来理解索引结构,随后重构原始 GitHub URL 以获取真实源代码文件,并利用 tiktoken 估算所获代码的 token 规模。

教程/实践数据/训练编码
07:44
The Verge:AI(RSS)
59
我试用了 Siri AI,目前来看确实好用

苹果新版 Siri AI 终于能一次性从邮件或排版混乱的传单中提取足球赛或“精神周”主题日并添加到日历上。它还支持对话式交互,例如讨论花园玫瑰病害、整理五金店购物清单、设置花床堆肥提醒,并能引用邮件和日历中的信息来生成推荐。

教程/实践语音
06:19
Simon Willison 博客
精选71
在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由:如果你也用 coding agent 且在乎成本,Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪,简单但实用。
05:55
Hugging Face:Blog(RSS)
精选74
将 GitHub CI 迁移到 Hugging Face Jobs

本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 workflow_job.queued webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU 作业时间减少约 30%,并新增了 GPU 测试套件。文章分步说明了复制 dispatcher Space、创建并安装 GitHub App、配置 webhook 和 HF_TOKEN 的具体步骤。

Hugging Face教程/实践部署/工程

推荐理由:HF 直接把 CI 桥接器开源了出来,教你把 GitHub Actions 迁到 HF Jobs 上跑 GPU 测试,ML 项目终于可以低成本配上显卡 CI,步骤清晰到能直接抄作业。
00:18
GitHub Blog
精选68
GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。

智能体GitHub教程/实践编码

推荐理由:GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流,相当于给命令行配了个 AI 副驾驶,做自动化的朋友值得一试。
00:00
OpenRouter:Announcements(RSS)
同事件精选60
Gemini 2.5 Flash API:定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。

Google推理教程/实践部署/工程
同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
推荐理由:Gemini 2.5 Flash 最值得关注的是 thinking budget,这篇教程把怎么用、怎么省都讲清楚了,但对早已熟悉文档的开发者来说新东西有限。
6月9日
19:55
Hugging Face:Blog(RSS)
精选76
一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过agents.md暴露可调用API。

智能体Hugging FaceMCP/工具多模态

推荐理由:Hugging Face 把 agents.md 做成每个 Space 的标准说明书,agent 能直接读懂并链式调用图像和 3D 模型,这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了,做 AI 工具链的可以立刻照着试。
17:55
Hugging Face:Blog(RSS)
精选68
NeuroBait:微调AI助手,为ADHD大脑点燃多巴胺火花

NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手,旨在帮助ADHD患者克服“知道该做什么但无法开始”的执行功能障碍。采用16-bit LoRA(r=16, alpha=16)在Unsloth上训练3个epoch,学习率2e-4,最大序列长度2048,使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space(ZeroGPU),使用Gradio和标准transformers+peft,运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单,而是根据用户上下文给出3-6句温暖流畅的回复,引导用户找到一件微小可立即执行的动作,从而激发多巴胺、降低启动阻力。

Hugging Face教程/实践数据/训练

推荐理由:对ADHD群体来说,这是一次真正从需求出发的AI尝试。它不做计划列表,而是用一个温暖的动感火花打破僵局,让AI从理论走向陪伴。如果你或身边人容易'卡住',可以试试这个Space。
17:40
公众号:通义实验室(千问)
同事件精选67
仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:通义实验室没有炫技分数,而是把 Agent 逼到了长程交付的极限,约束闭环这套方法论比模型本身更值钱,所有做 Agent 开发的都该读一遍。
16:42
MarkTechPost(RSS)
精选70
NVIDIA cuTile Python 教程:在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流,在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后,分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数,并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性,并基准测试了各阶段的中位运行时间。

教程/实践编码

推荐理由:NVIDIA cuTile把GPU tiled kernel编程的门槛拉低到Python,这个Colab教程从环境搭建到矩阵乘法全链路,想自己写算子的人可以跟着跑一遍。
04:48
OpenRouter:Announcements(RSS)
精选66
EU AI Act 合规:面向 AI 智能体的人工监督

使用智能体 SDK 的人机协作(HITL)工具,可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。

MCP/工具安全/对齐教程/实践

推荐理由:虽然讲的是合规,但直接把监管要求翻译成可落地的代码模式,对做高风险Agent的团队来说是一份照着改就能过审的实操手册。
03:11
MarkTechPost(RSS)
50
ClawHub Security Signals:AI技能数据集的端到端安全信号分析与判定分类编程指南

该教程使用ClawHub Security Signals数据集分析扫描器如何评估AI技能。从Hugging Face Parquet格式加载数据,检查判定结果、扫描输出和严重性标签,通过Jaccard分数和Cohen's kappa衡量VirusTotal、静态分析和SkillSpector之间的重叠与分歧,最后将SKILL.md文本与扫描信号结合,训练逻辑回归模型预测ClawScan判定。

安全/对齐教程/实践
6月8日
20:00
OpenRouter:Announcements(RSS)
同事件精选63
OpenRouter Agent SDK 推出 HITL 工具:满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环(HITL)工具,用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法(SB26-189)以及 NIST AI 风险框架(NIST AI RMF)的监管要求。

智能体教程/实践部署/工程
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:8 月就是欧盟 AI 法案高风险的生效日,这个教程把三个监管框架的 HITL 要求变成可直接复用的代码,做金融医疗代理的开发者该收藏。
19:50
Hugging Face:Blog(RSS)
精选74
Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。

Hugging Face多模态教程/实践

推荐理由:一个只有4B的小模型,把巴基斯坦本地诈骗文案分析得明明白白,比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具,这才是AI落地的真节奏。
18:00
公众号:通义实验室(千问)
同事件精选68
Agent 辅助开发,一站式打通 Qwen3-VL Android 端侧推理

通义实验室教程演示了如何用 Agent(Qoder)辅助完成 Qwen3-VL-2B 模型在 Android 端侧的全流程部署。操作包括:检查 JDK 21、NDK 27、CMake 3.18.1 等环境;创建 arm64-v8a 的 Native C++ 工程(minSdk 29、compileSdk 35);通过 ModelScope CLI 下载约 1.4GB 的 MNN/Qwen3-VL-2B-Instruct-MNN 模型;编译开启 LLM 视觉支持(MNN_BUILD_LLM、LLM_SUPPORT_VISION)的 libMNN.so;构建 APK 并推送模型至手机私有目录。最终 App 提供图文推理页面,输出 MNN 版本(v3.5.0)、ABI 及推理指标。所有繁琐步骤均可由 Agent 自动执行。

多模态推理教程/实践端侧
同一事件,精选展示《Agent辅助开发:通义实验室教程打通Qwen3-VL Android端侧推理》
推荐理由:用Agent辅助走通Qwen3-VL安卓端侧推理全流程,从环境搭建到JNI桥接一步到位。如果你在做移动端AI应用,这可能是目前最详细的实战指南,可以直接抄作业。
17:53
公众号:通义实验室(千问)
精选67
Agent辅助开发:通义实验室教程打通Qwen3-VL Android端侧推理

通义实验室第二期教程展示如何利用Agent(如Qoder)自动完成Android端侧AI App开发全流程。Agent依次执行:检查并配置Android环境(JDK 21、NDK 27等)、创建Native C++工程PhotoTaggerMNN、下载约1.4GB的Qwen3-VL-2B-Instruct-MNN模型、编译支持视觉能力的libMNN.so、将MNN接入工程、构建APK、推送模型至手机私有目录,最终确认MNN版本3.5.0及模型文件全部ok。核心思路是开发者定义业务目标,Agent负责环境检查、代码编写、编译构建与排错。

多模态教程/实践端侧

推荐理由:这是一篇手把手教程,用 Agent 简化 Qwen3-VL Android 部署,对想试端侧 VL 的开发者实用,但绑定阿里生态,通用性有限。
12:59
Hacker News 热门(buzzing.cc 中文翻译)
65
你能构建的最简单的人工神经网络:用 Python 实现的感知器

一篇关于用 Python 构建最简单人工神经网络——感知器(Perceptron)的文章在 Hacker News 上获得 108 个用户点赞。

教程/实践数据/训练
04:58
Hacker News 热门(buzzing.cc 中文翻译)
20
Linear 为何如此快?技术解析

performance.dev 上发布的一篇技术解析文章,探讨项目管理工具 Linear 实现快速性能的原理,在 Hacker News 上获得 111 个点赞。

教程/实践
01:05
MarkTechPost(RSS)
50
使用GEPA构建反思性提示优化:多组件提示、结构化反馈与保留验证

本教程展示如何利用GEPA这一反思性提示进化框架,改善小型语言模型在多步算术应用题上的表现。从弱种子提示出发,构建确定性基准并定义能返回可操作反馈的结构化评估器。多组件设置同时进化指令字段与输出格式规则,最后在保留验证集上对比基线提示与优化提示,检验优化效果是否泛化。

推理教程/实践
6月7日
13:34
MarkTechPost(RSS)
67
NVIDIA garak 教程:构建完整的防御性 LLM 红队工作流,支持自定义探针和检测器

NVIDIA garak 教程演示了端到端的防御性 LLM 红队工作流,包括框架设置、插件发现、模拟运行、在 Hugging Face 生成器上对真实模型进行扫描以及多探针评估。流程随后分析安全评分与攻击成功率,审查被标记的输出,并通过自定义探针和检测器扩展 garak 功能,最后以 AVID 格式导出结构化漏洞报告。

Hugging Face开源生态教程/实践
11:56
Hacker News 热门(buzzing.cc 中文翻译)
67
Harness 工程:在智能体优先的世界中运用 Codex

Harness 工程在智能体优先的世界中利用 OpenAI Codex 的实践文章,6月6日发布于 openai.com,在 Hacker News 上获得 102 点热度。

智能体OpenAI教程/实践编码
03:50
Hugging Face:Blog(RSS)
精选66
五个实验室,五个心智:用小模型构建多模型金融剧情游戏

Thousand Token Wood v2使用四个不同实验室的小模型(gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B及微调Qwen 0.5B)驱动金融模拟游戏的智能体。核心发现是异构服务层摩擦在于vLLM 0.22.1需CUDA工具包,而非模型本身。通过容忍性JSON解析层,添加模型只需一条配置。信息隔离确保内幕标志不在提示词中,扫描测试验证无泄露。记忆用情绪摘要截断避免淹没。微调0.5B模型实现0%自成交、100%有效报价,真相防火墙零泄露。小模型是可靠格式生成器但不可靠推理器,可通过结构化、提示词和微调弥补。

智能体Hugging Face教程/实践

推荐理由:不是那种「我用 GPT 写了个游戏」的浅显分享,真在四个小模型上跑出了博弈感,里面 vLLM 踩坑和防火墙测试方法可以直接抄作业。
6月6日
23:48
Hugging Face:Blog(RSS)
精选65
Job Searcher

Hugging Face 发布 Job Searcher,一个基于 AI 的求职搜索工具。用户上传简历并设定偏好后,系统使用教师模型 DeepSeek V4 Pro 生成 LinkedIn 搜索查询,通过 JobSpy 抓取职位,再对学生模型 Qwen3-8B(8B 参数)进行 LoRA 微调,对每个职位从技能匹配、经验相关性、教育背景、行业领域契合度和资历对齐五个维度给出评分和推理。训练在 Modal 平台单张 A100 上完成。推理部署于 Hugging Face ZeroGPU Space,使用 llama.cpp 实现流式输出。项目开源。

智能体Hugging Face教程/实践数据/训练

推荐理由:这个 hackathon 项目把教师蒸馏和 LoRA 微调 8B 模型的流程全部开源在 HF 上,做模型定制和部署的开发者能直接抄作业,尤其是推理部署踩的坑(ZeroGPU 上下文重用)很实用。
22:17
IT之家(RSS)
66
联合国大学报告:精简AI指令中礼貌用语可让ChatGPT能耗降低25%

联合国大学水、环境与健康研究所报告显示,精简ChatGPT提示中的“请”“谢谢”等礼貌用语,可使能耗降低25%,每年节约87至98吉瓦时电能,相当于撒哈拉以南非洲地区76万人全年生活用电。研究人员建议指令应简洁凝练,避免无意义闲聊循环,不要与AI建立拟人化情感关系。原理上,精简指令减少了模型需解析和回复生成的token数量,部分场景降低任务复杂度。报告同时警示,AI普及正快速增加电能、土地与水资源消耗。

教程/实践现象/趋势
07:21
Hacker News 热门(buzzing.cc 中文翻译)
62
我用于测试驱动开发的代理技能

作者分享了一个用于测试驱动开发(TDD)的Agent技能,该技能在Hacker News上获得100个HN点数,于6月4日发布。

智能体教程/实践编码
06:57
MarkTechPost(RSS)
57
Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。

教程/实践端侧部署/工程
‹ 上一页
123456…13
下一页 ›