AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
6月24日周三
01:14Claude:Blog(网页)42Claude Tag 的 Agent Identity 访问模型
01:10Meta Engineering Blog(RSS)45Meta 如何为 AI 眼镜设计超窄钢壳电池
6月23日周二
19:10公众号:小红书技术(dots.llm)54小红书QEcon分享:Agent驱动的服务端端到端测试
16:12Hugging Face:Blog(RSS)59精选我们用免费本地模型对 OpenClaw 仓库进行实时分类
16:12Hugging Face:Blog(RSS)67精选huggingface_hub 实现每周发布:AI、开源工具、人工审核闭环
14:41MarkTechPost(RSS)68GLM-5.2 OpenAI 兼容 API 实践指南:推理控制、函数调用与长上下文检索
10:14Hacker News 热门(buzzing.cc 中文翻译)41window.showDirectoryPicker 为您开启了一个崭新的世界
09:14OpenRouter:Announcements(RSS)72精选OpenRouter:通过API路由实现AI数据驻留合规
09:14OpenRouter:Announcements(RSS)62精选AI 治理清单:LLM 架构先行
08:14Hacker News 热门(buzzing.cc 中文翻译)84同事件精选GLM-5.2 开源模型发布:744B 参数,1M 上下文,可本地运行同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
08:01Simon Willison 博客60Moebius 0.2B图像修补模型借助Claude Code移植到浏览器运行
02:16OpenAI:官网动态(RSS · 排除企业/客户案例)58精选Codex 用于长期工作:最大化效能实践
01:08Google Developers Blog(RSS)56精选Google ADK 与 A2A 协议:跨语言多智能体团队构建实战
6月22日周一
19:30公众号:卡尔的AI沃茨65字节小云雀短剧 Agent 2.0 上线:Seedance 2.0 Mini 模型降价,新增720度场景与3D导演台
15:08Hacker News 热门(buzzing.cc 中文翻译)62微调 Qwen 3:0.6B 实现家庭问题分类,准确率从 10% 提升至 92%
08:00HuggingFace Daily Papers(社区热门论文)69智能体AI搭便车指南:从基础到系统
07:36MarkTechPost(RSS)58AI智能体记忆的七种类型:技术指南
6月21日周日
18:06Hacker News 热门(buzzing.cc 中文翻译)53PRINCE:拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台
13:00公众号:腾讯元宝64精选腾讯元宝父亲节活动:上传照片生成与年轻爸爸的合影
6月20日周六
17:25MarkTechPost(RSS)68如何使用TimeCopilot构建预测流水线:基础模型与自动异常检测
10:52TechCrunch:AI(RSS)63如何在 Google Docs 中关闭 AI 弹窗
04:26OpenRouter:Announcements(RSS)59精选OpenRouter vs Portkey:你的团队该选哪个LLM网关?
00:53GitHub Blog52GitHub 构建内部数据分析智能体 Qubot,基于 Copilot 实现自然语言查询
6月19日周五
22:53Hacker News 热门(buzzing.cc 中文翻译)66前OpenAI研究员搭建紧邻办公桌的机器人研究平台
13:29Hacker News 热门(buzzing.cc 中文翻译)73精选我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为0.89
10:56MarkTechPost(RSS)75精选Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)
10:10公众号:腾讯元宝48腾讯元宝端午图像编辑:粽叶头套指令说明
09:57Hacker News 热门(buzzing.cc 中文翻译)51从 GNU Stow 迁移到 Chezmoi
09:27OpenRouter:Announcements(RSS)55精选如何将 SillyTavern 连接到 OpenRouter(2026 指南)
09:27OpenRouter:Announcements(RSS)60精选OpenClaw 接入 OpenRouter
03:53Hacker News 热门(buzzing.cc 中文翻译)61Hermes 迁移工具:从 OpenClaw 导入配置
03:18Cloudflare Blog52Cloudflare 发布多阶段漏洞发现工具,详解对抗性审查与上下文绕过技术
03:16Google Developers Blog(RSS)48Google 庆祝A2A协议发布一周年:协作智能体生态
01:51Claude:Blog(网页)72精选驾驭 Claude Code:CLAUDE.md、技能、钩子、规则、子智能体等
6月18日周四
23:47Hugging Face:Blog(RSS)70精选超越 LoRA:如何选择最佳参数高效微调技术?
21:47Hugging Face:Blog(RSS)74精选AI 智能体够格吗?在自有工具上评测开源模型
16:14IT之家(RSS)40小米汽车详解超级电机 V8s EVO:AI 拓扑优化实现 28000rpm 高转速
12:00公众号:龙猫LongCat(美团)59美团智能创作团队海报生成技术体系:PosterCraft/PosterOmni/PosterReward
09:45MarkTechPost(RSS)64NVIDIA SkillSpector 指南:使用静态分析和 SARIF 报告扫描 AI 技能安全风险
09:43TechCrunch:AI(RSS)59如何在Google Docs中关闭AI
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月24日
01:14
Claude:Blog(网页)
42
Claude Tag 的 Agent Identity 访问模型

Claude Tag 推出 agent identity(智能体身份)访问模型,让 Claude 在共享频道中以独立身份工作,而非模拟某个用户。管理员在工作区级配置连接器、仓库访问、技能插件和固定指令等权限,每个频道可覆盖继承的基线设置。私有频道拥有独立身份,记忆和访问不跨频道流转;公共频道共享工作区级身份。该模型为自主多玩家 AI 场景设计,允许频道成员通过 Claude 访问已授权工具和数据,同时通过按身份撤销简化权限管理。

智能体Anthropic教程/实践部署/工程
01:10
Meta Engineering Blog(RSS)
45
Meta 如何为 AI 眼镜设计超窄钢壳电池

Meta 工程团队为 Ray-Ban Meta 等智能眼镜开发了宽度仅 7mm 的钢壳电池。传统软包电池难以塑形且空间利用率低,Meta 改用叠片式电极结构以降低阻抗、避免多任务时电压骤降,并将公差控制在约 100 微米以释放更多体积。Gen2 电池容量从 160 mAh 提升至 210 mAh,但续航翻倍主要来自软硬件系统级效率优化。Oakley Meta Vanguards 双电池面临交叉充电与启动关机时序难题,而 Meta Ray-Ban Display 则搭载了最大的 248 mAh 钢壳电池以支持屏幕持续供电。该超窄方案正推广至其他硬件形态。

Meta教程/实践端侧
6月23日
19:10
公众号:小红书技术(dots.llm)
54
小红书QEcon分享:Agent驱动的服务端端到端测试

小红书质效研发团队提出用AI Agent破解端到端测试的跨域、长链路、组合爆炸三大痛点。传统方案自动化覆盖率仅20%,新方案以Coding Agent为核心,采用逆向链式推导与知识库渐进式加载实现动态规划,Debug-first策略生成脚本,并结合工具级与链路级双层经验沉淀形成自进化飞轮。数据构造从小时级降至分钟级,常见场景秒级完成,新业务域接入从数天缩至分钟级。Agent直接理解测试意图、自主调用接口,无需预设编排。

智能体推理教程/实践
16:12
Hugging Face:Blog(RSS)
精选59
我们用免费本地模型对 OpenClaw 仓库进行实时分类

Hugging Face 在 OpenClaw 仓库上测试用 Gemma 和 Qwen 等本地模型实时分类 issue 和 PR。他们使用 Pi agent harness 驱动模型,配合 reposhell 只允许读操作防止提示词注入。测试的模型包括 gemma-4-26b-a4b 和 qwen3.6-35b-a3b,经性能优化后均可在本地生成数百 token/s。该方案运行在 NVIDIA GB10(128 GB 统一内存)上,相比每月 200 美元的 ChatGPT Pro 订阅,可实现近乎实时的通知且仅消耗电费。

智能体Hugging Face开源生态教程/实践

推荐理由:Hugging Face 演示了用本地模型自动 triage GitHub issue 的完整方案,包括只读 shell 防注入、agent harness 等工程技巧。对想用本地模型替代 API 做分类任务的团队,这是一套可直接借鉴的 recipe。
16:12
Hugging Face:Blog(RSS)
精选67
huggingface_hub 实现每周发布:AI、开源工具、人工审核闭环

Hugging Face 将 huggingface_hub 的发布周期从每 4‑6 周缩短至每周,全部由单个 GitHub Actions 工作流自动完成。流程依赖开源工具和开权重模型(当前为 Z.ai 的 GLM‑5.2)来起草发布说明和 Slack 公告,但保留人类在最终审核环节的决定权。自动步骤包括版本号更新、提交标签推送、PyPI 发布、下游测试分支创建、发布说明草稿、Slack 公告草稿、归档、后置版本提升以及对合入 PR 的评论。所有组件均基于开源生态构建,任何维护者都可直接复制使用。

智能体Hugging Face开源/仓库教程/实践

推荐理由:Hugging Face 把周更流程完全开源,用 GLM-5.2 生成发布说明初稿,再加确定性校验和人工修订,成本低到两毛五一次。想提高发版频率的 Python 库维护者可以直接 fork 适配。
14:41
MarkTechPost(RSS)
68
GLM-5.2 OpenAI 兼容 API 实践指南:推理控制、函数调用与长上下文检索

GLM-5.2 通过 OpenAI 兼容 API 提供深度思考开/关、推理努力级别(high/max)、流式推理与回答、函数调用、工具代理、结构化 JSON 输出及长上下文检索。API 输入每百万 token 1.40 美元、输出 4.40 美元,支持 zai、OpenRouter 等多提供商访问。教程演示了从客户端设置、API key 安全加载到可复用聊天封装与成本追踪的完整开发流程。

MCP/工具推理教程/实践部署/工程
10:14
Hacker News 热门(buzzing.cc 中文翻译)
41
window.showDirectoryPicker 为您开启了一个崭新的世界

Chrome 推出新 API window.showDirectoryPicker(),允许网页请求用户授权读写本地目录中的文件。作者利用 Claude 生成了模仿 Apple Aperture 界面的照片管理原型,支持在浏览器内查看、创建文件夹、移动照片,所有操作直接作用于用户文件系统。还基于 Claude 创建了受 Apple Shake 启发的节点式合成应用,可绘制多边形并叠加到源图片上。整个过程无需手写一行代码。

教程/实践编码
09:14
OpenRouter:Announcements(RSS)
精选72
OpenRouter:通过API路由实现AI数据驻留合规

Deloitte 报告显示 77% 的公司将供应商国籍纳入 AI 选型考量。OpenRouter 将数据驻留视为路由决策:通过 API 请求中的 provider 对象设置 order 或 only 限定服务商、allow_fallbacks 为 false 禁止回退、data_collection 为 deny 禁止数据存储或训练、zdr 为 true 要求零数据保留。示例以 anthropic/claude-sonnet-4.6 调用,首选 Anthropic 直连和 Amazon Bedrock。针对欧盟需求,可限制仅 Mistral 等欧盟总部供应商。若无可合规供应商,API 返回错误而非路由至不合规服务商。

教程/实践部署/工程

推荐理由:OpenRouter 这篇指南把数据驻留从一个基建难题退化成一次 API 请求里的路由配置,对需要合规的团队是直接可抄的实操手册。
09:14
OpenRouter:Announcements(RSS)
精选62
AI 治理清单:LLM 架构先行

Deloitte 报告显示企业 AI 抱负与治理成熟度之间差 53 个百分点,74% 计划两年内部署智能体 AI,仅 21% 拥有成熟治理模型。路由架构是首个治理层。三种姿态——托管网关(如 OpenRouter、Portkey)、自托管网关(如 LiteLLM)和直接 API——默认治理能力不同,直接 API 缺乏统一控制面,造成治理盲区。治理清单可映射为资产盘点、问责制、访问控制、证据记录与合规性五大支柱。路由层能提供跨团队可见性与审计证据,而电子表格不能。

教程/实践部署/工程

推荐理由:这不是另一篇泛泛的治理框架文章,它把合规差距直接映射到路由架构上,三张对比表格比政策文档更有用,做 LLM 平台或 infra 的团队值得对照检查自己的堆栈。
08:14
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选84
GLM-5.2 开源模型发布:744B 参数,1M 上下文,可本地运行

Z.ai 发布 GLM-5.2,开源 744B 参数(40B 活跃),1M 上下文窗口,性能与 Claude 4.8 Opus、GPT-5.5、Gemini 3.1 Pro 持平。通过 Unsloth 动态量化,2-bit GGUF 版本内存需求降至 239GB(-84%),1-bit 版降至 217GB(-86%),可运行于 256GB 统一内存 Mac 或 1×24GB GPU+256GB RAM。提供非思考、高、最大三种思考模式。评测显示动态 1-bit 准确率约 76.2%,2-bit 约 82%。

GitHub开源生态教程/实践部署/工程
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:Unsloth 这篇操作指南把 GLM-5.2 从「只能仰望」变成了「可以在自家 256GB Mac 上跑」,动态量化让 744B 参数模型降到了 239GB 磁盘占用,对想上手本地最强开源模型的人,这一步正好踩在从 curiosity 到可用的临界点上。
08:01
Simon Willison 博客
60
Moebius 0.2B图像修补模型借助Claude Code移植到浏览器运行

Moebius 0.2B轻量级图像修补模型(自称10B级性能)原依赖PyTorch与NVIDIA CUDA。Simon Willison使用Claude Code将其转换为ONNX格式,通过WebGPU后端在浏览器中运行。用户可上传图片、标记待修复区域,点击按钮等待模型修补。移植后的1.24 GB ONNX模型权重发布至Hugging Face,前端代码托管于GitHub Pages并启用自动部署。整个移植过程(含环境准备、模型转换、UI构建、部署)在Claude Code辅助下完成,作者还使用Claude.ai进行可行性调研。

Hugging Face教程/实践端侧编码
02:16
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选58
Codex 用于长期工作:最大化效能实践

OpenAI 发布白皮书,由 Jason Liu 介绍使用 Codex 作为持久工作空间的策略。Codex 可保留上下文、管理复杂工作流,并帮助在长期项目中维持进展。文中讲解了如何将宏大目标分解为可验证的步骤、保持工作流连续性,以及判断何时将执行委托给 Codex 何时需要人工监督。该指南旨在支撑超出单次提示词范围的持续工作。

智能体OpenAI教程/实践编码

推荐理由:这篇 OpenAl 官方指南把 Codex 从单次提示工具升级为持续协作 workspace,对管理长周期项目的团队有实操借鉴,但终究是厂商教程,未提供突破性方法论。
01:08
Google Developers Blog(RSS)
精选56
Google ADK 与 A2A 协议:跨语言多智能体团队构建实战

一篇技术博客展示了如何用 Google Agent Development Kit (ADK) 与 Agent2Agent (A2A) 协议搭建跨语言多智能体流水线:Python agent 调用 Gemini 解析合同条款,Go agent 用纯确定性逻辑校验合规性。A2A 协议通过 Agent Card 实现能力发现、JSON-RPC 2.0 完成通信、Task 状态机管理任务生命周期;ADK 的 RemoteA2aAgent 抽象可将任意 A2A 兼容服务封装成本地子智能体。文中强调将单体提示词分解为专业化微智能体,以解决上下文退化、故障爆炸半径和不可测试性问题。完整源码已在 GitHub 发布。

智能体GoogleMCP/工具教程/实践

推荐理由:Google 这篇教程把跨语言多智能体协作说得很实,A2A 协议像代理世界的 HTTP,不过整套方案还是绑在 Google 生态上,自己玩的话迁移成本不低。
6月22日
19:30
公众号:卡尔的AI沃茨
65
字节小云雀短剧 Agent 2.0 上线:Seedance 2.0 Mini 模型降价,新增720度场景与3D导演台

字节旗下小云雀短剧 Agent 2.0 上线,核心升级包括 Seedance 2.0 Mini 模型(价格更低)及 720 度场景观看、3D 导演台(可摆放 3D 人偶设定角色位置与机位)等功能。资产库根据剧本生成详细提示语,支持多角色形象切换。单个镜头时长 1-10 秒,生成 15 秒视频约需 4-5 分钟,自带字幕可抹除。用户可用约三百元成本完成一集短剧,支持片段续接和首尾帧参考,最终一键导出到剪映。该工具旨在降低原创短剧制作门槛,尤其适合规则类、多场景反转等题材。

图像生成教程/实践视频
15:08
Hacker News 热门(buzzing.cc 中文翻译)
62
微调 Qwen 3:0.6B 实现家庭问题分类,准确率从 10% 提升至 92%

一个个人项目通过微调仅 600M 参数的 Qwen 3:0.6B 模型,将其作为家庭问题分类器。基线测试中,仅靠提示词的原始模型在 131 条测试中仅正确分类 13 条(约 10%)。使用 Unsloth 框架和 QLoRA 微调后,准确率提升至 79%。进一步将分类标签改为无语义重叠的两字符不透明 ID(如 hvac 改为固定代码),准确率升至约 92%。训练数据集约 850 条,按 70/15/15 分割。项目同时使用 Qwen 3:4B 作为通用问答模型。

推理教程/实践数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
69
智能体AI搭便车指南:从基础到系统

本书是构建自主AI系统的全栈实践参考。前半部分涵盖LLM基础(Transformer、GPU系统、SFT/LoRA/MoE训练、模型压缩、推理优化)及对齐与推理层(RLHF、PPO/DPO/GRPO、奖励建模、链式推理与测试时扩展)。后半部分专注智能体AI:智能体训练与轨迹RL、RAG与Agentic RAG、记忆系统、设计模式、MCP与A2A协议、多智能体架构,以及开发框架、UI设计、评估与生产部署。每章配理论基础、实现指南、代码示例和原始文献。

智能体教程/实践
07:36
MarkTechPost(RSS)
58
AI智能体记忆的七种类型:技术指南

大语言模型默认无状态,构建智能体需借助记忆机制。七种记忆类型包括:工作记忆(上下文窗口内临时存储提示词、消息、工具输出)、语义记忆(长期存储用户偏好、事实)、情节记忆(记录过去事件与任务结果用于经验学习)、程序记忆(存储技能、工作流与行为规则)、外部/检索记忆(通过向量数据库在推理时拉取信息,即RAG)、参数记忆(嵌入模型权重中的世界知识与推理模式)、前瞻记忆(记忆未来意图与计划目标)。每种记忆对应不同时间尺度与实现方式,组合使用可构建更强的自主智能体系统。

智能体教程/实践部署/工程
6月21日
18:06
Hacker News 热门(buzzing.cc 中文翻译)
53
PRINCE:拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台

拜耳与Thoughtworks合作开发了云端平台PRINCE,利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由,通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制,显著提升数据可访问性与研究效率,同时确保治理与合规。

智能体检索增强教程/实践部署/工程
13:00
公众号:腾讯元宝
精选64
腾讯元宝父亲节活动:上传照片生成与年轻爸爸的合影

腾讯元宝推出父亲节主题活动,用户可选择爸爸年轻时照片与自己的照片,输入提示词(如“帮我生成一张和爸爸的合影,将图2的我融合到图1爸爸的照片中,我想穿越回__年前,和他一起_____;保留爸爸照片的背景、动作及五官;人物姿态自然协调,整体光线与色调保持一致”),元宝即可生成合影。活动旨在让用户“回到过去”看到爸爸的青春模样。

图像生成教程/实践

推荐理由:元宝的父亲节营销,但合影生成指令写得具体可复现,比普通AI写真教程更接地气,父亲节想整活的可以直接抄作业。
6月20日
17:25
MarkTechPost(RSS)
68
如何使用TimeCopilot构建预测流水线:基础模型与自动异常检测

本教程使用TimeCopilot构建端到端预测工作流。安装TimeCopilot等库后,加载AirPassengers数据集及合成季节序列(注入三处异常)。配置统计模型(AutoARIMA、AutoETS、SeasonalNaive、Theta)、Prophet和基础模型(Chronos,根据GPU选用amazon/chronos-bolt-small或tiny,可选TimesFM)。通过滚动交叉验证和RMSE等指标评选最优模型,生成概率预测与预测区间,可视化未来趋势并检测异常值。可选LLM智能体自动选择模型并输出分析响应。

开源/仓库教程/实践数据/训练
10:52
TechCrunch:AI(RSS)
63
如何在 Google Docs 中关闭 AI 弹窗

Google Docs 中出现的 Gemini 弹窗可通过两种方式关闭。一是点击文档顶部菜单栏的 Gemini,在下拉菜单中选择 “bottom bar preferences” 并关闭底部栏。二是通过 Gmail 设置:点击齿轮图标进入 “See all settings”,找到 “Google Workspace smart features” 并管理开关,关闭 Workspace 智能功能(包括 Docs 中的 Gemini 弹窗)。该方法可统一禁用多个 AI 功能,避免逐一关闭。

Google教程/实践
04:26
OpenRouter:Announcements(RSS)
精选59
OpenRouter vs Portkey:你的团队该选哪个LLM网关?

OpenRouter是托管路由网络,买credits后通过一个API路由至70+供应商,自动故障转移,无需自有密钥;覆盖300+模型(含20+免费),按用量收费(零加成+5.5%平台费,首100万免费),支持零数据保留和欧盟路由。Portkey是AI控制平面(2026年被Palo Alto收购),置于用户密钥之上,增加治理、提示管理、护栏和可观测性;提供1600+ LLM统一API,按日志计费(Developer免费,Production $49/月),支持HIPAA、SSO、私有部署。两者均可组合使用。

教程/实践部署/工程

推荐理由:OpenRouter自己下场写对比,虽然立场明显,但对「路由网络 vs. 控制平面」的定位拆解很清晰,选网关的时候可以当决策清单看。
00:53
GitHub Blog
52
GitHub 构建内部数据分析智能体 Qubot,基于 Copilot 实现自然语言查询

GitHub 内部开发了 Qubot,一个由 Copilot 驱动的数据分析智能体。员工可以用自然语言直接提问公司数据,无需编写 SQL 或使用 BI 工具。团队在构建过程中积累了关于设计、集成和用户体验的经验。

智能体GitHub教程/实践数据/训练
6月19日
22:53
Hacker News 热门(buzzing.cc 中文翻译)
66
前OpenAI研究员搭建紧邻办公桌的机器人研究平台

一位前OpenAI机器人研究员用不到€5,000搭建了一套桌面机器人操控实验平台,包括UFACTORY xArm Lite 6工业级机械臂、Intel RealSense D405腕部摄像头、Logitech C920桌面摄像头和3Dconnexion SpaceMouse无线遥操作设备。整套系统置于办公桌旁,通过自研Python软件栈控制。作者计划在未来数月开展独立研究,并以公开研究日志形式记录实验过程、失败与经验,不预设产出论文或开源代码。

OpenAI具身智能教程/实践
13:29
Hacker News 热门(buzzing.cc 中文翻译)
精选73
我们在 Elasticsearch 上构建了一个持久化代理内存层,其召回率为0.89

Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。

智能体GitHubMCP/工具教程/实践

推荐理由:Elastic 把这套代理记忆架构连同评估数据一次性放出来,三种记忆类型、混合召回、衰减和隔离全挤在一个查询里,做 Agent 持久记忆的开发者可以直接抄,召回 0.89 的工程决策讲得清楚。
10:56
MarkTechPost(RSS)
精选75
Salesforce CodeGen教程:生成、验证并重排序Python函数(含单元测试与安全检查)

本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型(支持350M、2B、codegen2-1B、codegen25-7b等版本),通过自然语言提示生成Python函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力,不仅完成代码补全,还能评估、筛选和组织生成结果。

Hugging Face开源生态教程/实践编码

推荐理由:这篇教程把CodeGen从单纯补全变成一个带安全检查、单元测试和候选重排序的工程化代码生成管道,读完能直接套用到日常写代码里,对想落地的开发者非常友好。
10:10
公众号:腾讯元宝
48
腾讯元宝端午图像编辑:粽叶头套指令说明

用户发布多组详细提示词,要求保留原图主体及背景,仅对宠物、人物、表情包、企鹅等对象添加真实风格的绿色粽叶头套或指套。指令强调粽叶需具备叶脉、折痕、色差、翘边和自然阴影,用红白细绳或草绳固定并在下巴处松松打结,整体效果类似手机随手拍的真实照片,避免卡通感、头盔感和过度规整。每段提示词均独立指定保留原图和比例,不改变原表情或姿势。

图像生成教程/实践
09:57
Hacker News 热门(buzzing.cc 中文翻译)
51
从 GNU Stow 迁移到 Chezmoi

作者曾在多台 Mac 上用 GNU Stow 管理 dotfiles,但符号链接导致仓库脏工作树和引导新机时的文件冲突。后改用 Chezmoi:以 ~/.local/share/chezmoi 为源目录,chezmoi add 按 home 目录结构命名(dot_ 前缀代替前导点),chezmoi apply 写入真实文件而非符号链接,避免自动回写。支持 private_ 权限控制、.tmpl Go 模板以及 .chezmoiscripts 下的 macOS 初始化脚本。目前跟踪 zsh、git、shellcheck、ghostty、GitHub CLI 的配置,以及 Claude Code 的 settings.json、Codex 的 config.toml 和 dot_agents/skills 下的 agent skill 文件,并用三个 gitconfig 按目录分离工作/个人身份。

教程/实践部署/工程
09:27
OpenRouter:Announcements(RSS)
精选55
如何将 SillyTavern 连接到 OpenRouter(2026 指南)

一个 OpenRouter API 密钥即可在 SillyTavern 的下拉菜单中解锁 300 多个模型,其中许多免费。指南包含五步连接流程、推荐尝试的角色扮演模型以及常见错误的修复方法。

教程/实践

推荐理由:如果你用 SillyTavern 玩角色扮演,这篇官方教程能让你五分钟接上 300+ 模型,但本身只是基础操作指南,没给出新认知。
09:27
OpenRouter:Announcements(RSS)
精选60
OpenClaw 接入 OpenRouter

OpenClaw 已内置 OpenRouter 支持,一条命令即可为 AI 智能体配置统一密钥、统一账单,并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。

智能体教程/实践部署/工程

推荐理由:给用 OpenClaw 搭 agent 的人一个直接可用的集成指南,还附带了常见报错修复,比零散摸索省时间。
03:53
Hacker News 热门(buzzing.cc 中文翻译)
61
Hermes 迁移工具:从 OpenClaw 导入配置

hermes claw migrate 命令可将 OpenClaw(及遗留的 Clawdbot/Moldbot)配置导入 Hermes,包括角色(SOUL.md)、工作区指令(AGENTS.md)、长期记忆、用户画像、技能(来自 4 个来源)、默认模型、自定义提供商及 API 密钥等。迁移前会展示完整预览并确认。支持 --dry-run 预览、--preset full 全量迁移(API 密钥需额外指定 --migrate-secrets)、--overwrite 覆盖冲突、--no-backup 跳过备份等选项。默认读取 ~/.openclaw/,旧版目录自动检测。技能冲突可设为跳过、覆盖或重命名。迁移前自动创建 ~/.hermes/backups/ 备份,可用 hermes import 恢复。

智能体MCP/工具教程/实践
03:18
Cloudflare Blog
52
Cloudflare 发布多阶段漏洞发现工具,详解对抗性审查与上下文绕过技术

Cloudflare 分享了其多阶段漏洞发现工具的技术架构,包含自动化分类循环。该系统通过管理状态控制、引入对抗性审查来压制误报,并围绕 LLM 上下文窗口限制设计路由策略。

安全/对齐教程/实践部署/工程
03:16
Google Developers Blog(RSS)
48
Google 庆祝A2A协议发布一周年:协作智能体生态

Google 庆祝Agent-to-Agent(A2A)协议发布一周年。A2A专为生成式AI设计,相比传统REST API提供安全边界、零上下文污染、动态自主性和工作负载分布四大架构优势。应用实例FoldRun是一个独立的智能体接口,可在Gemini Enterprise或Gemini CLI等A2A兼容环境中部署,自动管理蛋白质结构预测任务,动态选择AlphaFold 2、OpenFold 3或Boltz-2等模型,无需自定义胶水代码。

智能体Google教程/实践部署/工程
01:51
Claude:Blog(网页)
精选72
驾驭 Claude Code:CLAUDE.md、技能、钩子、规则、子智能体等

Claude Code 提供七种自定义指令方式:CLAUDE.md(根目录始终加载,子目录按需加载)、规则(无范围或路径范围)、技能(按需调用,共享 token 预算)、子智能体(隔离上下文运行并返回最终消息)、钩子(生命周期事件触发,绕过压缩)、输出样式(注入系统提示,永不压缩)和附加系统提示(CLI 标志,仅单次有效)。每种方式在加载时机、压缩行为、上下文成本和适用场景上各有不同,例如 CLAUDE.md 适合存放构建命令与编码规范,路径范围规则避免无关上下文消耗,子智能体用于并行隔离任务,钩子用于确定性自动化(如运行 linter 或备份聊天记录)。

AnthropicMCP/工具教程/实践编码

推荐理由:如果你用Claude Code,这篇把定制化方法讲透了,从何时用技能到何时用钩子,比扒拉文档高效得多。
6月18日
23:47
Hugging Face:Blog(RSS)
精选70
超越 LoRA:如何选择最佳参数高效微调技术?

参数高效微调(PEFT)技术中,LoRA 占据绝对主导:Hugging Face Hub 上 20,834 张提及单一 PEFT 技术的模型卡中 20,509 张指向 LoRA(98.4%);外部站点 10,000 个检查点中 95.0% 是 LoRA;GitHub 搜索 from peft import 代码片段的 71.3% 结果为 LoRA。但研究者宣称其他技术超越 LoRA 的论文结果具备偏向性——调整学习率即可让 LoRA 匹配更优技术。Hugging Face 的 PEFT 库提供统一 API 实现 40 余种 PEFT 技术,并开始建立基准测试:在数学数据集上对 LLM 进行思维链推理微调,以帮助用户做出更优选择。

Hugging Face教程/实践数据/训练

推荐理由:HuggingFace 的 PEFT 团队用公平基准把 LoRA 拉下神坛,图像生成任务上 OFT 表现更好,而且切换只需改一行配置。对微调选型有实打实的参考价值,但数据集有限,别全信。
21:47
Hugging Face:Blog(RSS)
精选74
AI 智能体够格吗?在自有工具上评测开源模型

Hugging Face 发布面向 AI 智能体使用场景的基准测试框架,以 transformers 库为案例评估库的智能体友好度。框架使用 pi coding agent 与开源模型驱动,通过 Hugging Face Jobs 分散任务确保硬件一致。评估关注 agent 完成任务的成本、延迟、token 使用量和失败率,而非仅最终结果。此前 hf CLI 经优化后 agent token 使用量减少 1.3-1.8 倍(最高 6 倍),该框架旨在验证类似优化对 transformers 的效果。

智能体Hugging Face开源/仓库教程/实践

推荐理由:Hugging Face 这波实验打破了我的直觉——为大型模型优化的 CLI+Skill 方案反而让小模型正确率暴跌,做 agent 工具链的人应该马上看这个标杆。
16:14
IT之家(RSS)
40
小米汽车详解超级电机 V8s EVO:AI 拓扑优化实现 28000rpm 高转速

小米超级电机 V8s EVO 最高转速 28000rpm,借助 AI 拓扑优化模拟超 100 万种硅钢片结构,无需碳纤维缠绕即扛住离心力,单电机输出 611PS。自研碳化硅功率模块支持 800A 有效电流,电控峰值功率密度 120kW/L,电机功率提升 5.9%。峰值效率 98.38%,0.15mm 超薄硅钢片使铁损降 18.7%,X-Pin 绕组降铜损 3.6%,为 YU7 GT 带来 6.4km CLTC 续航提升。双电机(V8s EVO + V6s Plus)合计 1003PS,极速 300km/h,0-100km/h 加速 2.92 秒。经济模式前电机脱开可额外增加 20km CLTC 续航。

教程/实践数据/训练部署/工程
12:00
公众号:龙猫LongCat(美团)
59
美团智能创作团队海报生成技术体系:PosterCraft/PosterOmni/PosterReward

美团智能创作团队构建了覆盖“生成—编辑—评判”全链路的海报生成技术体系。PosterCraft(ICLR 2026)通过四阶段级联优化实现端到端高美感海报生成,文字渲染准确率接近顶级闭源商业系统;PosterOmni(CVPR 2026)以单一统一模型覆盖扩图、补全、比例调整、风格迁移等六类设计任务;PosterReward(CVPR 2026)是首个专门面向海报质量的奖励模型,在专项评测基准上达86%准确率。三者相互协同,已全部开源至MeiGen-AI仓库,并在美团外卖套餐图生成、品牌IP袋鼠团团等业务中落地。

图像生成开源生态教程/实践评测/基准
09:45
MarkTechPost(RSS)
64
NVIDIA SkillSpector 指南:使用静态分析和 SARIF 报告扫描 AI 技能安全风险

教程使用 NVIDIA SkillSpector 通过静态分析和 SARIF 报告评估 AI 技能安全风险。构建了包含 safe-formatter、env-harvester、code-exec 和 prompt-injector 四个演示技能的语料库,涵盖良性行为和故意植入的漏洞(环境变量泄露、动态代码执行、提示词注入)。通过 LangGraph 工作流扫描,输出风险评分和 SARIF 格式结果,用 pandas 整理发现。教程还演示了可视化严重性分布、导出 SARIF、扩展自定义分析器以及可选的 LLM 语义分析。

安全/对齐教程/实践
09:43
TechCrunch:AI(RSS)
59
如何在Google Docs中关闭AI

Google Docs中Gemini弹窗可通过点击顶栏“Gemini”并选择“底部栏偏好”关闭底部AI栏。更彻底的方案是进入Gmail设置,在“查看所有设置”中找到“Google Workspace智能功能”,关闭相关开关,即可禁用Gemini弹窗及其他AI建议(如光标处的“help me write”)。

Google教程/实践
‹ 上一页
1234…13
下一页 ›