AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
6月6日周六
06:47Hugging Face:Blog(RSS)74精选用Qwen2.5-3B构建多智能体经济体:工程报告
04:51Hacker News 热门(buzzing.cc 中文翻译)46Ask HN:您的AI开发技术栈/工作流程是怎样的?
03:34Claude:Blog(网页)76同事件精选Claude Cowork 产品指南同一事件,精选展示《Claude Cowork 入门最佳实践》
02:33Claude:Blog(网页)59Anthropic销售人员用Claude Code重建团队工作流
00:21Hacker News 热门(buzzing.cc 中文翻译)49程序员会为Claude编写文档,但不会为彼此编写
6月5日周五
23:26Suno:Blog(网页)64精选Suno Voices 使用指南:6 个技巧打造高质量人声录制
21:20Hacker News 热门(buzzing.cc 中文翻译)51对大型语言模型进行微调,使其文档风格像1995年
20:30公众号:卡尔的AI沃茨48OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9
19:27MarkTechPost(RSS)61Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体
09:00公众号:千问APP(阿里)62精选千问联合人民日报健康发布《2026 AI健康助手使用指南》
06:54MarkTechPost(RSS)56基于ResearchMath-14k数据集构建语义搜索引擎与开放状态分类器
00:53LMSYS:Blog(Chatbot Arena 团队)77精选Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务
6月4日周四
21:42Hugging Face:Blog(RSS)75精选Nemotron 3.5 ASR:为你的语言、领域或口音进行微调
21:07公众号:百度智能云(文心)35百度伐谋助力北京工业大学攻克三大科研难题
03:18MarkTechPost(RSS)62如何使用Workers、Functions和Cron Triggers通过iii构建文档智能后端
02:23Claude:Blog(网页)76精选Claude Cowork 入门最佳实践
01:23Claude:Blog(网页)68精选Claude Code技能使用经验:Anthropic内部实践
01:23Claude:Blog(网页)73精选Anthropic 用 Claude 赋能自助数据分析
6月3日周三
22:07Hacker News 热门(buzzing.cc 中文翻译)58每个字节都至关重要
21:41Hugging Face:Blog(RSS)55精选DharmaOCR 利用 DPO 将文本退化率降低 59.4%
21:34Google Blog:AI(RSS)50Google Search 提升二手和复古购物体验的5种方式
20:54Artificial Intelligence News(RSS)36E.ON 借助 SAP S/4HANA 以 AI 现代化电网
17:28公众号:数字生命卡兹克63精选提前触发窗口让 Codex/Claude Code 额度翻倍的小技巧
14:37Hacker News 热门(buzzing.cc 中文翻译)64在 AMD MI300X 上运行 DeepSeek-V4-Flash
13:38公众号:火山引擎64精选Vibe Creating:让创作回归「表达」本身
12:06Hacker News 热门(buzzing.cc 中文翻译)51我们如何为RAG建立图像索引
10:02公众号:数字生命卡兹克66同事件精选Claude Code团队工程总监分享5条AI原生工作原则同一事件,精选展示《Claude Code团队实践:智能体编程如何重塑工程组织与流程》
09:16MarkTechPost(RSS)64如何在 Google Colab 上使用 QLoRA 和 DPO 微调 LFM2:完整分步编码教程
6月2日周二
19:32公众号:卡尔的AI沃茨56360安全龙虾云端版:龙虾教练可将GitHub项目拆解为垂直Agent
12:56Simon Willison 博客55粘贴文件编辑器
09:42MarkTechPost(RSS)59使用 NVIDIA Apex (FusedAdam, FusedLayerNorm) 和 torch.amp 加速 Transformer 训程程
08:00HuggingFace Daily Papers(社区热门论文)53Prompt-Level Distillation:无需微调的模型推理效率提升方法
02:33Hacker News 热门(buzzing.cc 中文翻译)10斯坦福大学CS336课程人工智能代理指南
01:26Google Blog:AI(RSS)42谷歌员工如何使用 Gemini 制作 Google I/O 2026
01:03Hacker News 热门(buzzing.cc 中文翻译)52CS336:从零开始的语言建模
6月1日周一
20:22公众号:卡尔的AI沃茨64LibTV推出3D导演台:用3D构图节点精确控制AI图片/视频中的人物空间关系
18:33Hacker News 热门(buzzing.cc 中文翻译)64一台10年前的至强处理器就足够了
04:25MarkTechPost(RSS)63微软智能体治理工具包实现:通过策略、审批、审计日志与风险控制实现安全AI智能体工具调用
00:15Hacker News 热门(buzzing.cc 中文翻译)70精选我花200英镑把一台数据中心级GPU装进了我的游戏电脑
5月31日周日
09:49MarkTechPost(RSS)65使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
06:47
Hugging Face:Blog(RSS)
精选74
用Qwen2.5-3B构建多智能体经济体:工程报告

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。

智能体Hugging Face教程/实践部署/工程

推荐理由:我觉得这是近期最诚实的小模型工程复盘,把为什么不换大模型、怎么靠提示修正推理、怎样设计系统稀缺性讲透了,比看十篇论文有实操价值。
04:51
Hacker News 热门(buzzing.cc 中文翻译)
46
Ask HN:您的AI开发技术栈/工作流程是怎样的?

Hacker News 上一个讨论帖询问开发者们使用的AI开发技术栈与工作流程,目前获得101个点赞。

智能体教程/实践编码
03:34
Claude:Blog(网页)
同事件精选76
Claude Cowork 产品指南

Anthropic 发布 Claude Cowork,一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作,执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具,支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵(对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作)、设置要求、权限模型、七种常见工作流(如研究简报、会议准备、定期报告)以及营销和产品管理等插件。

智能体AnthropicMCP/工具教程/实践
同一事件,精选展示《Claude Cowork 入门最佳实践》
推荐理由:把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理,这份官方指南给出了明确上手路径和七个真实工作流,做产品、做调研的都能直接照抄。
02:33
Claude:Blog(网页)
59
Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体AnthropicMCP/工具教程/实践
00:21
Hacker News 热门(buzzing.cc 中文翻译)
49
程序员会为Claude编写文档,但不会为彼此编写

Hacker News 上的一篇博文指出,程序员愿意为Claude编写文档,却不愿意为其他程序员编写文档。

Anthropic教程/实践编码
6月5日
23:26
Suno:Blog(网页)
精选64
Suno Voices 使用指南:6 个技巧打造高质量人声录制

Suno Voices 面向 Web 付费用户开放。提升人声质量的 6 个技巧:在安静环境录音以减少背景噪音;先练习歌词再正式录制;不必追求完美,保留真实情感;录音时长尽量超过 1 分钟以提供更多学习素材;将人声匹配到合适的音乐流派(如民谣、流行、死亡金属、波萨诺瓦等);敢于尝试不同风格以发现惊喜。这些技巧旨在帮助用户获得更个性化、表现力更强的声音效果。

教程/实践语音

推荐理由:Suno 官方出的 Voices 录制避坑指南,不是大新闻,但照着做能让你克隆的声音干净不少,尤其是安静环境和别怕走音那两条,做音乐的朋友可以直接收藏。
21:20
Hacker News 热门(buzzing.cc 中文翻译)
51
对大型语言模型进行微调,使其文档风格像1995年

通过微调,让大型语言模型(LLM)生成具有1995年风格的文档。项目来自 passo.uno,于 2026 年 6 月 5 日在 Hacker News 上获得 103 点热度。

教程/实践数据/训练
20:30
公众号:卡尔的AI沃茨
48
OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9

OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。

智能体MCP/工具教程/实践
19:27
MarkTechPost(RSS)
61
Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体

一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。

智能体Microsoft教程/实践部署/工程
09:00
公众号:千问APP(阿里)
精选62
千问联合人民日报健康发布《2026 AI健康助手使用指南》

千问联合人民日报健康共同发布业内首份《2026 AI健康助手使用指南》,由北京协和医院、积水潭医院、广安门医院等20位主任医师参与审核。指南基于千问每天回应数千万次健康咨询的真实经验,将AI在健康生活中的核心价值归纳为五个角色:日常预防的健康管家、症状判断的安全守门人、就医过程的就诊小助手、读懂报告的健康档案员、康复与情绪的陪伴者。千问提醒,AI不能替代医生,出现紧急情况需直接就医。

教程/实践

推荐理由:千问和人民日报健康搞的这份指南,协和、积水潭等20位主任医师参与审核,把AI在健康咨询里能干什么梳理得很清楚,普通人有小毛病时知道怎么问、什么时候该直接去医院,实用。
06:54
MarkTechPost(RSS)
56
基于ResearchMath-14k数据集构建语义搜索引擎与开放状态分类器

该教程展示了面向研究级数学问题的完整NLP流水线:利用ResearchMath-14k数据集,通过TF-IDF提取领域关键词、生成句子嵌入,使用UMAP进行问题景观可视化,并结合K-Means聚类。进一步构建语义搜索引擎,训练分类器预测每个问题的开放状态,并基于相似性发现近似重复问题。

搜索教程/实践数据/训练
00:53
LMSYS:Blog(Chatbot Arena 团队)
精选77
Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务

Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数,基于 Qwen3-4B 骨干,支持 100 种语言(内部评测覆盖 111 种),在 Seed-TTS、CV3、MiniMax-Multilingual 及 Higgs-Multilingual 零样本语音克隆任务中达到单字级 WER/CER。开发者可通过文本内控制标签实时调整情感(20+种)、风格、韵律(语速/音高/停顿)及音效。模型支持流式合成,文本未完整时即可开始生成语音并保持一致性。SGLang-Omni 专为多阶段生成模型设计,统一调度 AR 解码与轻量计算,实现低延迟推理。

开源/仓库教程/实践语音部署/工程

推荐理由:Higgs v3 把多语言和实时可控制整合进一个流式 TTS 模型,SGLang-Omni 为它搭好了多阶段推理的底座,做语音 Agent 的可以直接抄作业,这比多数论文落地快半拍。
6月4日
21:42
Hugging Face:Blog(RSS)
精选75
Nemotron 3.5 ASR:为你的语言、领域或口音进行微调

Nemotron 3.5 ASR 是一个 600M 参数的多语言流式语音识别模型,单个检查点覆盖 40 种语言-地区(含英、西、德、法、意、日、韩、中、阿拉伯等)。采用 Cache-Aware FastConformer 编码器与 RNNT 解码器,缓存内部状态避免重复计算,实现低延迟流式转录且不损失精度。模型原生输出带标点和大写的生产级文本,无需后处理。支持指定语言(target_lang=es-ES)或自动语言检测(target_lang=auto)。通过注意力上下文大小(att_context_size)可在推理时直接调节延迟-准确率权衡,范围从 80ms 到 1.12s,无需重新训练。模型以 NeMo 检查点形式发布,可用于微调以适配特定语言、领域或口音。

教程/实践语音

推荐理由:一个模型搞定40种语言的实时语音转文字,NVIDIA还给了完整微调代码和实测数据,做语音Agent和字幕的可以照着抄作业。
21:07
公众号:百度智能云(文心)
35
百度伐谋助力北京工业大学攻克三大科研难题

北京工业大学苗扬团队借助百度伐谋(全球首个可商用自我演化决策智能体),在三个高可靠性科研场景实现突破:空间站色谱柱构型优化中,72小时演化出新构型,归一化误差降低8.17%,体积缩小40%,分离效率提升3倍;PEM电解槽故障检测准确率从92.26%提升至95.04%,综合评分升至0.9383,建模周期从数天压缩到小时级;旋转机械故障诊断准确率从98.9055%提升至99.9877%,预测误差降至原来1%,参数量下降34%。科研人员用自然语言描述目标和约束,伐谋自动演化逼近全局最优解。

智能体教程/实践
03:18
MarkTechPost(RSS)
62
如何使用Workers、Functions和Cron Triggers通过iii构建文档智能后端

一篇教程介绍如何通过注册模块化函数,并在Workers、Functions和Cron Triggers等多个触发器间复用这些函数,使用iii构建文档智能后端。该文章展示了模块化注册与跨触发器复用的核心方法。

教程/实践部署/工程
02:23
Claude:Blog(网页)
精选76
Claude Cowork 入门最佳实践

Anthropic 增长营销负责人 Austin Lau 介绍了非技术知识工作者使用 Claude Cowork 的最佳实践。Claude Cowork 是面向文档、电子表格等多步骤任务的 AI 助手,用户无需编程技能,将其指向文件夹或连接已有应用即可委托任务。与用于快速问答和头脑风暴的 Chat 以及面向开发者的 Claude Code 不同,Claude Cowork 适用于需要产出交付物、涉及多个文件或应用、可重复执行的场景。Lau 给出了判断任务是否适合的五项检查清单,并预告将于6月4日分享具体营销用例。

Anthropic教程/实践

推荐理由:Anthropic 官方教你如何把 Claude Cowork 用到极致,从每日摘要到自动报表,非技术人员看完就能上手,比自己硬摸索省十倍时间。
01:23
Claude:Blog(网页)
精选68
Claude Code技能使用经验:Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills(技能)功能的经验。Skills 是指令、脚本和资源的文件夹,智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能,它们可归为九类,包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别,涵盖过多功能会混淆智能体。团队发现,投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体AnthropicMCP/工具教程/实践

推荐理由:这不是产品公告,而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶,这9类技能和‘gotchas’章节至少省你三个月踩坑。
01:23
Claude:Blog(网页)
精选73
Anthropic 用 Claude 赋能自助数据分析

Anthropic 使用 Claude 自动化了 95% 的业务分析查询,整体准确率约 95%。其关键在于构建智能体分析栈(agentic analytics stack),通过数据基础层、维护验证流程和技能(skills)分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景,数据分析的难点在于将用户问题映射到正确的数据实体,而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。

智能体Anthropic教程/实践数据/训练
关联讨论 1 条X:Claude Devs (@ClaudeDevs)
推荐理由:Anthropic 把内部用 Claude 搞自助分析踩过的坑全摊开,技能模板和「语义层优先」的强制流程是实打实的干货,做数据 agent 的团队可以直接抄作业。
6月3日
22:07
Hacker News 热门(buzzing.cc 中文翻译)
58
每个字节都至关重要

文章标题为《Every Byte Matters》,来自 fzakaria.com,讨论字节级优化的重要性。

教程/实践编码
21:41
Hugging Face:Blog(RSS)
精选55
DharmaOCR 利用 DPO 将文本退化率降低 59.4%

4月发布的DharmaOCR(结构化OCR模型)在巴西葡萄牙语文档提取任务中,使用直接偏好优化(DPO)作为监督微调(SFT)后的第二训练阶段。SFT无法直接惩罚文本退化(重复循环),而DPO以模型自身失败输出(退化循环)作为负样本进行偏好训练,使所有测试模型族的文本退化率平均降低59.4%,最高达87.6%(如Nanonets-OCR2-3B从1.61%降至0.20%)。传统DPO多用于聊天对齐,该工作将其扩展至客观的OCR任务,证明DPO可针对性修复特定失败模式。

Hugging Face教程/实践数据/训练

推荐理由:DPO 不只能对齐,这篇直接用模型自身的垃圾输出当反例,把 OCR 的重复错误平均降了 59%。思路不复杂,但告诉做结构化生成的工程师:训练数据里最该保留的就是模型犯的错。
21:34
Google Blog:AI(RSS)
50
Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google多模态搜索教程/实践
20:54
Artificial Intelligence News(RSS)
36
E.ON 借助 SAP S/4HANA 以 AI 现代化电网

德国能源巨头 E.ON 通过 SAP S/4HANA 标准化电网数据,进而现代化基础设施并部署 AI 应用。E.ON 管理能源电网、客户解决方案和能源基础设施解决方案三个领域,维持运营需要持续的 IT 硬件与软件资本支出。公司领导层最初对大规模业务案例存在疑虑。

教程/实践部署/工程
17:28
公众号:数字生命卡兹克
精选63
提前触发窗口让 Codex/Claude Code 额度翻倍的小技巧

Codex 和 Claude Code 的额度限制基于 5 小时滚动窗口:从发送第一条消息开始计时,窗口结束后不会自动重置,需等下次发消息才开启新窗口。提前数小时发送一条短消息,可使重置时间落在工作时段内,从而在核心工作时间获得两个完整窗口。设置方法:Codex 在左侧“自动化”中建每日定时任务;Claude Code 可通过客户端 Routines 或 CLI 版 crontab 配置。注意 5 小时窗口之上还有周额度上限,需合理规划。

AnthropicOpenAI教程/实践

推荐理由:一个很小的窗口重置技巧,但能让你在核心工作时段多拿一倍额度,做 Agent 开发的直接抄自动化设置就好。
14:37
Hacker News 热门(buzzing.cc 中文翻译)
64
在 AMD MI300X 上运行 DeepSeek-V4-Flash

一篇来自 fergusfinn.com 的博客文章,介绍了在 AMD MI300X GPU 上运行 DeepSeek-V4-Flash 模型的过程。

DeepSeek教程/实践部署/工程
13:38
公众号:火山引擎
精选64
Vibe Creating:让创作回归「表达」本身

火山引擎 Seedance 2.0 提出 AI 视频创作新范式 Vibe Creating,核心是让创作者放下技术负担,用故事表达代替复杂 Prompt 参数。该范式强调用富有画面感的语言描述场景、情绪和叙事,模型自行理解意图并完成景别、光影、节奏的诠释,避免过度规定镜头调度。适用于文学作品可视化、影视预演等场景,并配套发布《Vibe Creating 实践手册》及可执行的 Prompt Skill,从创意到高质量提示词一步到位。

教程/实践视频

推荐理由:火山引擎把 Seedance 2.0 的用法提炼成「Vibe Creating」方法论,核心是教人用故事感代替镜头术语,虽然不涉及模型升级,但附带可直接套用的手册和 Skill,做 AI 短视频的可以当成 Prompt 指南。
12:06
Hacker News 热门(buzzing.cc 中文翻译)
51
我们如何为RAG建立图像索引

为解决检索增强生成(RAG)系统处理图像时的挑战,Kapa.ai提出了一种方法。他们使用GPT-4 Vision模型为每张图像生成文本描述。处理流程包括将图片压缩至512×512像素并批量生成描述。最终,这些图像描述与元数据一同存入向量数据库。该方法使RAG能够检索图像内容,实现约70%的检索准确率,且成本极低,每张图片处理成本约0.01美元。

检索增强多模态教程/实践部署/工程
10:02
公众号:数字生命卡兹克
同事件精选66
Claude Code团队工程总监分享5条AI原生工作原则

Claude Code团队工程总监Fiona Fung提出,AI时代软件工程瓶颈从“写代码太贵”转移至验证、评审与安全。团队采用JIT规划,先做原型再补文档;遇到重复工作追问“能否自动化”,形成肌肉记忆。代码评审中Claude承担60-70%风格检查与漏洞捕捉,人类聚焦法律、安全与产品判断。角色边界模糊,PM写代码、工程师用Claude起草文案,招聘看重品味与判断力而非代码产出速度。

智能体Anthropic教程/实践部署/工程
同一事件,精选展示《Claude Code团队实践:智能体编程如何重塑工程组织与流程》
推荐理由:瓶颈从写代码转移到验证,这判断太准了。更实际的是自动化那些重复三次以上的事,这套逻辑正在Claude Code团队验证,值得每个带团队的人照抄。
09:16
MarkTechPost(RSS)
64
如何在 Google Colab 上使用 QLoRA 和 DPO 微调 LFM2:完整分步编码教程

本教程详细介绍了如何在 Google Colab 环境中,使用 QLoRA 和 DPO 方法对 LFM2 模型进行微调。内容涵盖了使用 TRL 和 PEFT 库进行监督微调、DPO 对齐以及适配器合并的完整分步编码过程。

教程/实践数据/训练
6月2日
19:32
公众号:卡尔的AI沃茨
56
360安全龙虾云端版:龙虾教练可将GitHub项目拆解为垂直Agent

360安全龙虾云端版的龙虾教练可通过问答交互(约10轮),将开源项目整合为垂直Agent。以lenny-skills项目(86个产品管理技能)为例,生成了产品经理Agent“张伟”,可理解项目进度、拆解需求,并调用Claude Code和Codex实现AI新闻雷达v0.6版改进(增加AI占比评分、信任打分、事件去重)。另支持对话缓存(5分钟内复用系统提示语和TOOLS)、细粒度权限分级(文件/网络/系统/技能可单独配置本地访问)。

智能体开源生态教程/实践
12:56
Simon Willison 博客
55
粘贴文件编辑器

Simon Willison 开发了“粘贴文件编辑器”工具原型,灵感源于 Claude.ai 能将大段粘贴文本自动转为文件附件的功能。该工具支持粘贴文本、直接打开文件(包括图片缩略图显示)以及拖拽文件。它是由 Codex 桌面版协助构建的。

教程/实践编码
09:42
MarkTechPost(RSS)
59
使用 NVIDIA Apex (FusedAdam, FusedLayerNorm) 和 torch.amp 加速 Transformer 训程程

通过从源码构建 NVIDIA Apex 并检测融合内核,对 Transformer 训练中的关键组件进行基准测试。内容涵盖了 NVIDIA Apex 提供的 FusedAdam 优化器与 FusedLayerNorm 层归一化的性能表现,并将其与 PyTorch 原生的混合精度训练工具 torch.amp 进行了对比。文章旨在实践验证这些工具在提升训练速度方面的具体效果。

教程/实践数据/训练部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
53
Prompt-Level Distillation:无需微调的模型推理效率提升方法

提出 Prompt-Level Distillation (PLD),从 Teacher 模型提取显式推理模式并组织为结构化指令列表,注入 Student 模型的 System Prompt。在 Gemma-3 4B 上,PLD 将 StereoSet Macro F1 从 57% 提升至 90.0%,Contract-NLI 从 67% 提升至 83%,LogiQA 准确率达 70%;在 Mistral Small 3.1 上取得相似结果,验证跨架构泛化能力。PLD 无需微调,推理延迟极低,决策过程透明可人工验证,适合法律、金融、内容审核等监管行业及高吞吐边缘设备。

推理教程/实践论文/研究
02:33
Hacker News 热门(buzzing.cc 中文翻译)
10
斯坦福大学CS336课程人工智能代理指南

斯坦福大学CS336课程发布了关于使用AI代理进行学习和作业的指南,特别针对Claude模型。该指南旨在帮助学生有效利用AI工具,其核心文档可通过GitHub获取。

教程/实践
01:26
Google Blog:AI(RSS)
42
谷歌员工如何使用 Gemini 制作 Google I/O 2026

本文介绍了谷歌员工使用 Gemini 模型来制作 2026 年的 Google I/O 开发者大会。

Google图像生成多模态教程/实践
01:03
Hacker News 热门(buzzing.cc 中文翻译)
52
CS336:从零开始的语言建模

斯坦福大学开设 CS336 课程,教授如何从零开始构建语言模型,涵盖从数据处理、模型训练到部署优化的完整流程。该课程于 2026 年 6 月 1 日公开,在 Hacker News 获得 115 点热度,可通过 cs336.stanford.edu 访问。

安全/对齐教程/实践数据/训练
6月1日
20:22
公众号:卡尔的AI沃茨
64
LibTV推出3D导演台:用3D构图节点精确控制AI图片/视频中的人物空间关系

针对AI图片和视频中多人场景空间关系控制难的问题,LibTV推出3D导演台功能,在画布中嵌入轻量级3D构图节点。用户可添加人体素模、基础几何体、群众阵列,自由移动、旋转、缩放并调整人物关节姿势。支持在同一3D场景中放置多个机位,预设或手动调整视角,截图作为参考图发送到画布,关联人物并编写提示语,即可生成符合构图的图片或视频。还可利用宫格切分工具拆分九宫格分镜,配合视频合成功能连续成短片。该功能避免了用长提示语描述位置关系,提升创作可控性。

图像生成教程/实践视频
18:33
Hacker News 热门(buzzing.cc 中文翻译)
64
一台10年前的至强处理器就足够了

Gemma 4 模型已可在 2016 年的至强处理器上运行。该事实在 Hacker News 上获得关注。

Google教程/实践端侧部署/工程
04:25
MarkTechPost(RSS)
63
微软智能体治理工具包实现:通过策略、审批、审计日志与风险控制实现安全AI智能体工具调用

该实现方案创建了一个可执行的智能体治理工作流。智能体不直接执行工具,其每个操作首先经过一个治理层,该层会检查智能体的身份、信任分数、风险等级、请求的工具、动作类型和敏感性等级等,以确保安全。实现以Colab-ready形式提供,参考了微软的Agent Governance Toolkit。

智能体Microsoft安全/对齐教程/实践
00:15
Hacker News 热门(buzzing.cc 中文翻译)
精选70
我花200英镑把一台数据中心级GPU装进了我的游戏电脑

一名用户以200英镑的价格购入了一块数据中心级GPU,并将其成功安装到自己的游戏电脑中。文章记述了这一非标准硬件改装过程、遇到的技术挑战以及最终实现本地运行大语言模型的体验。

教程/实践端侧部署/工程

推荐理由:一个200英镑的二手 V100 加适配器,就让游戏电脑用上了 32GB 显存,跑 Qwen3.6-27B 达到 32 tok/s,噪音问题也解决了。对于想低成本本地跑大模型的人,这篇 DIY 手记很实用。
5月31日
09:49
MarkTechPost(RSS)
65
使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体

本教程展示如何实现 SkillNet 用例,将其作为一个实用框架,用于发现、安装、检查、评估和组织可重用的 AI 技能,以构建技能增强型 AI 智能体。

智能体MCP/工具搜索教程/实践
‹ 上一页
1…34567…13
下一页 ›