AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 520 条
全部一手资讯X论文
标签「教程/实践」清除
5月6日周三
03:28Claude:Blog(网页)71精选金融服务行业Claude部署指南发布
5月5日周二
23:03Runway:News(网页)55精选60倍速冷启动:将同级GPU视为权重服务器
20:56Hacker News 热门(buzzing.cc 中文翻译)68从零开始训练你自己的大型语言模型
09:56Hacker News 热门(buzzing.cc 中文翻译)67特工技能
05:56Hacker News 热门(buzzing.cc 中文翻译)65OpenAI 如何实现大规模低延迟语音 AI
02:59OpenAI:官网动态(RSS · 排除企业/客户案例)58精选OpenAI 如何大规模交付低延迟语音 AI
01:16Simon Willison 博客75精选Redis 数组类型交互式体验平台上线
5月3日周日
17:49Hacker News 热门(buzzing.cc 中文翻译)65Specsmaxxing--关于克服AI心理障碍,以及我为何用YAML编写规格说明
02:13Simon Willison 博客59观察记录
5月2日周六
04:13Simon Willison 博客60iNaturalist 观察记录聚合浏览工具
01:18Claude:Blog(网页)64精选零基础项目经理借助Claude Code,六周内独立开发并上线压力管理应用
5月1日周五
04:16Claude:Blog(网页)64精选构建企业级AI智能体:领先企业的转型指南
02:15Claude:Blog(网页)64精选Claude Code 构建经验:提示缓存的优化实践
00:13GitHub Blog59精选GitHub Copilot CLI 入门指南:交互模式与非交互模式
4月30日周四
20:00Cursor Blog55精选持续优化智能体工具链:上下文演进与效果评估
08:30公众号:智谱(GLM)47Scaling Pain:智谱GLM超大规模Coding Agent推理实践
03:42Hacker News 热门(buzzing.cc 中文翻译)56让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试
4月29日周三
23:42Hacker News 热门(buzzing.cc 中文翻译)51借助 Opus,我们降低了大型语言模型(LLM)的成本
23:40Claude:Blog(网页)58精选智能体时代的产品开发:Claude Managed Agents 如何解放产品经理
23:39Hugging Face:Blog(RSS)52Granite 4.1 LLMs:构建之道
15:33IT之家(RSS)60我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验
14:40Hacker News 热门(buzzing.cc 中文翻译)59克劳德:创意作品
14:38HuggingFace Daily Papers(社区热门论文)49MAIC-UI:用生成式用户界面制作交互式课件
08:39Hacker News 热门(buzzing.cc 中文翻译)67一份优秀的 AGENTS.md 文件相当于模型的升级;而一份糟糕的文件,其效果甚至不如完全没有文档
00:36Claude:Blog(网页)72精选像培训新开发者一样引导Claude Code:来自17年开发的经验教训
4月28日周二
13:33Simon Willison 博客60pip 26.1 新特性:锁文件与依赖冷却期
12:33Runway:News(网页)58精选无闲置GPU:Runway的研究计算管理
07:46Simon Willison 博客64微软开源语音转文本模型VibeVoice简介与实测
06:15Hacker News 热门(buzzing.cc 中文翻译)56在长达十小时的航班上离线运行本地大型语言模型
05:43Hacker News 热门(buzzing.cc 中文翻译)61EvanFlow--一个用于 Claude Code 的基于 TDD 的反馈循环
4月27日周一
22:28Hugging Face:Blog(RSS)53如何利用OpenAI的Privacy Filter构建可扩展的Web应用
21:22Google Blog:AI(RSS)50加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程
17:55公众号:通义实验室(千问)34搜对≠答对:EAPO用"证据奖励"让大模型不再靠猜
09:18IT之家(RSS)66机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程
4月26日周日
18:22The Decoder:AI News(RSS)69OpenAI 表示旧提示词拖累 GPT-5.5,开发者需要新基准
11:30公众号:可灵AI(快手·视频)42可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片
02:19Simon Willison 博客36AI图像模型的"自由发挥":当鹈鹕骑自行车时,路牌在质问
4月25日周六
14:25公众号:可灵AI(快手·视频)33可灵AI 4K实战评测室 | DiDi_OK:皮肤、毛发、瞳孔细节都敢给特写了
13:11Simon Willison 博客70精选GPT-5.5 提示指南
4月24日周五
20:45Hacker News 热门(buzzing.cc 中文翻译)58Show HN: 大型语言模型的工作原理--基于卡帕西(Karpathy)讲座的交互式图解指南
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月6日
03:28
Claude:Blog(网页)
精选71
金融服务行业Claude部署指南发布

Anthropic发布金融服务行业Claude部署指南,详细介绍了Claude系列产品在金融研究、交易、承销、理赔及月末结算等场景的应用方案。指南包含产品矩阵、10个预置金融智能体模板(如招股书生成器、KYC筛查器等),并分享了AIG、澳大利亚联邦银行等机构的实践案例。同时,提供基础、试点、扩展三阶段实施路线图,旨在协助企业决策者与工程师规划AI落地路径,提升运营效率。

智能体Anthropic教程/实践部署/工程

推荐理由:Claude 官方首次系统性给出金融行业的部署指南,从产品矩阵到预建代理模板再到三阶段路线图,做金融 AI 落地的可以直接拿过来对齐。
5月5日
23:03
Runway:News(网页)
精选55
60倍速冷启动:将同级GPU视为权重服务器

Runway平台团队开发的NCCLBack系统,通过P2P权重传输将模型冷启动时间从数分钟缩短至数秒。其核心创新在于让新启动的GPU推理节点直接从集群内已加载权重的同级GPU获取模型参数,而非从云存储重复下载。该系统利用GPU互连(如InfiniBand、NVLink)高达200-400 Gbps的带宽,相比传统存储下载的2-10 Gbps实现了数量级提升。通过Redis协调与NCCL广播原语,NCCLBack确保了数据传输的效率和正确性,使得大规模集群部署新模型时,冷启动时间不随节点数量线性增长,基本保持恒定。

推理教程/实践部署/工程

推荐理由:Runway 工程师把 GPU 冷启动从分钟压到秒级,原理是让已加载权重的 GPU 直接「喂」给新同伴,而不是各自从存储下载。做大规模推理部署的团队值得细读。
20:56
Hacker News 热门(buzzing.cc 中文翻译)
68
从零开始训练你自己的大型语言模型

GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件,包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制,而非直接调用现有API。项目在Hacker News社区获得广泛关注,收获293点热度,反映出开发者对深入掌握LLM底层技术的强烈需求。

GitHub开源生态教程/实践数据/训练
09:56
Hacker News 热门(buzzing.cc 中文翻译)
67
特工技能

Google工程总监Addy Osmani提出“特工技能”框架,界定AI智能体所需的核心能力。该框架将技能分为基础与高阶两类:基础技能涵盖规划、工具使用、记忆及多模态理解;高阶技能包括团队协作、个性化、创造力与长期目标达成。Osmani指出,拥有这些综合能力的智能体可更自主地处理复杂任务,例如仅凭一句“规划假期”指令即能完成全流程安排。这标志着AI智能体正从简单指令执行者向能解决复杂问题的“数字员工”演进。

智能体教程/实践
05:56
Hacker News 热门(buzzing.cc 中文翻译)
65
OpenAI 如何实现大规模低延迟语音 AI

OpenAI通过优化推理堆栈,将其语音AI模型Whisper的实时转录延迟从2.8秒大幅降低至232毫秒。核心改进包括引入流式编码器、改进的解码策略与缓存机制,并采用分块处理技术。这些优化使系统能在用户说话结束后的极短时间内完成转录,为大规模部署低延迟语音交互应用提供了关键技术支撑。

OpenAI教程/实践语音
02:59
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选58
OpenAI 如何大规模交付低延迟语音 AI

OpenAI 重建了其 WebRTC 技术栈,以支持实时语音 AI 服务。新系统实现了低延迟、全球规模扩展和无缝的对话轮转。此次重构旨在为 ChatGPT 的语音模式等产品提供更流畅、更自然的实时语音交互体验,解决了大规模部署时面临的延迟与稳定性挑战。

OpenAI教程/实践语音

推荐理由:OpenAI 把语音 AI 的低延迟秘诀摊开了,做实时语音产品的可以看看他们的 WebRTC 优化思路,虽然不太能直接抄,但方向值得参考。
01:16
Simon Willison 博客
精选75
Redis 数组类型交互式体验平台上线

Redis创始人Salvatore Sanfilippo提交了为Redis新增数组数据类型的PR,引入了包括ARCOUNT、ARDEL、ARGREP等在内的18个新命令。其中最引人注目的是ARGREP命令,它利用新集成的TRE正则表达式库,可直接在服务器端对数组值进行正则搜索。目前该功能已在一个分支中实现,开发者Simon Willison借助Claude Code构建了一个交互式在线沙盒,通过运行在浏览器中的WASM版Redis子集,供用户体验这些新命令。Salvatore还撰文详细介绍了在AI辅助下开发此功能的历程。

智能体开源生态教程/实践

推荐理由:Redis 加数组类型可能改变很多缓存设计,Simon 这个 WASM playground 是把 PR 变成可试产品的最快路径,后端同学可以直接上手体会 ARGREP 的快乐。
5月3日
17:49
Hacker News 热门(buzzing.cc 中文翻译)
65
Specsmaxxing--关于克服AI心理障碍,以及我为何用YAML编写规格说明

作者提出“Specsmaxxing”概念,旨在通过优化规格说明来克服AI心理障碍,即AI因指令模糊而产生的不可预测输出。其核心解决方案是采用YAML格式编写详细、结构化的规格说明,这能显著提升AI响应的准确性和一致性。为此,作者开源了一套配套工具包,供开发者实践此方法。该文章在Hacker News上获得了104点热度。

开源/仓库教程/实践
02:13
Simon Willison 博客
59
观察记录

作者购置新相机后,拍摄了更多鸟类照片并分享至iNaturalist平台。他利用Claude Code在手机上开发了一项新功能,成功将这些野生动物观察记录整合到个人博客的内容聚合系统中。该功能使观察记录能显示在博客首页、日期归档页和站内搜索结果里。作者已回溯导入了超过十年的iNaturalist数据,共计208条记录。因此,用户现在可以通过关键词(如“狐猴”)搜索到其2019年在马达加斯加拍摄的相关照片。这项开发是博客外部内容同步系统的一次扩展。

教程/实践
5月2日
04:13
Simon Willison 博客
60
iNaturalist 观察记录聚合浏览工具

作者在手机上利用 Claude Code 开发了 iNaturalist Sightings 工具,以可视化其两个 iNaturalist 账户的观察记录。该工具通过自建的 Python CLI 程序获取数据,默认将2小时内、5公里内的观察记录聚类分组,并通过 Git scraping 技术将结果存储为 GitHub 上的 JSON 文件。前端页面获取此 JSON 数据后,以懒加载的缩略图展示所有观察记录,点击缩略图可在模态框中查看大图及物种常见名,从而实现了观察数据的便捷浏览与展示。

Anthropic教程/实践编码
01:18
Claude:Blog(网页)
精选64
零基础项目经理借助Claude Code,六周内独立开发并上线压力管理应用

毫无编程经验的项目经理Kostiantyn Vlasenko,借助Claude Code在72小时内独立开发出压力管理应用Respiro,并于六周后成功上线苹果应用商店。该应用能通过手机实时检测用户压力信号,并即时引导呼吸练习。其架构由15个以上并行运作的专用子智能体构成,涵盖设计、开发、审查等模块。Claude协助完成了从技术选型、代码重构到苹果账号注册、服务集成乃至界面调试等一系列复杂操作,甚至支持了后续的市场推广工作。

智能体Anthropic教程/实践

推荐理由:一个零编程经验的项目经理,用 Claude Code 六周做完压力管理 App 并上架。关键不在技术,而在「管人经验拿来管 AI agent」的思路,对非技术背景的创业者太有参考价值。
5月1日
04:16
Claude:Blog(网页)
精选64
构建企业级AI智能体:领先企业的转型指南

2025年数据显示,美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程,并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例,提出企业AI转型三大支柱:跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断,以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案,并包含六个月的落地框架。

智能体Anthropic教程/实践

推荐理由:从 L'Oréal、Lyft 这些案例看,企业怎么把 AI 智能体扎进业务流程,比泛泛而谈的 AI 转型文章实在得多。
02:15
Claude:Blog(网页)
精选64
Claude Code 构建经验:提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作,能显著降低延迟与成本,高命中率还能支持更宽松的订阅速率限制。关键实践包括:将静态系统提示和工具定义置于提示词前端以最大化共享前缀;通过消息而非修改提示词来传递更新信息,避免缓存失效;在会话中不切换模型、不增删工具,以维持缓存前缀稳定。此外,针对工具过多或“计划模式”等场景,可通过发送轻量存根或设计专用工具来规避缓存失效,从而在复杂功能中持续利用缓存优势。

智能体AnthropicMCP/工具教程/实践

推荐理由:Claude Code团队把提示缓存的坑和优化方法全盘托出,从提示顺序、工具加载到压缩技巧,每一个经验都是钱和延迟换来的,做agent的同行可以直接拿去做架构参考。
00:13
GitHub Blog
精选59
GitHub Copilot CLI 入门指南:交互模式与非交互模式

GitHub Copilot CLI 提供了交互与非交互两种主要使用模式。交互模式允许用户通过对话式指令逐步构建和调整命令,适合探索性任务。非交互模式则支持直接输入完整指令快速执行,适用于自动化脚本或已知命令。理解这两种模式的区别能帮助开发者更高效地利用该工具,提升命令行工作效率。

GitHub教程/实践编码

推荐理由:如果你总在 Copilot CLI 的交互和非交互模式之间犯迷糊,这篇官方教程算是清晰的速查手册,初学者花五分钟就能搞清楚。
4月30日
20:00
Cursor Blog
精选55
持续优化智能体工具链:上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链,核心围绕上下文窗口的演进。早期模型能力有限,工具链依赖大量静态上下文和防护机制;随着模型能力提升,团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合:通过CursorBench等基准测试进行标准化质量评估,同时进行线上A/B测试,使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误,以应对日益复杂的工具链状态。

智能体AnthropicOpenAI教程/实践

推荐理由:Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一,从上下文管理到多 agent 调度,全是实战迭代的血泪经验,做 agent 的团队该逐字读。
08:30
公众号:智谱(GLM)
47
Scaling Pain:智谱GLM超大规模Coding Agent推理实践

智谱GLM的超大规模Coding Agent推理实践,聚焦Scaling Pain(扩展痛点)及其应对经验。

推理教程/实践部署/工程
03:42
Hacker News 热门(buzzing.cc 中文翻译)
56
让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试

开发者构建了一个基于AI的自主测试框架,用于辅助游戏测试。该框架让AI智能体能够自主探索游戏环境、执行复杂任务并报告异常,从而替代部分重复性人工测试工作。文中提及该框架在测试中发现了传统方法难以触达的边界情况,提升了测试覆盖率和效率。这一方法为游戏测试自动化提供了新思路,目前已在Hacker News社区获得广泛关注。

智能体教程/实践编码
4月29日
23:42
Hacker News 热门(buzzing.cc 中文翻译)
51
借助 Opus,我们降低了大型语言模型(LLM)的成本

团队通过采用前沿模型Opus,成功降低了大型语言模型(LLM)的运营成本。这一升级不仅提升了模型性能,还实现了成本的反向下降,具体成本降幅未在摘要中明确,但整体费用得到有效控制。此举证明了选用更先进的模型架构可以在不增加开支的前提下获得更好的技术服务效果。

Anthropic推理教程/实践
23:40
Claude:Blog(网页)
精选58
智能体时代的产品开发:Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体,使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流:使用Claude进行开放式探索,然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务,如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作,让她能将更多时间投入到与团队和用户的创造性合作中。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程,对于想要用agent重构产品开发节奏的团队有实际参考价值,但不算爆炸性更新。
23:39
Hugging Face:Blog(RSS)
52
Granite 4.1 LLMs:构建之道

IBM Granite团队在Hugging Face上发布了Granite 4.1系列大型语言模型的构建细节。该系列模型专注于代码与自然语言任务,采用多阶段训练流程,包括大规模代码数据预训练、多样化指令微调以及强化学习对齐。模型架构基于改进的Transformer解码器,并针对长序列和工具使用进行了优化。新版本在多项基准测试中性能显著提升,特别是在代码生成与数学推理任务上,部分指标超越了同规模的开源模型。团队同时公开了部分训练数据集构建方法与评估框架。

教程/实践数据/训练
15:33
IT之家(RSS)
60
我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验

新一代WPS多维表格通过AI能力升级,实现了零代码搭建办公管理系统。用户可用一句话描述需求(如“搭建编辑部稿件管理系统”),AI即可自动生成包含字段、视图和仪表盘的完整表格,大幅提升效率。系统还支持AI字段总结内容、自动生成社交媒体脚本,并能设置自动化工作流,例如在稿件截止前自动发送催稿提醒,实现智能管理。该产品基于海量办公场景洞察,深度贴合实际工作流程。

MCP/工具教程/实践
14:40
Hacker News 热门(buzzing.cc 中文翻译)
59
克劳德:创意作品

Anthropic公司发布了Claude for Creative Work,这是其AI助手Claude的创意专用版本,专注于优化创意任务。该发布在Hacker News上获得102点社区评分,显示高度关注。新工具增强了创意能力,包括改进的文本生成、构思辅助和设计支持,旨在提升写作、艺术、营销等领域的效率和质量。

Anthropic多模态教程/实践
14:38
HuggingFace Daily Papers(社区热门论文)
49
MAIC-UI:用生成式用户界面制作交互式课件

传统创建交互式STEM课件需要编程技能,而现有生成式AI工具存在生成静态、处理长文档困难、缺乏教学严谨性及修改耗时过长等问题。为此,我们提出了MAIC-UI,一个零代码创作系统,允许教育工作者从教科书、PPT和PDF快速创建并编辑交互式课件。该系统通过结构化知识分析与多模态理解确保教学严谨性,采用“生成-验证-优化”两阶段流程分离内容与视觉优化,并基于统一差异的增量生成技术实现点击定位编辑,将迭代周期缩短至10秒内。一项40人对照实验表明,该系统相比直接文本转HTML生成,显著减少了编辑迭代次数(4.9 vs. 7.0),并提升了易学性与可控性。在53名高中生参与的三个月课堂部署中,使用该系统的班级STEM成绩提升了9.21分,有效促进了学习自主性并缩小了成绩差距。

智能体教程/实践论文/研究
08:39
Hacker News 热门(buzzing.cc 中文翻译)
67
一份优秀的 AGENTS.md 文件相当于模型的升级;而一份糟糕的文件,其效果甚至不如完全没有文档

AGENTS.md文件的质量直接影响AI代理的性能表现。一份优秀的AGENTS.md文件能像模型升级一样显著提升代理能力,而一份糟糕的文档反而会损害性能,其效果甚至不如完全没有文档。该观点源自技术社区讨论,相关文章在Hacker News上获得了100点热度,强调了为AI代理编写清晰、有效文档的重要性。

智能体教程/实践编码
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
4月28日
13:33
Simon Willison 博客
60
pip 26.1 新特性:锁文件与依赖冷却期

Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。

开源生态教程/实践部署/工程
12:33
Runway:News(网页)
精选58
无闲置GPU:Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。

教程/实践部署/工程

推荐理由:Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记,利用率翻倍的方案和踩坑细节都有,做大规模训练集群调度的团队可以直接抄作业。
07:46
Simon Willison 博客
64
微软开源语音转文本模型VibeVoice简介与实测

微软于2026年1月发布开源语音转文本模型VibeVoice,采用MIT许可证并内置说话人日志功能。社区提供的4位量化MLX版本约5.71GB。实测在128GB内存的M5 Max MacBook Pro上,使用mlx-audio工具处理一段60分钟音频耗时约8分45秒,峰值内存占用达30.44GB。模型默认支持最长25分钟音频,通过调整参数可处理至多1小时音频,输出为带时间戳和说话人ID的JSON格式,便于用Datasette Lite浏览分析。

Microsoft开源/仓库教程/实践语音
06:15
Hacker News 热门(buzzing.cc 中文翻译)
56
在长达十小时的航班上离线运行本地大型语言模型

一篇技术文章分享了在长达十小时的航班上离线运行本地大型语言模型的实验。作者通过优化,成功在配备Apple Silicon芯片的笔记本电脑上运行了70亿参数的Llama 2模型。关键变化在于通过量化等技术大幅降低了模型对内存和算力的需求,使其能在无网络环境下持续工作。实验实现了约每秒5个token的生成速度,证明了在移动设备上进行实用级离线AI推理的可行性。

教程/实践端侧部署/工程
05:43
Hacker News 热门(buzzing.cc 中文翻译)
61
EvanFlow--一个用于 Claude Code 的基于 TDD 的反馈循环

EvanFlow是一个专为Claude Code设计的、基于测试驱动开发(TDD)的反馈循环工具,已在GitHub开源。该工具旨在通过TDD流程优化开发反馈循环,提升代码质量与开发效率。项目在Hacker News上获得了100点热度,显示出社区的关注。其核心是构建一个系统化的自动化测试与编码迭代流程,帮助开发者更高效地利用Claude Code进行编程。

智能体教程/实践编码
4月27日
22:28
Hugging Face:Blog(RSS)
53
如何利用OpenAI的Privacy Filter构建可扩展的Web应用

OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。

OpenAI教程/实践部署/工程
21:22
Google Blog:AI(RSS)
50
加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程

Google 与 Kaggle 再度推出为期 5 天的 AI Agents 强化课程,现已开放注册。该课程旨在教授开发者如何构建和部署 AI 智能体,内容涵盖从基础概念到实际应用。课程形式为短期集中学习,参与者将通过 Kaggle 平台进行实践。

智能体Google教程/实践
17:55
公众号:通义实验室(千问)
34
搜对≠答对:EAPO用"证据奖励"让大模型不再靠猜
检索增强推理教程/实践
09:18
IT之家(RSS)
66
机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。

具身智能开源生态教程/实践
4月26日
18:22
The Decoder:AI News(RSS)
69
OpenAI 表示旧提示词拖累 GPT-5.5,开发者需要新基准

OpenAI 指出,为 GPT-5.5 沿用旧提示词会阻碍模型性能,开发者应摒弃过往模式,从零开始、最小化设计提示词以建立全新基准。角色定义重新成为框架的前沿核心,此前它曾被部分开发者视为不必要,现在则被强调为优化交互的关键。这一调整旨在帮助开发者更有效地利用 GPT-5.5 的先进能力,提升应用效果。

OpenAI教程/实践编码
关联讨论 1 条The Decoder:AI News(RSS)
11:30
公众号:可灵AI(快手·视频)
42
可灵AI 4K实战评测:一杯奶茶钱做4K时尚大片

可灵AI推出4K实战评测,展示以“一杯奶茶钱”的低成本制作4K分辨率时尚大片的流程与效果,验证AI视频工具在影视级创作中的性价比与可行性。

教程/实践视频
02:19
Simon Willison 博客
36
AI图像模型的"自由发挥":当鹈鹕骑自行车时,路牌在质问

用户@scottjla依据“鹈鹕骑自行车”测试框架,向ChatGPT Images 2.0模型提交了一个复杂提示,要求生成“马骑宇航员、宇航员骑鹈鹕、鹈鹕骑自行车”且保持平衡的混乱图像。模型生成的画面虽包含了这些核心元素,却自行添加了一个写有“WHY ARE YOU LIKE THIS”的路牌,以及披萨、罐头和牛仔帽等未在提示中要求的物件。这一案例揭示了当前文生图模型在理解与执行复杂指令时,可能自主引入带有超现实或评论性质的额外细节,反映了其创意逻辑与指令遵循之间的微妙偏差。

OpenAI图像生成教程/实践
4月25日
14:25
公众号:可灵AI(快手·视频)
33
可灵AI 4K实战评测室 | DiDi_OK:皮肤、毛发、瞳孔细节都敢给特写了

可灵AI 4K实战评测中,DiDi_OK在皮肤、毛发、瞳孔等细节上敢于给出特写,细节表现突出,展现出色影像能力。

教程/实践
13:11
Simon Willison 博客
精选70
GPT-5.5 提示指南

OpenAI 针对新发布的 GPT-5.5 API 模型发布了详细的提示指南。核心建议包括:在处理多步骤任务时,应在调用工具前先向用户发送简短的状态更新,以提升交互体验。官方强调 GPT-5.5 应被视为一个需要重新调优的新模型系列,而非 GPT-5.2 或 GPT-5.4 的直接替代品,建议从零开始构建提示,而非沿用旧有提示。开发者可通过 openai-docs 技能使用 $openai-docs migrate this project to gpt-5.5 命令来辅助代码迁移,官方升级指南中还包含了轻量的提示词改写建议。

OpenAI教程/实践

推荐理由:OpenAI 官方明确说 GPT-5.5 不能当 drop-in replacement,prompt 要从零重写。做产品的人别偷懒直接换模型名,先读这份指南再动手,省得上线翻车。
4月24日
20:45
Hacker News 热门(buzzing.cc 中文翻译)
58
Show HN: 大型语言模型的工作原理--基于卡帕西(Karpathy)讲座的交互式图解指南

基于AI专家卡帕西讲座的交互式图解指南已发布,详细解析大型语言模型(LLMs)的工作原理。该指南以动态可视化形式呈现,简化了LLMs的架构、训练和推理过程等复杂概念,提升学习可访问性。在Hacker News社区获得103个赞,显示其受关注程度。用户可通过在线链接直接体验这一教育工具,深入了解LLMs内部机制。

教程/实践现象/趋势
‹ 上一页
1…7891011…13
下一页 ›