AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1651 条
全部一手资讯X论文
6月25日周四
01:36The Decoder:AI News(RSS)59Snowflake CEO 实测:GLM-5.2 与 Opus 4.7 编程能力接近,成本仅为几分之一
00:15Hugging Face:Blog(RSS)66精选NVIDIA NeMo AutoModel:一行代码加速Transformer MoE模型微调
6月24日周三
22:58IT之家(RSS)56汇丰调查:AI 目前仍无法取代人类财富顾问
22:58IT之家(RSS)52论文 AI 率改后反升,央视揭秘检测原理
22:31公众号:火山引擎74精选字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
22:29Hacker News 热门(buzzing.cc 中文翻译)78精选里德·霍夫曼称SpaceX"不是一家人工智能公司",xAI则是"彻底的灾难"
21:29MarkTechPost(RSS)68Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令
19:10公众号:卡尔的AI沃茨65快手KroWork:将AI Skill工作流打包成本地桌面App
19:03The Decoder:AI News(RSS)47Pangram CEO:语言模型会因论点雷同而暴露自己
18:50IT之家(RSS)55斯坦福毕业生对AI态度分化:乐观者视为探索工具,担忧者质疑伦理与环境
18:00公众号:小红书技术(dots.llm)51AICon 上海 2026|小红书质效:Agent 基建的规模化落地路径
17:44IT之家(RSS)58美团副总裁陶雪璇:大众点评反对和抵制 AI 评价
16:22MarkTechPost(RSS)432026年16大生成式AI编码工具对比:功能与适用场景
15:42IT之家(RSS)43软银孙正义回应 AI 泡沫论:这是对 AI 的侮辱,人工智能仍处于发展初期
15:20公众号:蚂蚁百灵(Ling)49Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运
11:20公众号:卡尔的AI沃茨65实测Codex Record & Replay:把RPA自动化工作流重做了一遍
10:10公众号:数字生命卡兹克63同事件精选微信上线AI智能体"小微"内测同一事件,精选展示《微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录》
09:27IT之家(RSS)40EA 高管看好生成式 AI:可简化开发流程、加速创意产出
09:16Hacker News 热门(buzzing.cc 中文翻译)34《艾尔登法环》中的"低科技"AI
08:27IT之家(RSS)40苹果 macOS 27 Beta 2 已封堵"跳过 Siri AI 候补名单"终端命令
07:27IT之家(RSS)49扎克伯格谈 Meta AI 智能眼镜:必须在时尚与功能之间取得平衡
07:27IT之家(RSS)57维基百科联合创始人:AI 幻觉仍然严重,不会让 AI 直接参与内容编辑
04:25TechCrunch:AI(RSS)41Kiwibit AI 鸟食器成为后院新宠
04:10OpenAI:官网动态(RSS · 排除企业/客户案例)46OpenAI 联合创立 Appia Foundation,推动 AI 评估标准与信任层建设
03:18Simon Willison 博客59OPFS + Pyodide 测试 UI
02:37MarkTechPost(RSS)51如何使用NVIDIA Canary-1B-v2进行ASR、翻译和自动SRT字幕导出
02:26Hugging Face:Blog(RSS)64精选在 Transformers.js 中实验提议的跨源存储 API
01:14Claude:Blog(网页)42Claude Tag 的 Agent Identity 访问模型
01:10Meta Engineering Blog(RSS)45Meta 如何为 AI 眼镜设计超窄钢壳电池
01:02Hacker News 热门(buzzing.cc 中文翻译)63人工智能的可负担性危机
00:27The Verge:AI(RSS)58Midjourney转向全身扫描仪引专家质疑
00:00Berkeley RDI:Blog(AI 安全与评测)82精选恶意CDN仍潜伏GitHub Pages,AI让情况恶化
6月23日周二
23:27The Verge:AI(RSS)59Fitbit Air 以更聪明的方式应对 AI 健康乱局
23:00公众号:昆仑万维(天工)49DramaWave张薇:AI拍剧代替的是流程,不是故事 | 上海电视节白玉兰论坛
22:26Hacker News 热门(buzzing.cc 中文翻译)48《The Coming Loop》--Hacker News 热门文章
21:50The Verge:AI(RSS)50Sony Xperia 1 VIII 的 AI Camera Assistant 效果极差
20:26Ars Technica:AI(RSS)55Cory Doctorow 新书《The Reverse Centaur's Guide to Life After AI》提出如何戳破 AI 泡沫
19:10公众号:小红书技术(dots.llm)54小红书QEcon分享:Agent驱动的服务端端到端测试
16:50公众号:卡尔的AI沃茨58实测豆包Seed 2.1 Pro,把我六个真实工作流都稳稳接住了
16:12Hugging Face:Blog(RSS)59精选我们用免费本地模型对 OpenClaw 仓库进行实时分类
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月25日
01:36
The Decoder:AI News(RSS)
59
Snowflake CEO 实测:GLM-5.2 与 Opus 4.7 编程能力接近,成本仅为几分之一

Snowflake 内部基准测试显示,在每项任务三次尝试下,GLM-5.2 解决 66% 的编程问题,Anthropic 的 Opus 4.7 解决 67%,两者几乎持平。首次尝试准确率 Opus 为 53.7%,GLM 为 47.6%;GLM 每任务平均迭代 99 次、消耗 8.6 亿 token,Opus 则为 80 次、4.39 亿 token。成本方面,GLM-5.2 输出 token 价格为 $4.40/百万,远低于 Opus 的 $25 和 GPT-5.5 的 $30;输入 token 仅 $1.40/百万。GLM 存在过早放弃和过度检查等弱点,但其定价优势可能对西方 AI 公司的高估值构成压力。

AnthropicOpenAI编码评测/基准
00:15
Hugging Face:Blog(RSS)
精选66
NVIDIA NeMo AutoModel:一行代码加速Transformer MoE模型微调

NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库,添加 Expert Parallelism、DeepEP 融合 all-to-all 调度和 TransformerEngine 内核。在 MoE 模型微调中,相比原生 v5,训练吞吐量提升 3.4–3.7 倍,GPU 内存减少 29–32%,仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B A55B 时,v5 因内存不足无法运行,而 AutoModel 凭借 EP=64 专家并行使训练可行。单节点 30B MoE 模型(如 Qwen3-30B-A3B)同样获得可量化的性能优势。

开源/仓库教程/实践数据/训练

推荐理由:英伟达的 NeMo AutoModel 把 MoE 模型微调速度提高了三倍多,内存省了近三分之一,代码只需改一行 import,做训练的可以立刻升级。
6月24日
22:58
IT之家(RSS)
56
汇丰调查:AI 目前仍无法取代人类财富顾问

汇丰控股调查约1万名富裕及高净值人士,62%受访者视专业人士为投资想法主要来源,仅12%认为AI最重要。客户用AI了解选项,但最终决策依赖人类顾问的判断与责任。麦肯锡称资产不足100万美元的客户或逐步被AI取代,花旗增聘顾问把握增长。年轻一代更倾向结合AI与顾问,但人类顾问的判断、验证和个性化解读最难替代。

现象/趋势行业动态
22:58
IT之家(RSS)
52
论文 AI 率改后反升,央视揭秘检测原理

毕业季高校毕业生论文面临 AIGC 检测新关卡。有学生论文 AI 率为 62%,远超学校 15% 红线,尝试用大模型改写后检测升至 94%。首都师范大学副院长蔡海龙指出,AI 检测本质是基于概率的分类,用 AI 查 AI 无法明确判定;中文语意丰富易致歧义误判。当前检测依赖困惑度与突发性等特征,准确性无法达 100%。专家建议建立透明可回溯的 AI 使用标注制度,实行“人工评议为主、AI 检测为辅”的人机共判模式。

现象/趋势
22:31
公众号:火山引擎
精选74
字节跳动技术副总裁洪定坤:AI Coding 的实践与探索

在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。

大佬观点现象/趋势编码

推荐理由:洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲,尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证,是所有推 AI 编程的团队必看的复盘。
22:29
Hacker News 热门(buzzing.cc 中文翻译)
精选78
里德·霍夫曼称SpaceX"不是一家人工智能公司",xAI则是"彻底的灾难"

LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”,6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”;xAI则是“彻底的灾难”,所有11位联合创始人已离职,Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型,理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞,称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间,但Cursor可能已过巅峰。他建议年轻人不要抵制AI。

大佬观点安全/对齐现象/趋势

推荐理由:Reid Hoffman 对 xAI 和 SpaceX 的批评几乎不留情面,这种硅谷核心人物的公开呛声本身就值得一读,他对监管干预的担忧和对 Gen Z 的劝诫也很有现实感。
21:29
MarkTechPost(RSS)
68
Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令

Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后,Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/,自动映射为斜杠命令(如/plan、/axolotl)。技能采用三级加载(Level 0返回名称与描述约3k tokens,Level 1加载全文,Level 2加载特定文件),避免大技能库撑满上下文窗口。除/learn外,还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用,仪表板额外提供“Learn a skill”按钮。

智能体产品更新开源生态
19:10
公众号:卡尔的AI沃茨
65
快手KroWork:将AI Skill工作流打包成本地桌面App

快手新发布KroWork,能将多个AI Skill串成的工作流直接打包为本地桌面应用。用户安装后可在Launchpad中一键下载到本机,双击即可按预设流程运行,无需反复打开对话框或重新配置参数。KroWork支持定时任务(如每天9点自动执行),并允许从Kro Workshop复制他人工作流二次开发。作者用其复刻了Prompt Organizer提示词生成器和Daily Trend Brief(每日AI趋势简报)等日常工具。KroWork定位与Claude Cowork、Codex Site、Claude Code Artifacts相似,旨在将重复工作流沉淀为可分享的本地应用。

智能体MCP/工具教程/实践
19:03
The Decoder:AI News(RSS)
47
Pangram CEO:语言模型会因论点雷同而暴露自己

AI文本检测器Pangram的CEO Max Spero表示,其深度学习分类器是一个黑箱,通过捕捉语言模型在组织文档时留下的结构模式来识别AI生成文本。Spero指出,语言模型在语法和逻辑上可能优于普通人,但论点高度同质化:若要求LLM就某个主题生成100个论点,它们会集中在狭窄范围内,而人类论点的空间则非常多样。这种雷同是AI文本的显著特征。

大佬观点现象/趋势
18:50
IT之家(RSS)
55
斯坦福毕业生对AI态度分化:乐观者视为探索工具,担忧者质疑伦理与环境

斯坦福大学毕业生对AI态度分化。计算机科学专业哈桑认为AI是探索宇宙的工具,鼓励乐观应对;地球系统专业海尔担忧开发不符合伦理,但认可AI可用于训练气候模型。AI已冲击就业,初入职场劳动者就业水平下降,计算机专业也面临求职困难。部分学生依赖AI完成作业导致考试成绩与作业差距扩大,课程恢复监考和口试。心理学专业哈兰反感AI对环境的破坏,认为数据中心消耗大量资源。

现象/趋势行业动态
18:00
公众号:小红书技术(dots.llm)
51
AICon 上海 2026|小红书质效:Agent 基建的规模化落地路径

小红书质效研发团队在 AICon 上海 2026 公布两项 Agent 基础设施实践。Self-GC 系统通过 ContextObject 对象化建模与三阶段提交机制(Async Plan、Rehearsal、Delayed Commit),将上下文转为可索引的生命周期管理,生产环境实现 10%-20% 输入 Token 下降且保持 90%+ 无影响率。Seal 企业级 AI 个人助理依托 NEX 沙箱实现运行时隔离,结合 Self-GC 与 SealRouter(Auto 模型路由)达成成本减半,并采用 L0-L2 分层记忆体系构建可溯源知识闭环,从 3 天内测到两周完成全员覆盖。

智能体MCP/工具教程/实践
17:44
IT之家(RSS)
58
美团副总裁陶雪璇:大众点评反对和抵制 AI 评价

6月24日,美团副总裁陶雪璇在大众点评必吃榜10周年盛典上表示,大众点评对AI评价持明确反对和抵制态度。她指出,AI生成的评价可能话术漂亮但未真实体验过餐厅,且AI在应用环节的模型幻觉问题依然严重,会影响评价的真实性。评价如同社区公告板,不属于商家、用户或平台任何一方。

大佬观点
16:22
MarkTechPost(RSS)
43
2026年16大生成式AI编码工具对比:功能与适用场景

生成式AI已重塑软件开发,从逐行自动补全扩展到全应用生成、多智能体构建管道和自然语言代码库交互。文章对比了16个最佳工具:Atoms*支持自然语言生成可部署应用并并行运行多模型;GitHub Copilot提供IDE内智能补全与代理模式;Tabnine主打本地化私密代码补全;Replit为云端IDE与AI代理;Warp增强终端AI;Hugging Face提供开源模型平台;Codacy自动化代码质量分析;Metabob基于图神经网络检测深层缺陷;aiXcoder可本地运行开源代码模型;Bloop将代码搜索转向AI智能体基础设施;Mintlify等覆盖IDE插件、云部署到代码质量管理多种场景。

编码评测/基准
15:42
IT之家(RSS)
43
软银孙正义回应 AI 泡沫论:这是对 AI 的侮辱,人工智能仍处于发展初期

软银创始人兼首席执行官孙正义在 6 月 24 日的年度股东大会上表示,人工智能仍处于发展初期,任何声称行业出现泡沫的言论都是“对人工智能的侮辱”。他将软银比作“下金蛋的鹅”,抱怨公司市值(约 37 万亿日元)与资产总额(约 74 万亿日元)之间的巨大落差。孙正义同时宣布软银已开始量产机器人,并推动旗下 Arm 从芯片设计者向芯片提供者转型。

大佬观点现象/趋势
15:20
公众号:蚂蚁百灵(Ling)
49
Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运

蚂蚁 ASystem Core 与 SGLang-JAX 团队在 TPU v7x 上优化了 1T 参数稀疏 MoE 模型 Ling-2.6-1T 的推理性能。核心是 Fused MoE V2 Pallas kernel,将 scatter、expert FFN 和 gather 合并,通过计算与数据搬运重叠降低延迟。相比 V1,MoE prefill latency 从 5.16 ms 降至 2.42 ms(降 53%),decode kernel latency 从 0.249 ms 降至 0.211 ms。仅替换 MoE kernel 即可使 prefill throughput 提升 24.8%,decode throughput 提升 18.5%–35.3%。在 SGLang decode benchmark 下,16 颗 TPU v7x 的 output throughput 达到 16 张 H200 的 1.29x–1.77x。该工作还完整支持 hybrid backbone,包括 hybrid KV/recurrent memory pools、GLA linear attention 及 single-controller data parallelism。

推理教程/实践部署/工程
11:20
公众号:卡尔的AI沃茨
65
实测Codex Record & Replay:把RPA自动化工作流重做了一遍

Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。实测解决两个痛点:定向信息搜索时自动打开X搜热点、统计高赞帖子、提取关键词重新查询,输出带互动指标的表格和短关键词库,满足60%-70%图文素材需求;视频剪辑上传能完成静音检测、加速、导出GIF等固定流程,但上传可能被网站安全策略拦截,建议先让Codex出Plan判断可行性。Codex能理解意图,例如自动在输入Grok前增加中文关键词组合。目前依赖Computer Use和图片理解,操作慢且偶有误判,但已能将人的操作转化为Agent下次可执行的上下文,替代传统RPA和Replay。

智能体OpenAI搜索教程/实践
10:10
公众号:数字生命卡兹克
同事件精选63
微信上线AI智能体"小微"内测

微信近日内测AI智能体“小微”,常驻左上角,支持语音或文本输入,调用WeLM-V4-80B(MoE激活3B)与DeepSeek模型。可向个人/群聊发消息、发起视频通话、发红包或转账,需用户逐项确认;可查询朋友圈(限最近2天)、公众号、视频号,支持创建提醒、笔记、小工具,并能操作奶茶咖啡、打车、电影票等小程序至最后一步后交给用户。小微具备记忆功能,可记录地址等。聊天记录上下文仅在特定入口可用且限最近2天。整体策略“只读不动”,禁止批量发送、定时、删除联系人等操作。微信以谨慎节奏接入AI,是国民级应用全面拥抱AI的重要信号。

智能体搜索教程/实践
同一事件,精选展示《微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录》
推荐理由:微信Agent内测体验一手展示,功能上打通通讯录、朋友圈和小程序,却处处需确认且只读不动,是微信在AI时代极其谨慎的第一步。不过一句话生成小工具的能力,已经为小程序生态打开了AI分发的新可能。
09:27
IT之家(RSS)
40
EA 高管看好生成式 AI:可简化开发流程、加速创意产出

艺电(EA)企业发展总裁劳拉·米耶勒称,生成式 AI 能简化游戏制作流程、减轻开发者重复劳动,提升原型制作与创意产出速度。当前开发周期已从 PS2 时代的 18 个月拉长至五年以上,AI 被视为填补效率缺口的关键。EA 首席执行官安德鲁·威尔逊将 AI 定位为创意、创新与玩家联结的助推器,团队正用 AI 优化开发、扩容和个性化定制,包括动态大世界、批量生成真实运动员与球队形象等。EA 对 AI 的押注与其价值 550 亿美元(约 3740.22 亿元人民币)的杠杆收购交易绑定,该交易能否落地部分取决于 AI 压缩成本、拉高利润的成效。

大佬观点行业动态
09:16
Hacker News 热门(buzzing.cc 中文翻译)
34
《艾尔登法环》中的"低科技"AI

FromSoftware 在《艾尔登法环》等魂系游戏中采用低技术门槛的 AI 决策实现。AI 逻辑编写在 Havok Script(面向游戏的 Lua 实现)中,核心工具是“Goal”(目标)——一个带参数的不可变函数表。多个 Goal 按栈结构组织成下推自动机(PDA),而非有限状态机。每帧更新栈顶 Goal,该 Goal 可推送子 Goal 至栈顶,下帧执行;更新返回 Continue、Success 或 Failure 控制栈的弹出与清空。Goal 通过随机数、目标距离、动画冷却等动态调整权重。此外支持 Interrupt 回调,允许对角色身上配置的外部事件做出即时响应。

其他
08:27
IT之家(RSS)
40
苹果 macOS 27 Beta 2 已封堵"跳过 Siri AI 候补名单"终端命令

苹果在 macOS 27 Beta 2 中封堵了一条终端命令,该命令此前可绕过候补名单直接启用新版 Siri AI。Beta 1 中用户输入 sudo defaults write ... 即可跳过等待,但 Beta 2 已禁止。网友发现另一种方式:升级最新 Beta 后,用“图乐园”生成图片,多次点击“更多”菜单中的“图像有问题”发送反馈,可能解锁 Siri AI,该方法也适用于 iOS 27。

教程/实践端侧
07:27
IT之家(RSS)
49
扎克伯格谈 Meta AI 智能眼镜:必须在时尚与功能之间取得平衡

扎克伯格在访谈中表示,Meta 智能眼镜的难点不在堆砌 AI 功能,而在于做出人们愿意日常佩戴的产品,需在外观、舒适度和功能体验间取得平衡。本周二 Meta 推出全新系列智能眼镜,起售价 299 美元(约 2029 元),低于入门款雷朋智能眼镜,由依视路陆逊梯卡联合开发但不搭载其品牌标识。扎克伯格认为未来可穿戴设备必须与时尚融合,要让人戴出去有面子且佩戴舒适,并对比 Snap 新款 AI 眼镜因高价笨重遭吐槽。

Meta多模态大佬观点端侧
07:27
IT之家(RSS)
57
维基百科联合创始人:AI 幻觉仍然严重,不会让 AI 直接参与内容编辑

维基百科联合创始人吉米·威尔士表示,尚不信任AI直接参与词条编辑,因为模型“幻觉”问题依然非常严重。不过AI可用来提醒编辑社区关注小众新闻。他指出,各AI平台依赖维基百科内容导致AI机器人访问量上升,人类用户访问量下降8%,并呼吁AI公司承担服务器费用,已开始封锁不守规矩的平台。

大佬观点数据/训练现象/趋势
04:25
TechCrunch:AI(RSS)
41
Kiwibit AI 鸟食器成为后院新宠

Kiwibit Bird Feeder 2 4K AI Camera 是一款智能鸟食器,售价 $179.99 至 $249.99。设备配备太阳能板、130 度广角镜头、双向音频,支持 2.4 GHz Wi-Fi 与云存储。配套手机应用通过 Kiwibit 自有算法识别超过 10,000 种鸟类,如冠蓝鸦、乌鸦和哀鸽。测试期间成功记录 6 个物种的造访。应用会推送访客通知,并提供每种鸟类的维基百科详情。缺点是 AI 偶尔会将长时间进食的鸟误计为多次“造访”,并将偷吃种子的松鼠标记为“有害动物”。

评测/基准
04:10
OpenAI:官网动态(RSS · 排除企业/客户案例)
46
OpenAI 联合创立 Appia Foundation,推动 AI 评估标准与信任层建设

OpenAI 联合创立了由 Linux 基金会托管的 Appia Foundation,旨在开发开放模块化规范,将国际标准与既有框架转化为 AI 价值链中的实用评估标准,并构建第三方合规验证的信任层。该工作与 OpenAI 此前发布的民主治理蓝图、Preparedness Framework 及 Frontier Governance Framework 一脉相承,强调国家能力与国际合作相互加强。OpenAI 还参与了 ISO/IEC JTC 1/SC 42、NIST 人工智能联盟、Frontier Model Forum 等多个标准化组织,并与美国 CAISI 及英国 AISI 合作开展前沿评估实践,推动评估方法与安全防护的实质性改进。

OpenAI安全/对齐行业动态
03:18
Simon Willison 博客
59
OPFS + Pyodide 测试 UI

Simon Willison 使用 Claude Code for web 构建了一个 OPFS + Pyodide 测试 UI,用于验证 Datasette Lite(基于 Pyodide 和 WebAssembly 在浏览器中运行的 Python Datasette 应用)能否通过 Origin Private File System(OPFS)编辑用户计算机上的持久 SQLite 文件,并在不同浏览器中测试其可行性。

教程/实践端侧
02:37
MarkTechPost(RSS)
51
如何使用NVIDIA Canary-1B-v2进行ASR、翻译和自动SRT字幕导出

该教程通过Python使用NVIDIA Canary-1B-v2构建语音识别与翻译管线:先安装NeMo ASR工具包和音频依赖,在GPU上加载模型;将音频处理为16 kHz单声道格式后,执行英语ASR,将语音翻译为25种语言,生成词级和时间段时间戳,导出SRT字幕文件,并支持长文本转录、批处理与推理速度基准测试。

教程/实践语音
02:26
Hugging Face:Blog(RSS)
精选64
在 Transformers.js 中实验提议的跨源存储 API

Transformers.js 在浏览器中运行 AI 模型时,不同来源的 Web 应用会重复下载并缓存相同的模型资源(如 Xenova/whisper-tiny.en)和 Wasm 运行时文件(如 4,733 kB 的 ort-wasm-simd-threaded.asyncify.wasm),即使资源 URL 相同,浏览器因 Network Isolation Key 隔离缓存,单次 demo 就产生 177 MB 冗余下载和存储。Cross-Origin Storage API 是一项早期提案,旨在让跨来源应用共享缓存的模型和运行时资源。目前该 API 尚未在浏览器原生实现,但可通过 Chrome 扩展注入 polyfill 进行实验。

Hugging Face开源生态教程/实践部署/工程

推荐理由:这个Chrome提案让不同网站的AI模型共享缓存,对用Transformers.js的Web开发者是切实的性能改进,但还只是早期实验。
01:14
Claude:Blog(网页)
42
Claude Tag 的 Agent Identity 访问模型

Claude Tag 推出 agent identity(智能体身份)访问模型,让 Claude 在共享频道中以独立身份工作,而非模拟某个用户。管理员在工作区级配置连接器、仓库访问、技能插件和固定指令等权限,每个频道可覆盖继承的基线设置。私有频道拥有独立身份,记忆和访问不跨频道流转;公共频道共享工作区级身份。该模型为自主多玩家 AI 场景设计,允许频道成员通过 Claude 访问已授权工具和数据,同时通过按身份撤销简化权限管理。

智能体Anthropic教程/实践部署/工程
01:10
Meta Engineering Blog(RSS)
45
Meta 如何为 AI 眼镜设计超窄钢壳电池

Meta 工程团队为 Ray-Ban Meta 等智能眼镜开发了宽度仅 7mm 的钢壳电池。传统软包电池难以塑形且空间利用率低,Meta 改用叠片式电极结构以降低阻抗、避免多任务时电压骤降,并将公差控制在约 100 微米以释放更多体积。Gen2 电池容量从 160 mAh 提升至 210 mAh,但续航翻倍主要来自软硬件系统级效率优化。Oakley Meta Vanguards 双电池面临交叉充电与启动关机时序难题,而 Meta Ray-Ban Display 则搭载了最大的 248 mAh 钢壳电池以支持屏幕持续供电。该超窄方案正推广至其他硬件形态。

Meta教程/实践端侧
01:02
Hacker News 热门(buzzing.cc 中文翻译)
63
人工智能的可负担性危机

本文标题为《人工智能的可负担性危机》,指出当前人工智能领域的成本持续攀升,已引发业界对可负担性的广泛担忧。该文章出自 blog.dshr.org,并在 Hacker News 上获得 100 个点赞。随着 AI 技术的推进,成本问题正成为制约其普及的关键因素,文章的核心观点围绕这一危机展开讨论。尽管原文未提供具体数据,但标题本身已点明了 AI 成本持续上升所带来的紧迫挑战。

数据/训练现象/趋势
00:27
The Verge:AI(RSS)
58
Midjourney转向全身扫描仪引专家质疑

上周,以图像生成闻名的Midjourney宣布进军医疗成像,推出沉浸式水浴超声扫描仪。用户站上平台沉入水中,环形水下传感器发出声波,号称60秒完成全身扫描,效果“堪比MRI但像水疗一样随意”。公司称使用AI和专用芯片处理海量数据并实现无损压缩加速处理,计划先投放水疗中心而非作为诊断设备。多位放射科和成像专家表示质疑,称目前图像分辨率低、与MRI等效的说法毫无依据,该概念并非全新且缺乏公开证据。专家强调从原型到临床价值验证仍有很长的路。

其他行业动态
00:00
Berkeley RDI:Blog(AI 安全与评测)
精选82
恶意CDN仍潜伏GitHub Pages,AI让情况恶化

UC Berkeley研究人员发现,近2000个GitHub Pages站点(18000+页面,累计530K+星标)仍在加载来自polyfill.io及其关联恶意CDN的脚本。这些CDN由已被OFAC制裁的Funnull Technology Inc.(现更名Triad Nexus)运营,2024年被出售后开始条件性注入恶意载荷,劫持移动用户、跳转欺诈站点、伪造认证弹窗窃取凭证。扫描12000+站点确认786个加载polyfill.io,1191个加载其他Funnull CDN。更严峻的是,所有测试的大语言模型在生成前端代码时仍推荐这些被污染的CDN URL,包括CyC2018/CS-Notes(184K⭐)、microsoft/AirSim(18K⭐)等知名项目及多所大学课程页面。

GitHub安全/对齐开源生态编码

推荐理由:polyfill.io等恶意CDN仍在GitHub Pages上感染近2000个站点,更可怕的是所有测试的AI模型都还会推荐这些链接,AI编码的便利正在变成供应链投毒的加速器。
6月23日
23:27
The Verge:AI(RSS)
59
Fitbit Air 以更聪明的方式应对 AI 健康乱局

售价 99 美元的 Fitbit Air 是一款轻便手环,续航出色(一个月仅充电三次,45 分钟可充至 85%),支持心率、睡眠、血氧、准备度等指标。核心亮点是与 Google Health 绑定的 AI 健康教练,基于 Gemini 驱动,每日推送睡眠与准备度总结及行动建议,可解读数据趋势并生成旅行健身计划,但不提供诊断。该教练需 $99/年 Premium 订阅,且不独占于 Air。作者认为多数 AI 健康功能是“糟糕的贴金捞钱”,但 Google Health Coach 是其中最接近不糟糕的一款,前提是用户愿意投入大量精力进行引导。

Google评测/基准
23:00
公众号:昆仑万维(天工)
49
DramaWave张薇:AI拍剧代替的是流程,不是故事 | 上海电视节白玉兰论坛

昆仑万维旗下短剧业务DramaWave内容负责人张薇在6月22日上海电视节白玉兰论坛上分享海外微短剧市场洞察。DramaWave采取付费和免费双轨运营,海外月活用户超亿,年度经常性收入达6亿美金。AI技术极大提升了内容产能——男频玄幻类AI短剧填补了真人拍摄成本高、难度大的空白,平台目前一个月可上线200余部AI剧。张薇指出,AI作为工具代替的是制作环节而非故事内核,99%的观众只关心故事是否好看。合作模式包括成品剧上传、合拍等,平台持续欢迎好剧本。

现象/趋势视频
22:26
Hacker News 热门(buzzing.cc 中文翻译)
48
《The Coming Loop》--Hacker News 热门文章

自 lucumr.pocoo.org 发布题为《The Coming Loop》的文章,在 Hacker News 上获得 103 个点赞。

大佬观点现象/趋势编码
21:50
The Verge:AI(RSS)
50
Sony Xperia 1 VIII 的 AI Camera Assistant 效果极差

Sony Xperia 1 VIII 的 AI Camera Assistant 直接嵌入相机默认模式,在拍摄前自动弹出建议,但体验糟糕。与 Google Pixel 的 Camera Coach 不同,它不提供构图或对焦建议,仅应用滤镜——调整曝光、白平衡、对比度或添加人工散景,且不告知具体修改内容。建议不一致:不支持自拍镜头,对强光、背光、空白墙面很少触发,对手掌却频繁建议。多数生成照片不如原图,仅在光线极差时偶尔有用。该功能还拖累性能:搭载骁龙 8 Elite Gen 5 仍出现相机打开慢、切换镜头卡顿甚至崩溃,关闭后有所缓解。该机型售价约 1,850 美元,但不在美国上市。

端侧评测/基准
20:26
Ars Technica:AI(RSS)
55
Cory Doctorow 新书《The Reverse Centaur's Guide to Life After AI》提出如何戳破 AI 泡沫

科幻作家兼科技记者 Cory Doctorow 在新书中主张,戳破 AI 泡沫需要从其根本入手,而非仅仅批判过度炒作。该书分析了 AI 行业的结构性根源,并探讨了泡沫破灭后的替代路径。

大佬观点现象/趋势
19:10
公众号:小红书技术(dots.llm)
54
小红书QEcon分享:Agent驱动的服务端端到端测试

小红书质效研发团队提出用AI Agent破解端到端测试的跨域、长链路、组合爆炸三大痛点。传统方案自动化覆盖率仅20%,新方案以Coding Agent为核心,采用逆向链式推导与知识库渐进式加载实现动态规划,Debug-first策略生成脚本,并结合工具级与链路级双层经验沉淀形成自进化飞轮。数据构造从小时级降至分钟级,常见场景秒级完成,新业务域接入从数天缩至分钟级。Agent直接理解测试意图、自主调用接口,无需预设编排。

智能体推理教程/实践
16:50
公众号:卡尔的AI沃茨
58
实测豆包Seed 2.1 Pro,把我六个真实工作流都稳稳接住了

火山引擎Force大会上发布豆包Seed 2.1 Pro,重点提升Agent、GUI操作和编程能力:OSWorld 78.8接近GPT-5.5的78.7,Terminal Bench 2.1达71.0;多模态视觉理解进步显著(CharXiv-RQ 85.4等)。支持原生音视频、图片、文本混合理解,256K上下文,可切换快慢思考。实测六项真实工作流(旧项目UI修复与Debug、世界杯主题网站、点球大战小游戏、绘本插画描述、DeepResearch报告、PPT生成)均在不依赖Skill下稳定跑通。适合作为Agent执行层模型。

智能体多模态推理编码
16:12
Hugging Face:Blog(RSS)
精选59
我们用免费本地模型对 OpenClaw 仓库进行实时分类

Hugging Face 在 OpenClaw 仓库上测试用 Gemma 和 Qwen 等本地模型实时分类 issue 和 PR。他们使用 Pi agent harness 驱动模型,配合 reposhell 只允许读操作防止提示词注入。测试的模型包括 gemma-4-26b-a4b 和 qwen3.6-35b-a3b,经性能优化后均可在本地生成数百 token/s。该方案运行在 NVIDIA GB10(128 GB 统一内存)上,相比每月 200 美元的 ChatGPT Pro 订阅,可实现近乎实时的通知且仅消耗电费。

智能体Hugging Face开源生态教程/实践

推荐理由:Hugging Face 演示了用本地模型自动 triage GitHub issue 的完整方案,包括只读 shell 防注入、agent harness 等工程技巧。对想用本地模型替代 API 做分类任务的团队,这是一套可直接借鉴的 recipe。
‹ 上一页
1…34567…42
下一页 ›