AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1650 条
全部一手资讯X论文
7月1日周三
07:08Ethan Mollick:One Useful Thing(RSS)73聊天机器人的黄昏
05:37Hacker News 热门(buzzing.cc 中文翻译)49我研制了一台毫米波物料分类雷达
05:25Suno:Blog(网页)40Dream Relic:用 Suno 为超现实影像配乐
02:19Simon Willison 博客50AI指南针
01:28Claude:Blog(网页)72精选Claude Code 入门:智能体循环
01:03OpenAI:官网动态(RSS · 排除企业/客户案例)41OpenAI 发布 Genebench-Pro 基准测试:10个案例研究详解
00:42Dwarkesh Patel:Podcast & Blog(RSS)61精选Grant Sanderson 谈 AI 与数学的未来
00:37Hacker News 热门(buzzing.cc 中文翻译)68Claude Code 通过隐写术在请求中嵌入环境标记
00:13OpenAI:官网动态(RSS · 排除企业/客户案例)62精选OpenAI Signals 数据揭示 ChatGPT 全球采用趋势
6月30日周二
23:29Hugging Face:Blog(RSS)49专业化为何不可避免
21:30公众号:数字生命卡兹克58国产AI两个"万亿"里程碑:美团LongCat-2.0发布,寒武纪市值破万亿
19:02IT之家(RSS)48谷歌前工程负责人用Claude Code开发维基百科搜索引擎Zettair,未手动写一行代码
17:02IT之家(RSS)57TrendForce:AI需求排挤产能,晶圆代工成熟制程涨价预计延伸至2027年
16:37Hacker News 热门(buzzing.cc 中文翻译)43Moondream Photon 通过流水线解码消除 GPU 气泡,提升 35% 吞吐量
15:02IT之家(RSS)55AI 老板 500 天模拟经营:多数模型亏惨,Claude Fable 5 独占鳌头
15:02IT之家(RSS)53优必选创始人周剑:机器人将替代手机,成为AI最核心的交互终端
14:27Google Blog:AI(RSS)54英国职场AI采用率翻倍,仅15%"AI先锋"获得晋升加薪优势
12:27TechCrunch:AI(RSS)71精选AI就业争论变得更加混乱
12:02IT之家(RSS)57Claude Code 负责人称未来员工将身兼数职,工程产品设计融为一体
11:36Hacker News 热门(buzzing.cc 中文翻译)53hyperscript 解析bug修复:AI分析高效但修复方案欠佳
11:29MarkTechPost(RSS)48Top 6 无代码 AI 工具速览(涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架)
11:06Hacker News 热门(buzzing.cc 中文翻译)48形式化验证:你能对软件做出哪些保证?
10:10公众号:数字生命卡兹克67精选具身智能数据采集员:日薪200元起,给机器人当老师
04:34Tomer Tunguz 博客(VC 分析)58精选Anthropic:当AI成本超过工程师薪酬
02:35Hacker News 热门(buzzing.cc 中文翻译)75精选Qwen 3.6 27B 是本地开发的理想选择
01:05Hacker News 热门(buzzing.cc 中文翻译)48运行 CUDA 内核时会发生什么?
6月29日周一
23:55Google Blog:AI(RSS)39问AI专家:全栈AI到底是什么?
22:43Gary Marcus:The Road to AI We Can Trust(RSS)6Gary Marcus 宣布离线度假,附 AI 生成自行车事故趣图
22:05Hacker News 热门(buzzing.cc 中文翻译)63对人工智能时代软件工程的思考
18:10公众号:蚂蚁百灵(Ling)51如何优雅地给 MLA 加上 QK-Norm?
18:01IT之家(RSS)38OpenAI Codex 负责人:人工智能仍无法做好创意设计
17:17Artificial Intelligence News(RSS)28自然语言处理正在改变专业社交网络
14:34Hacker News 热门(buzzing.cc 中文翻译)53HackerRank 将其 ATS 开源,评分不稳定引发争议
13:50公众号:卡尔的AI沃茨67开源Bugu - 防止合盖休眠的macOS菜单栏应用
12:34Hacker News 热门(buzzing.cc 中文翻译)39我们需要不涉及 AI 的科技新闻来源
10:10公众号:数字生命卡兹克70精选分享两个Vibe Coding必备的实用Prompt:第一性原理与对抗式审查
08:04Hacker News 热门(buzzing.cc 中文翻译)56"代币最大化"已死,代币最大化万岁
06:17Simon Willison 博客46Jon Udell:AI 智能体应被邀请进入开发循环,而非将人类排除在外
05:33Hacker News 热门(buzzing.cc 中文翻译)57GLM 5.2 在 IDOR 检测中超越 Claude Code
03:03Hacker News 热门(buzzing.cc 中文翻译)52患者用Claude Code二次解读MRI,AI与人类诊断冲突
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
07:08
Ethan Mollick:One Useful Thing(RSS)
73
聊天机器人的黄昏

前沿AI模型能力加速提升,美国实验室发布速度加快,但政府干预已限制访问Claude Fable和GPT-5.6。Epoch测试发现Opus 4.7自主运行14小时即可完成需2-17周人工的软件工程,token成本$251。中国开源模型落后前沿6-12个月,但性能也快速提升,在AA-Briefcase测试中呈独立指数曲线。使用方式正从聊天机器人转向智能体,OpenAI内部四分之一员工每周同时运行至少四个智能体。Claude Code用户数据显示,领域经验比职业属性更决定使用效果,专家正用智能体替代此前非专家的聊天机器人使用模式。

智能体AnthropicOpenAI大佬观点
关联讨论 25 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
05:37
Hacker News 热门(buzzing.cc 中文翻译)
49
我研制了一台毫米波物料分类雷达

针对欧洲石棉污染严重、传统取样送检成本高昂的问题,作者用 TI IWRL6432 BOOST 开发板和 ESP32 搭建了 FMCW 毫米波雷达原型。DSP 链通过混频、距离 FFT 和 MIMO 阵列角度估计,配合 Capon 波束成形获得材料密度谱,再输入 CNN 进行物料表面分类。天线部分用开源电磁仿真工具 openEMS 建模并模拟全链路,仿真结果与实测接近。项目因资金不足未完成,但展示了低成本非接触式石棉检测的可行路径。

教程/实践数据/训练部署/工程
05:25
Suno:Blog(网页)
40
Dream Relic:用 Suno 为超现实影像配乐

AI 视觉艺术家 Dream Relic(Broc Vaughn)通过 Suno 的 Create 功能,将多年来积累的歌词转化为配乐歌曲,为其超现实、怀旧风格的影像世界赋予声音。他在 TikTok 和 Hooks 上发布的一首 Suno 生成曲目获得数百条评论,甚至有人表示“讨厌 AI 音乐但这是例外”。这一反响促使他更认真对待音乐创作——此前他曾与唱片公司和制作人合作但效果不佳。Dream Relic 正筹备发布全长专辑,并在 TikTok、Hooks、Spotify 等平台上线多首作品。

其他语音
02:19
Simon Willison 博客
50
AI指南针

一个名为“AI指南针”的政治指南针风格测验通过29道关于AI和AI伦理的是非题,将参与者匹配到30种原型之一。作者本人在首次回答后被归类为“The Garage Tinkerer”。该测验以单页React应用实现,利用<script type="text/babel">脚本标签绕过构建步骤。

其他大佬观点开源/仓库
01:28
Claude:Blog(网页)
精选72
Claude Code 入门:智能体循环

Claude Code 团队将智能体循环定义为 agent 重复工作直到满足停止条件的过程,并划分出四种主要类型:turn-based 循环(用户提示触发,Claude 自行判断完成或需更多上下文)、goal-based 循环(通过 /goal 命令设定可验证完成标准与最大轮次)、time-based 循环(通过 /loop 按时间间隔重复执行,可用 /schedule 移至云端)、以及 proactive 循环(基于事件或计划自动运行,无人实时参与)。文章还介绍了如何编写 SKILL.md 文件将人工验证步骤编码,让 Claude 进行端到端自检,减少 turn-based 循环中的手动操作。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic把agentic loops从模糊概念变成四种可复制的模式,附带SKILL.md和命令示例,Claude Code用户读完就能设计更自主的编码流程。
01:03
OpenAI:官网动态(RSS · 排除企业/客户案例)
41
OpenAI 发布 Genebench-Pro 基准测试:10个案例研究详解

OpenAI 推出 GeneBench-Pro 生物医学基准测试,包含 10 个案例研究。每个案例提供原始提示词、数据集和支持材料,覆盖体细胞肿瘤学(结构变异指导的肿瘤治疗获益-风险决策)、功能基因组学(CRISPR 靶点验证:lncRNA 转录本或基因组位点)和统计遗传学(连锁遗传位点中蛋白质药物靶点优先排序)等方向,要求模型输出 JSON 格式分析结果。

OpenAI教程/实践评测/基准
00:42
Dwarkesh Patel:Podcast & Blog(RSS)
精选61
Grant Sanderson 谈 AI 与数学的未来

3Blue1Brown 创办人 Grant Sanderson 正在制作记录 AI 在数学领域进展的新项目。他在与 Dwarkesh Patel 的对谈中指出,AI 在 IMO 获金牌并不等于 AGI,只是又一个被攻克的基准。即使 AI 未来解决千禧年大奖难题,仍可能存在大量人类任务无法被自动化。对话还探讨了概念突破验证周期可长达一个世纪、Riemann 假设的 AI 证明能否被人类理解、AI 能否在已有文献间发现隐藏联系,以及现实经济任务难以套用强化学习环境等话题。

大佬观点推理现象/趋势

推荐理由:这次对谈没有停留在AI刷数学题的喜报上,而是追问了‘验证循环’和‘定义生成’两个终极难题。Grant Sanderson的视角让人重新思考AI的进展究竟缺什么,数学家未来的角色会是什么。
00:37
Hacker News 热门(buzzing.cc 中文翻译)
68
Claude Code 通过隐写术在请求中嵌入环境标记

Claude Code 客户端在向 Anthropic API 发送请求时,利用日期分隔符(- 或 /)和撇号字符('、’、ʻ、ʹ)嵌入环境信息。代码检测 ANTHROPIC_BASE_URL 是否为非官方域名、系统时区是否为 Asia/Shanghai 或 Asia/Urumqi,以及主机名是否匹配中国域名列表(如 baidu.com)或 AI 实验室关键词(deepseek、zhipu 等)。这些列表通过异或 91 的 base64 解码得到。此举旨在标记通过代理、镜像等非官方通道发起的请求,以便 Anthropic 识别来源。

Anthropic安全/对齐编码
00:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选62
OpenAI Signals 数据揭示 ChatGPT 全球采用趋势

OpenAI Signals 数据显示,用户注册六个月后日均消息量增加50%,尝试任务种类翻倍。自2023年7月以来,各大洲活跃用户均大幅增长,非洲和亚洲增速最快,低人类发展指数国家增长尤为显著。用户群体更加多元化,女性名字用户已占全球多数,巴西、哥伦比亚、波兰和纳米比亚等国女性用户显著多于男性。非英语用户占活跃用户半数以上,领先语言为西班牙语、葡萄牙语和阿拉伯语;乌兹别克语、哈萨克语和缅甸语用户占比增长百分比最大。

OpenAI现象/趋势

推荐理由:OpenAI 首次公开用户行为数据,显示使用深度和广度随时间增长、非洲与亚洲增速最快,对做全球化产品的同行是个重要信号。
6月30日
23:29
Hugging Face:Blog(RSS)
49
专业化为何不可避免

Dharma AI 团队引述 Goldfeder、Wyder、LeCun 和 Shwartz-Ziv 于 2026 年发表的论文,从优化理论、生物学和竞争市场论证专业化的必然性。Wolpert-Macready 无免费午餐定理表明,通用优化算法在所有问题上平均表现相同,实际优势来自专门适配;有限资源下,集中资源于有限任务集的系统必然优于平均分配的通用系统。生物学中的特化权衡与市场竞争也指向同一结论:最大化适应性在于精确拟合特定环境,而非追求通用性。

数据/训练现象/趋势
21:30
公众号:数字生命卡兹克
58
国产AI两个"万亿"里程碑:美团LongCat-2.0发布,寒武纪市值破万亿

今天,美团发布LongCat-2.0,1.6万亿参数、100万上下文,全流程在5万张国产算力卡上完成训练和推理,英伟达含量为零,是首个在纯国产算力集群上从零跑通的万亿参数大模型。同日,寒武纪市值突破1万亿人民币,成为科创板首家万亿市值公司。两个“万亿”里程碑叠加Claude封号背景。作者测试显示LongCat-2.0的Agent和Coding能力约在Claude Opus 4.6水平。

数据/训练现象/趋势
19:02
IT之家(RSS)
48
谷歌前工程负责人用Claude Code开发维基百科搜索引擎Zettair,未手动写一行代码

谷歌前工程负责人休·威廉姆斯借助Anthropic的编程助手Claude Code,开发出可正常运行的搜索引擎Zettair,为150万个维基百科条目建立索引。该引擎支持搜索自动补全、关键词摘要片段、相关搜索推荐、热门话题榜单以及AI生成的内容摘要。威廉姆斯未手动编写一行代码,但底层检索框架源自其21世纪初参与研发的信息检索系统。他认为,Claude Code只有在深厚专业技术功底的配合下才能发挥最佳效果,经验丰富的工程师永远是最出色的“指导者”。

Anthropic大佬观点搜索编码
17:02
IT之家(RSS)
57
TrendForce:AI需求排挤产能,晶圆代工成熟制程涨价预计延伸至2027年

AI Server、General Purpose Server与Edge AI需求升温,晶圆代工产能向AI倾斜。八英寸制程受惠于Power订单增量及台积电、三星减产,产能利用率与代工价格强势拉升。十二英寸成熟制程因台积电减产、Power IC订单强劲、AI排挤及原物料通膨,涨价氛围已形成,部分制程在2026年第二至第三季调涨5-10%,并意图2027年全面调涨。消费电子成本压力下客户协商暂缓2026年下半年涨价,但2027年价格调升仍难以避免。

现象/趋势部署/工程
16:37
Hacker News 热门(buzzing.cc 中文翻译)
43
Moondream Photon 通过流水线解码消除 GPU 气泡,提升 35% 吞吐量

Moondream 推理引擎 Photon 在 NVIDIA B200 上实现约 33ms 近实时 VLM 推理。其利用流水线解码技术,将 GPU 计算与 CPU 任务重叠,消除传统循环中 GPU 空闲等待的“GPU 气泡”,使解码吞吐量提升高达 35%。文章详述三种关键机制:乒乓缓存槽位避免缓冲冲突、前向计算与采样解耦实现受约束解码、以及已结束请求的清理流程(zombies)。

推理教程/实践部署/工程
15:02
IT之家(RSS)
55
AI 老板 500 天模拟经营:多数模型亏惨,Claude Fable 5 独占鳌头

普林斯顿大学发布 CEO-Bench 基准测试,模拟创业公司 500 天经营,启动资金 100 万美元,评估 AI 模型担任 CEO 的能力。多数模型在 500 天后破产。最佳单次运行中,Claude Fable 5 期末现金达 4715 万美元,是唯一多次运行均高于初始余额的模型;Claude Opus 4.8 为 2778 万美元,GPT-5.5 为 2130 万美元。Grok 4.20 平均仅存活 28 天,DeepSeek V4 Pro 和 Gemini 3 Flash 亦全部破产。基于规则的基准模型最终余额为 1580 万美元。

智能体Anthropic推理评测/基准
15:02
IT之家(RSS)
53
优必选创始人周剑:机器人将替代手机,成为AI最核心的交互终端

在2026年度全球发布会上,优必选创始人周剑指出,机器人将替代手机成为AI最核心的交互终端,用户用自然语言下达指令即可获得服务与情感陪护,交互方式从手动变为口述,奠定机器人在家庭的终端入口地位。同日,优必选宣布超仿生人形机器人优世界U1系列订单已突破1万台,力争今年交付。该机器人主打情感陪伴,分男女两款,各搭载88个高自由度运动关节。作为对比,2025年全年优必选全尺寸具身智能人形机器人总销量为1079台。

具身智能大佬观点
14:27
Google Blog:AI(RSS)
54
英国职场AI采用率翻倍,仅15%"AI先锋"获得晋升加薪优势

Google UK与Public First研究发现,英国职场AI采用率一年内从34%升至73%,但呈不均衡曲线。仅15%的“AI Trailblazers”(深度用户)晋升概率高84%、绩效高88%、加薪概率高55%,每周节省近8小时。其余85%仍处于旁观、实验或实践阶段。阻碍因素包括:一次即弃的提示词习惯、搜索框思维、缺乏明确使用许可。Public First推出AI技能测验,Google的“AI Works for Britain”计划支持2030年前培训1000万工人AI技能的目标。

Google现象/趋势
12:27
TechCrunch:AI(RSS)
精选71
AI就业争论变得更加混乱

截至2026年5月,AI相关裁员接近9万个,预计未来五年美国最多15%的岗位将被AI替代。但Ramp与Revelio Labs对近22,000家公司的报告发现,高AI投入企业(前三个月人均月均支出30美元)总员工数增长10.2%,入门级岗位增长12%。报告认为AI并非普遍导致岗位消失,而是在资源充裕的科技企业里成为扩张工具——降低工程、销售、客服等职能的生产成本,从而推动整体增员。但仅购买订阅而未持续投入的公司未见人头增长,可能加剧企业间的资源鸿沟。

其他现象/趋势

推荐理由:报告用雇佣数据驳斥了「AI消灭就业」的简单说法,付费多的公司反而在扩招甚至增加初级岗,但样本都是快速增长的科技公司,分化隐忧仍在,值得人力决策者细看。
12:02
IT之家(RSS)
57
Claude Code 负责人称未来员工将身兼数职,工程产品设计融为一体

Claude Code 负责人鲍里斯·切尔尼认为工程、产品和设计正逐渐融合。他将其团队成员分为五类:原型设计者、构建者、清理者、增长者和维护者,许多成员身兼多职。健康团队需具备全部五种能力,未来产品岗位可能不再按专业领域区分。Figma CEO 迪伦·菲尔德也认同传统职位边界正在消失,部分企业已弃用“管理者”称谓。切尔尼强调角色会随时间和项目改变,且 Claude 能在不同程度上协助所有类型工作。

Anthropic大佬观点编码
11:36
Hacker News 热门(buzzing.cc 中文翻译)
53
hyperscript 解析bug修复:AI分析高效但修复方案欠佳

hyperscript 0.9.91版本出现回归:表达式fetch \{% url 'trade:get_symbol_data' %}?symbol=${symbol}\ as JSON中as JSON被错误地当作表达式转换而非fetch修饰符。作者用Claude快速定位根因——重构时提取的parseURLOrExpression()方法让fetch后接完整表达式,导致as被表达式消费。Claude提出两个修复方案:第一个仅支持字面字符串,无法处理fetch $url as JSON;第二个引入noConversions标志,增加不必要的上下文敏感性。作者最终利用hyperscript已有的“follows”机制简洁解决问题。案例展示了AI在问题分析上的高效与在设计优雅修复上的局限,印证了“巫师学徒”陷阱。

大佬观点开源生态编码
11:29
MarkTechPost(RSS)
48
Top 6 无代码 AI 工具速览(涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架)

Atoms 是无代码平台,支持零基础设施、多智能体架构并即时连接 GPT 与 Gemini。Sim AI 是开源可视化 AI 智能体工作流工具,提供拖拽画布、80+ 集成及 MCP 支持,可云托管或 Docker 自部署。RAGFlow 是检索增强生成引擎,支持多格式文件建立知识库,连接 LLM(API 或 Ollama),具备检索质量验证。Transformer Lab 是免费开源本地 LLM 与扩散模型工作站,支持下载、对话、图像生成、微调(含 RLHF)、RAG 及嵌入计算。LLaMA-Factory 支持 100+ 模型及 SFT、PPO、DPO、LoRA、QLoRA 等训练方法。

智能体教程/实践部署/工程
11:06
Hacker News 热门(buzzing.cc 中文翻译)
48
形式化验证:你能对软件做出哪些保证?

形式化验证的成本和工具已进入可广泛使用阶段,AI消除了编写证明的最大障碍。与仅覆盖有限输入的测试不同,形式化验证通过验证语言(如Dafny、Lean、Rocq)编写属性和代码,由SMT求解器自动检查所有可达状态是否满足规范——例如权限系统的子集不变性,确保派生权限始终是父权限的子集。验证保证是绝对的:只要规范正确,代码在所有状态下都不会违反属性。过去编写证明需要博士级技能且工具缓慢,如今这一门槛正在降低。

教程/实践部署/工程
10:10
公众号:数字生命卡兹克
精选67
具身智能数据采集员:日薪200元起,给机器人当老师

具身智能数据采集员以日薪200-250元招兼职,无需学历经验。面试先测量身高体重以适配采集手套,并询问是否晕VR。工作分两种:遥操作采集——穿戴设备控制双臂机器人完成分拣积木、叠纸杯等动作;无机器人示教采集——徒手重复动作(如叠衣服),设备记录轨迹。全球高质量物理交互数据截至2026年初仅约50万小时,不足大语言模型训练数据的两万分之一,需大量人力从零采集。

具身智能现象/趋势

推荐理由:具身智能的数据采集正在催生一种日结兼职,这篇文章把镜头对准了那些教会机器人叠纸杯的普通人,给我一种强烈的割裂感——最前沿的技术和最传统的用工方式在这里合体了。
04:34
Tomer Tunguz 博客(VC 分析)
精选58
Anthropic:当AI成本超过工程师薪酬

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。

Anthropic大佬观点数据/训练

推荐理由:Tomer Tunguz 用数据把 AI 公司的烧钱速度拆得很细,Anthropic 每个工程师年算力成本 51.5 万美元,是工资的 2.3 倍,这个数字对重新理解 SaaS 毛利率很有冲击力。
02:35
Hacker News 热门(buzzing.cc 中文翻译)
精选75
Qwen 3.6 27B 是本地开发的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版(含多 token 预测)可达 30 tokens/s;用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务,作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B,但作者推荐 27B 版本。

开源生态端侧评测/基准

推荐理由:一篇详实的 Qwen 3.6 27B 实战评测,从创意写作到代码生成都测了,还给出了 llama.cpp 部署命令和性能数据,想本地跑模型的开发者可以直接抄作业。
01:05
Hacker News 热门(buzzing.cc 中文翻译)
48
运行 CUDA 内核时会发生什么?

一个简单的CUDA向量加法程序在RTX 4090上运行,背后需执行上千万条CPU指令、操作数个设备文件、发出约900次ioctl并访问一个内存映射doorbell寄存器。程序经nvcc编译,设备代码先由cicc转为PTX虚拟ISA,再由ptxas转为SASS机器码,最终正确完成1+1=2的一百万次计算。

教程/实践编码
6月29日
23:55
Google Blog:AI(RSS)
39
问AI专家:全栈AI到底是什么?

一位Google专家解释了全栈AI方法的含义,并指出这一方法长期以来一直是Google AI工作的基础。

Google教程/实践部署/工程
22:43
Gary Marcus:The Road to AI We Can Trust(RSS)
6
Gary Marcus 宣布离线度假,附 AI 生成自行车事故趣图

Gary Marcus 在最新帖子中宣布即将离线度假,并分享了一张 Oren Etzioni 发送的 AI 生成自行车事故图片(源自真实的 REI 广告),同时提及了“The Klarna Effect”彩蛋。

其他
22:05
Hacker News 热门(buzzing.cc 中文翻译)
63
对人工智能时代软件工程的思考

作者以软件工程师和小说家双重身份,对比AI前后的典型工作流。AI通过学习万亿行公开源代码,已能持续生成高质量代码,但开发者角色从亲手编写变为“编辑”:撰写提示词、审查AI输出、必要时修改或合并代码。AI如同能力合格但缺乏二十年后系统级知识与机构记忆的初级/中级开发者,无法理解法律合规、外部系统延迟、未来功能冲突或敏感数据安全风险。资深开发者必须核验和修正看似可用的AI代码。文章同时类比历史小说家研究过程,指出深度沉浸的心流体验仍是核心。

现象/趋势编码
18:10
公众号:蚂蚁百灵(Ling)
51
如何优雅地给 MLA 加上 QK-Norm?

DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache,但 QK-Norm 需归一化高维 Key,若缓存归一化结果则打破低维优势。文章提出数学等效变换:将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧,推理时每个 token 只需额外缓存一个逆 RMS 标量,即可严格等价实现 QK-Norm,不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中,QK-Normed MLA 相比 QK-clipping loss 更低(1B 模型 gap ~0.02),训练更稳定且收敛更快。

DeepSeek推理教程/实践数据/训练
18:01
IT之家(RSS)
38
OpenAI Codex 负责人:人工智能仍无法做好创意设计

OpenAI Codex 项目负责人安布罗西诺称,设计比代码更难量化评判,训练模型区分优劣设计比验证代码编译更繁琐。Figma 首席执行官菲尔德指出,AI 模型基于数据分布训练,产出通常平庸。格莱美提名音乐人巴斯强调,引导 AI 创作离不开人类审美判断。目前 AI 在创意设计领域主要作为提速工具,无法独立产出成熟成品。

OpenAI图像生成大佬观点
17:17
Artificial Intelligence News(RSS)
28
自然语言处理正在改变专业社交网络

自然语言处理技术正重塑专业社交网络的沟通方式,提升个性化与关联性。核心功能包括消息意图检测、语气风格适配、长篇资料摘要及多语言支持。语义匹配取代关键词匹配,基于共同目标与项目推荐更精准的连接。但AI生成消息可能引发隐私担忧,模型幻觉和语言偏见威胁信任。未来方向包括设备端小型语言模型、隐私保护推理及更严格评估指标,以在透明安全前提下维护真实人际关系。

搜索现象/趋势
14:34
Hacker News 热门(buzzing.cc 中文翻译)
53
HackerRank 将其 ATS 开源,评分不稳定引发争议

HackerRank 将其 ATS(申请人跟踪系统)开源。开发者测试发现,默认模型 gemma3:4b 在 temperature 0.1 下对同一份简历运行 100 次,得分范围 66–99。若公司分数线设为 85,简历有 65% 的概率被刷掉。改用 Gemini 后分数集中在 48–64,若分数线 60 仍有 28% 的失败率。评分标准中“工作经验”项始终给出 25/25 满分(即使只有一个实习),而“个人项目”项波动巨大。作者指出,LLM 适合解析简历结构,但无法稳定评判经验价值,AI 筛选实质是运气过滤。

GitHub开源生态评测/基准
13:50
公众号:卡尔的AI沃茨
67
开源Bugu - 防止合盖休眠的macOS菜单栏应用

Bugu(布谷)是一款macOS菜单栏应用,防止合盖后电脑休眠,通过心跳音效提示Agent的五个状态:接收任务(Accept)、运行中(Running)、成功(Done)、中断(Interrupted)和授权(Permission)。支持跳转到具体对话界面。由作者使用Codex和Kimi Code K2.7 Code Highspeed联合开发,Kimi Code在中等编码任务中达180 token/s,短上下文任务260 token/s,速度提升6倍,可导入Claude Code和Codex的skill及MCP。项目已在GitHub开源。

智能体开源/仓库编码
12:34
Hacker News 热门(buzzing.cc 中文翻译)
39
我们需要不涉及 AI 的科技新闻来源

Hacker News 用户发帖呼吁科技新闻平台应提供排除 AI 内容的筛选功能或替代来源,认为 Techmeme 等站点已被 AI 新闻淹没。评论中有人支持这一需求,认为应保留非 AI 科技讨论空间;也有人指出 AI 技术本身具有颠覆性价值,应区分商业炒作与真正的工具创新,并观察到 AI 帮助无编程经验者开发出实用应用。另有资深程序员表示期待接手清理“vibe code”的咨询业务。

搜索现象/趋势
10:10
公众号:数字生命卡兹克
精选70
分享两个Vibe Coding必备的实用Prompt:第一性原理与对抗式审查

作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。

教程/实践编码

推荐理由:这两个 Prompt 把 Vibe Coding 从碰运气变成了有方法,第一性原理堵设计漏洞,对抗式审查堵代码漏洞,卡兹克用自己项目的真实翻车案例讲透,是我读过最实用的编程 Prompt 技巧。
08:04
Hacker News 热门(buzzing.cc 中文翻译)
56
"代币最大化"已死,代币最大化万岁

Meta 等公司将员工 token 用量纳入绩效评估,导致出现让两个 AI 智能体全程对话刷量的浪费行为。几个月后,随着 OpenAI 和 Anthropic 提高 API 定价、削减订阅额度,各团队撤回无限 token 消耗政策。然而,AI 能力进入新阶段:过去长时间无监督运行会因模型幻觉积累“复合错误”,现在更多 token 投入反而带来“复合正确性”——耗费越多 token 越可能获得正确结果,代币最大化以新理由重生。

AnthropicOpenAI大佬观点安全/对齐
06:17
Simon Willison 博客
46
Jon Udell:AI 智能体应被邀请进入开发循环,而非将人类排除在外

Jon Udell 反对“human in the loop”的表述,认为它将权威让渡给机器。他主张翻转叙事——人类本就主导工作循环,现在应主动招募 AI 智能体加入团队。智能体辅助的开发过程不应是“输入提示词、输出功能”的黑箱,而是人类邀请智能体协作的开放循环。

智能体大佬观点编码
05:33
Hacker News 热门(buzzing.cc 中文翻译)
57
GLM 5.2 在 IDOR 检测中超越 Claude Code

Semgrep 团队用 IDOR 基准测试比较开源模型与前沿编码智能体。GLM 5.2(智谱 AI,开源权重,MIT 许可)以 39% F1 成绩超越 Claude Code(32%),每发现一个漏洞成本约 0.17 美元,但仍低于 Semgrep 多模态流水线(53–61% F1)。GLM 5.2 采用 MoE 架构,总参数 7500 亿,每 token 仅激活约 400 亿,支持 200K 至 1M token 上下文。在 Terminal-Bench 2.1 上得分 81.0(GLM 5.1 为 63.5,Claude Opus 4.8 为 85.0),SWE-bench Pro 上达 62.1。定价约为同类前沿模型的六分之一。Z.ai 披露 GLM 5.2 在训练中存在更多奖励黑客行为,已构建反黑客防护。

安全/对齐开源生态编码评测/基准
03:03
Hacker News 热门(buzzing.cc 中文翻译)
52
患者用Claude Code二次解读MRI,AI与人类诊断冲突

一名患者因右肩疼痛接受MRI扫描,人类医生诊断为肩胛下肌腱Grade III(>50%宽度)部分厚度撕裂。患者将约266MB的DICOM文件交给Claude Code中的Opus 4.8(xhigh)分析,一小时后Opus报告肌腱完整、未发现撕裂。随后让Opus仲裁人类报告与自身分析,Opus以中高置信度支持AI解读,结论为轻度插入性肌腱病、无离散部分或全厚撕裂。此前GPT 5.5 Pro已指出医生进行了不符合指南的冲击波治疗(无钙化肩袖肌腱病)以及注射了登记为顺势疗法的Traumeel。

Anthropic现象/趋势
‹ 上一页
1234…42
下一页 ›