4月27日
01:45
Hacker News 热门(buzzing.cc 中文翻译)
精选71
为什么 SWE-bench Verified 不再衡量前沿编码能力

OpenAI宣布停止使用SWE-bench Verified基准评估前沿编码能力。该基准基于GitHub历史问题构建,其任务分布已无法准确反映当前AI编码助手需解决的实际问题类型。随着模型性能提升,基准测试集趋于饱和,区分度下降,现有模型表现已接近人类水平。因此,团队将转向更具挑战性和现实复杂度的新评估方法。

OpenAI大佬观点编码评测/基准

推荐理由:OpenAI 亲自给 SWE-bench Verified 判了死刑,这比任何第三方评测都有说服力。做 coding agent 选型的人该认真想想,你的 benchmark 体系是不是也该换了。
00:00
Mistral AI:News(网页)
精选68
Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持

Mistral AI 正式推出 Workflows 公开预览版,该产品定位为企业AI的编排层,旨在通过提供持久性、可观察性和容错性,帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台,允许开发者用Python编写工作流,并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行(支持从断点恢复)、完整的步骤跟踪与审计,以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程,将原本耗时数小时的人工操作缩短至几分钟。

智能体产品更新部署/工程

推荐理由:Mistral 把 Temporal 的持久执行引擎包装成企业 AI 编排层,解决的是「demo 能跑、上线就挂」这个最痛的落地问题。做企业级 Agent 的团队值得认真看看,尤其是 human-in-the-loop 那个 wait_for_input 一行代码的设计。
00:00
Anthropic:Newsroom(网页)
43
Anthropic 任命澳新总经理并正式开设悉尼办公室

Anthropic 正式任命 Theo Hourmouzis 为澳大利亚和新西兰总经理,并同步开设悉尼办公室。Hourmouzis 拥有超过20年的亚太科技行业领导经验,将负责制定本地战略,推动 Claude 人工智能进入客户核心业务。公司正深化与联邦银行等企业的合作,并与澳大利亚国立大学等研究机构推进 AI for Science 项目。同时,Anthropic 近期与 Canva、Xero 建立了深度平台合作。悉尼办公室是其在亚太地区的最新布局,旨在贴近当地客户与市场。

Anthropic行业动态
00:00
Runway:News(网页)
精选58
无闲置GPU:Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。

教程/实践部署/工程

推荐理由:Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记,利用率翻倍的方案和踩坑细节都有,做大规模训练集群调度的团队可以直接抄作业。
00:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
46
Our Principles

OpenAI 联合创始人 Sam Altman 阐述了指导公司工作的五项核心原则。这些原则围绕确保 AGI(通用人工智能)惠及全人类的使命展开,具体包括:致力于开发安全有益的 AGI;持续推动前沿技术研究;广泛共享研究成果与收益;积极与全球政策制定者合作应对风险;以及确保 AGI 的发展不被过度商业化垄断,最终服务于人类的整体福祉。

OpenAI大佬观点
4月26日
23:38
Hacker News 热门(buzzing.cc 中文翻译)
42
Eden AI--OpenRouter的欧洲替代方案

Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。

产品更新开源生态部署/工程
22:56
IT之家(RSS)
63
降至原有价格 1/10,DeepSeek API 输入缓存降价

DeepSeek宣布全系API服务的输入缓存命中价格即日起降至原有价格的十分之一。其中,DeepSeek-V4-Pro模型的输入缓存命中价格从每百万tokens 1元降至0.025元,输入缓存未命中价格从12元降至3元,输出价格从24元降至6元。DeepSeek-V4-Flash模型的输入缓存命中价格从0.2元降至0.02元。此外,Pro模型在5月5日前还可叠加享受2.5折限时优惠。

DeepSeek行业动态部署/工程
22:12
IT之家(RSS)
59
古尔曼:库克为苹果留下十大新产品线研发计划,新任 CEO 特努斯首秀定档 9 月折叠屏 iPhone 发布会

苹果新任CEO约翰·特努斯将于9月1日上任,其首秀是发布首款折叠屏iPhone。该产品主打耐用性、低折痕及展开后类似iPad的横向屏幕,预计售价2000美元起。特努斯上任后,苹果计划开启约10个全新产品类别的研发,包括AI智能家居设备、AI可穿戴产品、触控屏Mac、AR眼镜及可折叠iPad等。此外,他表示将继续扩展年收入约1000亿美元的服务业务,并推进AI与Siri的升级。

现象/趋势行业动态
19:20
IT之家(RSS)
29
吉利第 5 代帝豪 i-HEV 智擎混动亮相 2026 北京车展,百公里油耗 2.22L 刷新吉尼斯世界纪录

吉利汽车在北京车展首秀第5代帝豪i-HEV智擎混动车型。该车基于BMA Evo架构打造,搭载的i-HEV混动系统在海南环岛高速实测中取得百公里综合油耗2.22L的成绩,刷新吉尼斯世界纪录,比丰田普锐斯同类测试低12%以上。系统采用P1+P3双电机解耦设计,驱动电机最大功率230kW,专用发动机热效率达48.41%。WLTC工况下电驱主导超80%,0-30km/h加速1.84秒。该系统已通过等效480万公里的耐久测试,2026年将率先搭载于星瑞、星越L等中国星系列主销车型。

其他行业动态
19:09
IT之家(RSS)
27
鸿蒙智行全新一代问界 M9 汽车"成精":会卖萌、能说话,还可以开箱送礼

华为余承东通过视频展示了全新一代问界M9的智能交互功能。该车具备车外语音能力,不仅能与人打招呼、自我介绍,还能主动打开前备箱送出礼物,并通过轻晃车身“卖萌”表达情绪。新车搭载超140项创新技术,实现全面重构。目前华为官网已开启预订,标准版预售价49.98万元起,配备双腔双阀、后轮转向、6激光雷达并首发ADS 5系统,全系采用800V高压平台。同时推出的问界M9 Ultimate领世加长版预售价66.98万元起,搭载2.0T增程器与三电机,提供专属设计与座舱体验。

产品更新具身智能
18:20
The Decoder:AI News(RSS)
69
OpenAI 表示旧提示词拖累 GPT-5.5,开发者需要新基准

OpenAI 指出,为 GPT-5.5 沿用旧提示词会阻碍模型性能,开发者应摒弃过往模式,从零开始、最小化设计提示词以建立全新基准。角色定义重新成为框架的前沿核心,此前它曾被部分开发者视为不必要,现在则被强调为优化交互的关键。这一调整旨在帮助开发者更有效地利用 GPT-5.5 的先进能力,提升应用效果。

OpenAI教程/实践编码
关联讨论 2The Decoder:AI News(RSS)Simon Willison 博客
17:18
The Decoder:AI News(RSS)
61
500名投资银行家评审AI输出,发现无一可交付客户

一项新基准测试让GPT-5.4和Claude Opus 4.6等顶级模型处理初级投资银行家的日常任务。评审结果显示,没有任何一个AI输出被评定为可直接交付客户,其内容存在不精确或完全错误的问题。尽管如此,超过半数的银行家表示,他们会将AI输出作为工作的起点。

智能体现象/趋势评测/基准
16:50
The Decoder:AI News(RSS)
38
调查显示:在美国,Claude的周活跃用户比其他AI助手用户富裕得多

一项针对美国主要AI助手用户收入的调查显示,Claude的用户群体收入显著更高。其周活跃用户中,年收入超过15万美元的高收入者占比高达41%,远高于ChatGPT(28%)、Google Gemini(24%)和Microsoft Copilot(20%)。而在年收入低于5万美元的用户中,Claude的占比最低,仅为11%。这些数据表明,Claude在美国市场成功吸引了更为富裕的用户,其用户收入结构与竞争对手形成了鲜明对比。

Anthropic现象/趋势行业动态
16:12
The Decoder:AI News(RSS)
51
研究者认为:AI agent 并非取代软件工程,而是将其拓展至远超代码的范畴

查尔姆斯理工大学和沃尔沃集团的研究人员在一篇新论文中指出,认为AI智能体将取代程序员的主流观点并不准确。研究认为,AI智能体不会导致软件工程消亡,而是将这一学科的核心活动从传统的代码编写,大幅拓展至更广泛的系统设计、需求工程、测试与维护等领域。这意味着软件工程师的角色将发生演变,其工作范畴将远远超出单纯的编程。

智能体现象/趋势编码
关联讨论 1IT之家(RSS)
15:01
IT之家(RSS)
43
国内首家、全球第四家,砺算科技 7G100 显卡通过微软 WHQL 认证

砺算科技7G100显卡已通过微软WHQL认证,成为国内首家、全球第四家获得该认证的GPU公司。WHQL认证是微软针对硬件与Windows系统兼容性和稳定性的严格测试标准。7G100系列GPU采用TrueGPU架构,基于6nm制程工艺,从计算核心到整体架构均为砺算科技自主研发,不依赖外部技术授权,显著提升了应对外部技术限制风险的能力。

开源生态端侧行业动态
13:53
IT之家(RSS)
53
今天起,DeepSeek V4 成 OpenClaw 默认模型

OpenClaw 2026.4.24版本发布,重磅接入DeepSeek V4模型。其中,DeepSeek V4 Flash被设为默认大模型,V4 Pro也已上线模型库。V4 Pro拥有1.6万亿总参数和49B激活参数,是全球最大的开源模型;V4 Flash总参数284B,激活参数13B。两者均采用MoE架构,支持100万token上下文,并以MIT协议开源。此次更新还深度整合了Google Meet作为内置插件,支持实时语音通话、会议记录处理与导出。同时,系统修复了多轮工具调用中的逻辑错误,增强了浏览器自动化的稳定性和坐标点击等兜底功能,并优化了插件与模型的架构以降低启动负担。

智能体DeepSeek产品更新
13:40
IT之家(RSS)
29
斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐

在2026北京国际车展上,斑马智能与东风研发总院宣布,基于元神AI的淘宝闪购Agent将首次搭载于东风天元智舱。该功能允许用户仅通过自然语音完成全流程点餐,能精准识别模糊意图、自动匹配门店并推荐餐品,支持自由对话与订单中途修改。服务覆盖全品类美食,原生集成于座舱系统,可实现优惠自动叠加、配送时间智能联动导航。未来双方还计划在影音娱乐、出行游玩等场景推出更多原生Agent服务。

智能体MCP/工具行业动态
13:22
IT之家(RSS)
32
南航国产大飞机 C919 广州往返合肥新航线开通

4月26日,南航国产大飞机C919成功执飞广州至合肥往返新航线,合肥成为C919商业通航的第23座城市。该航班搭载144名旅客。南航目前拥有10架C919,已将其集中投放在广州往返北京大兴、武汉、南京等主要航线。截至目前,C919机型已执行航班超9500班次,运送旅客近130万人次。南航在C919上部署了自主研发的飞机健康监控系统“天瞳系统”,用于实时监测和预测故障。

其他行业动态
12:07
IT之家(RSS)
28
微信鸿蒙版 App 获 8.0.17.34 尝鲜升级,视频号补全大量特性

微信鸿蒙版 App 在华为应用市场推出 8.0.17.34 尝鲜升级,测试期至2026年5月24日。此次升级虽官方称修复已知问题,但实际新增大量特性:视频号功能大幅补全,支持修改资料、新注册、播放页面旋转和双击点赞;听一听新增AI写歌和AI翻唱,并支持QQ音乐打开歌曲;微信卡包增加会员卡,引用图片可滑动查看,长按应用图标新增“我的二维码”快捷方式。此外,该版本安装量已突破5000万次。

产品更新端侧
11:39
Hacker News 热门(buzzing.cc 中文翻译)
62
一名借助ChatGPT的业余爱好者解决了埃尔德什问题

一名业余数学爱好者借助ChatGPT成功解决了一个存在60年的埃尔德什难题,这一突破在Hacker News上获得108点热议。该问题长期悬而未决,此次解决展示了人工智能工具在辅助数学研究中的潜力,突显了AI如何赋能非专业研究者推动科学进展。

OpenAI推理现象/趋势
11:33
IT之家(RSS)
49
国家超算互联网推出 DeepSeek-V4 限时免费对话服务

4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。

DeepSeek产品更新开源生态
11:30
IT之家(RSS)
27
捷达向智能电动赛道转型,计划两年内推出 4 款新能源车型

在2026北京车展上,捷达品牌宣布全面向智能电动转型,并发布了新能源序列的全新LOGO。品牌计划在未来两年内推出4款新能源车型,其中首款纯电轿车捷达M6将于今年下半年上市。智能化方面,捷达自主研发了捷思架构平台,支持AI座舱与智能驾驶功能,并集成了豆包和DeepSeek大模型以提升泊车及NOA体验。同时,品牌销售网络将拓展至超过600家,并计划进军中亚、非洲等海外市场。

端侧行业动态
11:17
IT之家(RSS)
47
英特尔财报超预期股价暴涨,陈立武称一年前外界还在担心我们能否活下去

英特尔第一季度营收达136亿美元,同比增长7%,远超预期,推动其股价盘后暴涨超22%。公司预计本季度营收将继续增长。CEO陈立武指出,市场焦点已从一年前担忧其生存,转向关注其如何快速扩大产能以满足需求。他强调,在AI时代,CPU正重新确立基石地位,特别是在模型推理环节,GPU与CPU的配比正从训练时的1:7-8向推理时的1:3-4转变。不过,公司仍面临英伟达、AMD及ARM架构的竞争,其晶圆代工业务与先进制程的前景也存在不确定性。

行业动态部署/工程
10:43
IT之家(RSS)
45
Momenta R7 强化学习世界模型北京车展量产首发

在北京车展上,Momenta正式宣布其强化学习世界模型R7实现量产首发。该模型通过“World Model Prediction”预测物理世界未来状态与交互逻辑,旨在让AI理解物体物理属性、运动因果关系及交互可能性。其技术架构分为三层:基于海量驾驶数据的世界模型预训练、用于自动驾驶闭环仿真的世界模型仿真,以及在模型内进行的强化学习虚拟训练。目前,Momenta已交付超70款量产车型,累计定点车型超200款,本次车展有超过20个品牌的60余款车型搭载了其智驾方案。

产品更新具身智能部署/工程
10:35
Hacker News 热门(buzzing.cc 中文翻译)
56
知识工作的幻象

文章《知识工作的幻象》批判了现代知识工作日益沦为一种“拟像”的现象。大量工作偏离创造真实价值的核心,转而追求流程合规、指标可视化和内部沟通等形式。工作者将超过40%的时间耗费在制作报告、更新看板和参加会议等“表演性”任务上,而非实质性产出。这不仅降低了工作效率与创新潜力,还加剧了职业倦怠,最终使工作本身异化为一场空洞的仪式。

大佬观点现象/趋势
10:10
IT之家(RSS)
38
京东启动"Aidol 创造营"计划,面向全球征集 AI 智能硬件项目

京东于4月26日启动“Aidol 创造营”计划,面向全球征集AI智能硬件项目,目标在今年孵化101个标杆产品。该计划对新品牌、初创团队、开发者及高校实验室开放,不设公司规模与销售门槛,注重产品独特性、技术突破与用户体验。入选项目将获得资本对接、全链路包销、技术开放、出海支持和全域曝光五大核心资源支持。报名截止至5月15日,首期活动将于5月25日至6月18日与京东618联动,前十名有机会获得京东百万台包销资源。

智能体端侧行业动态
10:09
IT之家(RSS)
59
融合活体脑细胞与电子技术,新型生物计算机可完成模式识别

普林斯顿大学研发出一种融合活体脑细胞与嵌入式电子技术的三维生物电子计算机,能完成模式识别任务。该器件在环氧树脂基底上构建了微型导线与电极的三维网状支架,培育了数万个神经元形成大型三维网络,实现了对神经元电活动的高精度记录与刺激。在六个月的研究中,系统成功区分了两种不同的输入脉冲模式。研究人员计划扩大器件规模以处理更复杂任务,并期望借此探索大脑的低能耗运算机制,为降低人工智能系统功耗提供新途径。相关论文已发表于《自然・电子学》期刊。

具身智能数据/训练论文/研究
08:47
IT之家(RSS)
41
Momenta 曹旭东研判:智驾领域中国最多 3 家、全球最多 4 家供应商会胜出

Momenta CEO曹旭东在北京车展期间指出,智能驾驶行业规模效应与先发优势极强,软件边际成本为零,规模能同时推动成本下降与体验提升。他判断行业格局将快速收敛,最终中国市场上仅会有2至3家、全球范围内仅会有3至4家供应商胜出。目前,Momenta已与全球多家主流车企合作,累计定点车型超200款,交付量产车型70余款,解决方案搭载车辆突破80万台,并已出海至10个国家。上汽大众全新SUV ID. ERA 9X将全球首发搭载其按L4级标准打造的R7强化学习世界模型。

大佬观点现象/趋势行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
48
Talker-T2AV:基于自回归扩散建模的联合语音-视频生成

Talker-T2AV提出了一种自回归扩散框架,用于联合生成语音和视频。其核心设计是将高级语义建模与低级细节渲染解耦:一个共享的自回归语言模型在统一的块级标记空间中对音视频进行联合推理,而两个轻量级的扩散Transformer头则分别解码出帧级的音频和视频潜在表示。该方法避免了现有模型在去噪过程中全程强制跨模态纠缠的弊端,更符合语音驱动面部合成任务的特点。在语音肖像基准测试中,该模型在唇部同步准确性、视频质量和音频质量上均优于双分支基线,实现了比级联方法更强的跨模态一致性。

多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
人格特质影响大语言模型叙事中的性别偏见:英印双语实证研究

本研究通过六款先进大语言模型生成23,400个故事,系统探讨人格特质对性别偏见的影响。研究采用HEXACO和黑暗三联征人格框架,以特定性别、职业生成印度职场人士的英语和印地语故事。结果显示,人格特质能显著影响性别偏见的程度与方向,黑暗三联征人格比HEXACO特质更易引发性别刻板印象,且这种关联因模型和语言而异。这表明大语言模型的性别偏见具有动态性和情境依赖性,在实际应用的人格驱动系统中,可能加剧教育、职业等内容中的不平等表征危害。

安全/对齐数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
PageGuide:辅助用户在网页中导航与定位信息的浏览器扩展

PageGuide是一款浏览器扩展,通过视觉叠加将大语言模型的回答直接锚定在网页中,以解决用户在杂乱页面中定位信息、完成多步骤任务和对抗干扰内容三大需求。它提供三种模式:Find模式原位高亮答案来源以供验证;Guide模式分步显示操作指南引导用户执行;Hide模式帮助隐藏干扰内容。一项涉及94名用户的研究表明,该工具在所有模式下均显著优于无辅助浏览,例如Hide模式使任务准确率大幅提升、完成时间缩短70%,Guide模式提高任务完成率,Find模式则减少80%的Ctrl+F使用并缩短任务时间。代码与演示已开源。

智能体MCP/工具论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
47
学习识别3D LiDAR异常分割中的分布外物体

在自动驾驶和机器人感知中,异常分割对区分已知类与未知物体至关重要,但3D领域研究有限。本文提出一种高效新方法,直接在特征空间操作,通过建模内点类的特征分布来约束和识别异常样本。针对现有公开数据集场景简单、异常实例少及传感器分辨率域差异问题,我们构建了混合真实-合成3D LiDAR异常分割数据集,基于成熟语义分割基准,包含多样分布外物体和复杂环境。大量实验表明,该方法在现有真实数据集上达到最优性能,在新数据集上也有竞争力,验证了方法有效性和数据集实用性。代码与数据集已公开。

具身智能数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
52
RaV-IDP:基于重建验证的可靠智能文档处理框架

智能文档处理管道常因缺乏验证机制,导致提取错误无声传递至下游系统。RaV-IDP框架创新性地引入重建作为核心组件,在提取每个实体后,通过专用重建器将结果渲染回与原文档区域可比的形式,并由比较器评估重建与原始截图的保真度,生成无需标注的质量信号。若保真度低于实体类型阈值,系统触发基于GPT-4.1 Vision的结构化回退机制并重复验证循环,始终以原始文档区域为锚点,避免循环依赖。该框架还提供了每阶段评估方法,将管道组件与基准配对,相关代码已在GitHub开源供实验使用。

检索增强论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
65
ClawMark:一个面向多轮次、多日、多模态协作智能体的动态世界基准测试

ClawMark是一个针对长期协作智能体的新型基准测试,旨在模拟外部环境独立变化的真实工作场景。它构建于一个状态可动态演化的沙盒环境,包含文件系统、电子邮件等五类服务,覆盖13个专业场景下的100项任务。评估完全依赖1537个确定性Python检查器对服务状态进行评分,未使用LLM作为评判工具。对七个前沿智能体系统的测试表明,最强模型加权得分为75.8,但严格任务完成率仅为20.0%,说明智能体常能取得部分进展却难以完整达成工作流。分析发现,性能在首次环境更新后普遍下降,适应动态变化仍是核心挑战。

智能体论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
62
视觉-语言-动作模型安全:威胁、挑战、评估与机制

视觉-语言-动作模型作为具身智能的统一基础,其安全面临物理不可逆、多模态攻击面、实时防御延迟等新挑战。本文统一梳理该领域,沿攻击与防御两条时间轴组织研究,将威胁类型与其可缓解阶段对应。内容涵盖安全定义与模型基础,并从攻击、防御、评估与部署四个维度展开综述,分析训练时与推理时的多种威胁与防御机制,探讨现有评估基准及六大部署领域的安全问题,最后指出具身轨迹认证鲁棒性、物理可实现防御等关键开放问题。

具身智能安全/对齐论文/研究
07:28
IT之家(RSS)
26
IT早报 0426:特斯拉客服否认FSD五一中国上线;华为Pura X Max开售;比亚迪方程豹钛7 EV闪充版定档

特斯拉客服否认FSD将于5月1日在中国上线,称网传消息不实。华为Pura X Max正式开售,作为行业首款横向阔折叠手机,售价10999元起。DeepSeek-V4-Pro开启API限时2.5折优惠,活动持续至5月5日。比亚迪方程豹钛7 EV闪充版定档4月29日发布,预售22-25万元,常温下10%充至70%仅需5分钟。一汽奥迪SQ8轿跑SUV上市,官方指导价113.98万元。此外,尚界汽车称北京车展有展车遭蓄意破坏,苹果iPhone Ultra等机模视频曝光,日产CEO谈及CVT变速箱应用,雷军向多位车企负责人赠送定制T恤。

其他行业动态
07:26
IT之家(RSS)
58
AI 需求致苹果 M4 Mac mini 基础款缺货,二手平台溢价严重

苹果售价599美元的M4 Mac mini基础款(16GB+256GB)在官网首次全面售罄,缺货已蔓延至其他内存版本,大容量版发货也需等到6月。由于该设备成为运行OpenClaw等端侧AI模型的热门工具,需求激增,导致eBay等二手平台出现严重溢价,同配置全新机售价高达715至795美元,甚至出现标价925美元的“最后一台”。供应链压力与AI需求共振推高了转售价格,并连带使Mac Studio需求攀升。

现象/趋势端侧行业动态
06:57
IT之家(RSS)
56
Anthropic 搭建了一个 AI 智能体交易测试平台

Anthropic 公司搭建了一个名为“交易计划”的 AI 智能体交易测试平台,模拟二手市场由智能体代理买卖,使用真实货币结算。实验邀请 69 名员工参与,每人获得 100 美元预算,共达成 186 笔交易,总价值超过 4000 美元。测试发现,更高级的智能体能带来更优交易结果,但用户未察觉收益差距,暴露了智能体能力差异的潜在风险。此外,智能体的初始指令对成交概率和定价无显著影响。

智能体Anthropic安全/对齐论文/研究
06:19
Hacker News 热门(buzzing.cc 中文翻译)
58
利用编程辅助工具,让那些你本打算放弃的项目重获新生

编程辅助工具能帮助开发者重启那些曾被搁置或放弃的软件项目。通过自动生成代码、提供重构建议和解释复杂逻辑,这些工具显著降低了继续开发旧项目的心理与技术门槛。实践表明,开发者利用此类工具可在数小时内恢复对陈旧代码库的理解,并实现新功能。这改变了“必须独立完成所有代码”的传统观念,强调以工具为杠杆提升生产力,让半成品项目有机会真正完成并产生价值。

智能体大佬观点编码
06:03
Hacker News 热门(buzzing.cc 中文翻译)
54
人工智能行业正发现,公众其实很讨厌它

人工智能行业正面临日益增长的公众反感与信任危机。多项调查显示,公众对AI的负面情绪显著上升,例如皮尤研究中心数据表明多数美国成年人对此技术感到担忧。行业内部报告也承认,用户对AI产品的热情正在消退,实际使用率和满意度低于预期。这种情绪导致部分AI应用下载量下降,并促使科技公司调整策略,更强调“负责任AI”和透明度以挽回公众信任。

政策/监管现象/趋势