4月30日
21:24
IT之家(RSS)
42
马斯克旗下 Neuralink 打造手术机器人:缩短脑机芯片植入时间,降低感染风险

Neuralink推出专用手术机器人,旨在自动化脑机接口植入流程的关键步骤。该机器人采用五轴系统,配备8个摄像头和OCT扫描仪,可实时识别并避开脑组织,处理比头发更细的柔软植入线。最新演示中,机器人能直接刺穿硬脑膜,无需移除这层保护结构,从而缩短手术时间、降低感染风险。这些改进提升了植入过程的安全性、可靠性与可扩展性,为未来大规模应用奠定基础。

产品更新具身智能
21:00
Cloudflare Blog
精选65
Agents 现可创建 Cloudflare 账户、购买域名并部署

Cloudflare 宣布 AI 代理现可作为独立客户直接使用其服务。代理能够自主创建 Cloudflare 账户、开通付费订阅、注册域名,并立即获取 API 令牌以部署代码。人类用户可保留授权监督权限,但无需手动操作控制台、复制粘贴 API 令牌或输入信用卡信息。这一更新使代理能够以自动化流程完成从账户开设到服务部署的全链路操作。

智能体产品更新部署/工程

推荐理由:Cloudflare 把 AI 代理当成真正客户,从注册到部署一气呵成,这比给个 API 更彻底,做 agent 框架的同学该看一眼。
20:55
歸藏(guizang.ai)@op7418
49
主推文抱怨内容被盗,而引用推文展示Codex AI的强大能力:仅根据用户对类似《杀戮尖塔》游戏的中国风格要求,便能自动生成从代码到素材的完整可玩游戏。这突显了人工智能在创造性任务中的自主原创性,与盗窃行为形成鲜明对比,引发对科技赋能内容创作的关注。

歸藏(guizang.ai)我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格…

OpenAI大佬观点编码
20:45
The Decoder:AI News(RSS)
69
OpenAI 称其已提前数年达成 10 吉瓦计算能力目标

OpenAI 宣布已在美国提前数年实现了 10 吉瓦的 AI 计算能力目标。这一计算规模原计划在未来几年达成,提前完成意味着公司获得了远超预期的强大算力基础设施,足以支持下一代大规模 AI 模型的训练与部署。10 吉瓦的算力相当于多个大型数据中心的能耗,标志着 OpenAI 在计算资源竞赛中取得了关键进展。

OpenAI数据/训练行业动态
20:31
The Decoder:AI News(RSS)
55
Anthropic 新基准测试声称 Claude 在生物信息学领域可媲美人类专家

Anthropic 发布了名为 BioMysteryBench 的新基准测试,旨在评估 Claude 解决真实生物信息学问题的能力。测试结果显示,Claude 的表现能达到人类专家水平。然而,这一结论附带重要注意事项,表明结果虽具前景但仍有局限。该基准专注于衡量模型在专业领域的实际应用性能。

Anthropic论文/研究
20:29
Chubby♨️@kimmonismus
67
Anthropic估值一年飙涨15倍,逼近9000亿美元

Anthropic的估值在约12个月内从615亿美元跃升至近9000亿美元,增幅达15倍。其年化收入从约10亿美元暴增至400亿美元,推动了这一惊人的价值增长。当前,即使愿意投资50亿美元的投资者也难以获得公司高管的会议机会,这凸显了AI融资市场中资金供给方的主导地位。自2024年初以来,Anthropic估值增长将达50倍,这可能是科技史上最快的价值创造案例。

Anthropic行业动态
20:24
The Decoder:AI News(RSS)
49
Tencent 发布 440 MB AI 模型,可在手机上离线翻译 33 种语言

腾讯发布了一款紧凑型开源 AI 翻译模型,其大小仅为 440 MB。该模型支持 33 种语言的互译,并能在智能手机上完全离线运行。腾讯声称,其性能超越了谷歌翻译。这一轻量化设计使得高质量的神经机器翻译无需依赖网络连接即可在移动设备上实现。

开源生态模型发布端侧
20:22
20:20
IT之家(RSS)
54
高通称年内将向大型云服务商出货数据中心芯片,股价大涨 16%

高通宣布将在本年度内向一家大型云服务商出货其数据中心芯片,此消息推动其股价大涨16%。公司第二季度调整后每股收益2.65美元,超出市场预期;营收106亿美元符合预期,但第三季度营收指引低于分析师预估。尽管在AI算力芯片领域落后,高通已推出自研数据中心芯片,并与OpenAI合作研发智能手机AI芯片。其汽车业务营收同比增长38%,创历史新高。然而,智能手机与个人电脑市场面临出货量下滑等挑战,高通在失去苹果客户后,正寻求与OpenAI等AI公司合作成为新增长点。

行业动态
20:16
IT之家(RSS)
52
通用汽车:下一代 Super Cruise 每天都用人类百年驾驶经验进行训练

通用汽车在收缩电动车计划的同时,其Super Cruise高级驾驶辅助系统成为业务亮点,累计行驶里程已超16亿公里。公司正利用这些海量真实道路数据,通过每日模拟约100年人类驾驶经验的数字环境,训练下一代系统。通用计划于2028年在凯迪拉克凯雷德IQ上推出L3级脱手脱眼自动驾驶系统。公司CEO透露,近90%的自动驾驶代码由AI生成,并强调该系统未来将同时部署于燃油车和电动车,覆盖多品牌与不同价位车型。

具身智能数据/训练行业动态
20:14
20:14
Google DeepMind:Blog(RSS)
36
以AI联合临床医生开启医疗保健新模式

研究团队正致力于开发一款AI联合临床医生,以探索AI增强医疗护理的路径。该研究旨在创建一种新型医疗模式,让AI作为临床医生的协同伙伴深度参与诊疗过程,共同提升医疗服务的质量和效率。这项工作标志着医疗保健领域正从辅助工具阶段,迈向AI作为核心协作者的新范式。

DeepMindGoogle论文/研究
20:13
Hacker News 热门(buzzing.cc 中文翻译)
57
Granite 4.1:IBM 的 8 位模型与 32 位 MoE 相媲美

IBM开源了Granite 4.1系列模型,其80亿参数版本在性能上可与320亿参数的混合专家模型相媲美。这一突破表明,通过优化架构与训练方法,较小规模的模型也能达到更大模型的效能水平,为高效部署提供了新选择。该模型家族已开源,在开发者社区中获得关注,相关讨论在Hacker News上获得了超过100点热度。

开源生态模型发布
20:11
The Decoder:AI News(RSS)
47
FDA 在 DOGE 裁员后寻求重建,押注 AI 与云监控革新临床试验

FDA 启动了一项试点项目,通过人工智能与云计算技术对临床试验进行实时监控。该机构表示,此举有望大幅缩短新药的审批时间。这一举措是 FDA 在经历 DOGE 裁员后,为重建并提升监管效率而推动的关键技术转型。

政策/监管数据/训练
20:09
歸藏(guizang.ai)@op7418
55
DeepSeek 多模态大语言模型的论文《Thinking with Visual Primitives》已经公开

该论文介绍了基于DeepSeek-V4-Flash底座的多模态大模型。其核心创新在于模型能同时进行文字推理和“视觉原语”(如画框、打点)思考。该模型以极低的Token成本,在多项前沿指标上达到了与GPT-5.4、Claude、Gemini等模型相当甚至更优的性能。

DeepSeek多模态论文/研究
关联讨论 1X:Vista (@vista8)
20:07
The Decoder:AI News(RSS)
56
Anthropic 正在评估投资者报价,公司估值或超9000亿美元

据彭博社报道,人工智能公司 Anthropic 正在评估新一轮融资的投资者报价,此轮融资可能使公司估值超过9000亿美元。这一估值数字远超其当前市场估值,反映出市场对领先AI企业的高度追捧和投资热情。

Anthropic行业动态
20:06
ginobefun@hongming731
51
京东广告发布GRAM架构,用大模型知识工程突破推荐瓶颈

京东广告团队推出GRAM架构,旨在通过大模型原生知识工程解决传统CTR模型的瓶颈。该架构构建了毫秒级查询的级联知识图谱,将商品属性与业务规则作为“事实护栏”注入,以杜绝AI幻觉,确保推荐符合现实。它颠覆了依赖历史数据的冷启动模式,即使零销量新品也能通过知识网络的高维特征关联实现精准分发。同时,GRAM将企业内隐知识结构化作为上下文,使大模型能进行复杂的深度决策,而非仅计算曝光。

教程/实践数据/训练部署/工程
20:05
The Decoder:AI News(RSS)
精选70
Softbank 计划将估值高达1000亿美元的新AI与机器人公司Roze上市

软银集团计划在美国启动并推动其新成立的人工智能与机器人公司Roze进行首次公开募股。据《金融时报》报道,这家新公司的估值可能高达1000亿美元。此举标志着软银在AI和机器人领域的重大战略布局,旨在将相关业务整合并独立上市以获取市场资源与更高估值。

具身智能行业动态
关联讨论 1X:Rohan Paul (@rohanpaul_ai)
推荐理由:软银千亿美元估值的AI机器人公司Roze计划IPO,是今年AI领域最大的资本动作。如果成功,将重塑整个具身智能赛道的投资逻辑,值得持续关注。
20:00
Cursor Blog
精选55
持续优化智能体工具链:上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链,核心围绕上下文窗口的演进。早期模型能力有限,工具链依赖大量静态上下文和防护机制;随着模型能力提升,团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合:通过CursorBench等基准测试进行标准化质量评估,同时进行线上A/B测试,使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误,以应对日益复杂的工具链状态。

智能体AnthropicOpenAI教程/实践
关联讨论 1X:邵猛 (@shao__meng)
推荐理由:Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一,从上下文管理到多 agent 调度,全是实战迭代的血泪经验,做 agent 的团队该逐字读。
19:19
IT之家(RSS)
40
OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber,暂不向公众开放

OpenAI宣布将推出基于GPT-5.5定制的网络安全模型GPT-5.5-Cyber。该模型不会向公众开放,将在未来数日内限量定向开放给经过筛选的网络安全防护人员,以协助强化网络防御。具体技术细节尚未披露,OpenAI表示将联合行业与政府制定可信准入机制。这种分阶段限量推出高风险顶级模型的模式,已成为人工智能行业的普遍趋势。

OpenAI安全/对齐模型发布
19:11
IT之家(RSS)
53
完全由 AI 生成:《任天堂明星大乱斗》PC 移植版问世

初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布,其全部代码完全由AI生成。开发者仅用25天,借助Opus和GPT等大模型独立完成。该项目基于C/C++源码,需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发,并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。

智能体AnthropicOpenAI开源/仓库
19:09
Hacker News 热门(buzzing.cc 中文翻译)
57
Mozilla 对 Chrome 的 Prompt API 的反对

Mozilla在GitHub上公开反对谷歌Chrome提出的Prompt API新标准。该API旨在让网站直接调用浏览器内置的大型语言模型,但Mozilla认为这存在重大隐私和安全风险,可能使网站过度获取用户敏感信息。目前该提案已获得110个Hacker News社区点赞,引发技术社区对浏览器权限与AI集成边界的广泛讨论。

GitHubGoogle政策/监管
18:44
Chubby♨️@kimmonismus
62
四大科技巨头云收入激增,资本开支飙升引市场担忧

Meta、亚马逊、Alphabet和微软2026年第一季度营收均超预期,云业务增长强劲,其中Google Cloud收入暴涨63%首次突破200亿美元。然而,四家超大规模企业2026年资本开支总额预计将超过6500亿美元,巨额AI基础设施投资引发市场焦虑,导致Meta和微软股价在盘后下跌。这些巨头在计算领域的投入规模正重塑全球经济,其投资能否带来相应回报将定义未来十年的科技投资格局。

GoogleMicrosoft数据/训练行业动态
18:37
Hacker News 热门(buzzing.cc 中文翻译)
60
迈克:开源法律人工智能

开源法律人工智能项目“迈克”正式发布。该项目旨在提供免费、可访问的法律AI工具,其核心变化在于将原本可能收费或封闭的法律AI技术开源化,允许开发者自由使用、修改和分发。项目网站mikeoss.com已上线,相关讨论在Hacker News上获得了超过100个社区积分。

智能体开源/仓库
18:25
歸藏(guizang.ai)@op7418
57
Codex成功创建了类似《杀戮尖塔》的完整游戏关卡演示,细节精细,除声音外近乎完美。演示中的主要场景和角色素材由GPT-Image生成,其余素材由开发者自行收集。项目方宣布,安装包将于今晚或明天发布,同时整个代码将开源。

歸藏(guizang.ai)太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生…

OpenAI开源/仓库编码
18:05
阿绎 AYi@AYi_AInotes
精选79
马斯克律师庭审出示关键证据,揭露OpenAI早期转型营利内幕

马斯克律师在庭审中出示了OpenAI联合创始人Greg Brockman 2017年的私人日记,其中明确写道团队真正想要的是营利性结构并计划将马斯克排除在外,承认若转型则此前承诺皆为谎言。然而两个月后,Brockman却公开向马斯克表达敬意。证据显示OpenAI早在2017年就已策划从非营利转向商业。此前,OpenAI试图用Sam Altman 2022年提及股权的短信作为证据,但被马斯克以非营利组织法律上不能有股权为由反驳,反而坐实了其早期就已背离公益初心。

阿绎 AYiDamn,OpenAI这次在法庭上真把自己坑惨了🤣👀🤯 律师昨天甩出2022年Sam发给马斯克的一条短信,想证明:“当年我们主动给你股权,你自己不要,现…

OpenAIxAI行业动态
关联讨论 2X:cb_doge (@cb_doge)X:AI Safety Memes (@AISafetyMemes)
推荐理由:Brockman日记证明OpenAI早在2017年就密谋排挤马斯克且转向营利,这不是花边八卦,是直接动摇OpenAI非营利合法性的实锤,所有AI创业者都该关注后续判决。
17:55
DeepSeek:GitHub 新仓库
精选72
DeepSeek团队提出"视觉基元思维"新范式,解决多模态模型空间推理指代鸿沟

DeepSeek团队发布了一种新型多模态大语言模型范式,通过将点与边界框等空间标记作为最小思维单元直接嵌入推理轨迹,有效解决了复杂空间推理中的“指代鸿沟”问题。该模型基于DeepSeek-V4-Flash架构,能将每4个视觉令牌的KV缓存压缩为单个条目,显著提升了视觉令牌效率。在多项具有挑战性的计数与空间推理基准测试中,其性能媲美GPT-5.4等前沿模型,而模型规模更紧凑且图像令牌预算更低。技术报告已公开,内部基准测试和部分数据将于近期发布,模型权重未来将整合至基础模型后开放。

DeepSeek多模态推理论文/研究
关联讨论 1X:Vista (@vista8)
推荐理由:DeepSeek 把视觉坐标直接编进推理链,用「指哪想哪」的方式解决多模态模型的空间推理幻觉,思路很反直觉但效果对齐了 GPT-5.4 级别,做多模态推理的值得深挖。
17:41
向阳乔木@vista8
52
开发者利用Codex成功生成了一个类《杀戮尖塔》游戏的完整关卡演示。该演示目前已经相当完善,主要缺陷仅在于缺少声音。演示中的核心视觉素材,如主要场景和角色,是由GPT-Image生成的,其余素材则由开发者自行补充。这一成果展示了AI在游戏内容生成方面的强大潜力。

歸藏(guizang.ai)太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生…

OpenAI图像生成现象/趋势
17:31
IT之家(RSS)
53
微软预计 2026 年资本支出因组件成本上升增长 250 亿美元

微软预计其2026日历年资本支出将达1900亿美元,其中250亿美元源于AI浪潮导致的硬件组件成本上升。2026财年第三财季资本支出为319亿美元,主要用于GPU、CPU等短期资产;预计第四财季支出将超400亿美元,内含50亿美元涨价因素。由此推算,2026日历年下半年资本支出将接近1200亿美元,显著高于上半年。此外,必应搜索月活用户首次突破10亿,Edge浏览器份额持续增长,Xbox月活与游戏流媒体时长也创下新高。

Microsoft数据/训练行业动态
17:30
Rohan Paul@rohanpaul_ai
69
白宫阻止Anthropic扩大其漏洞挖掘模型Mythos的访问权限

白宫阻止了Anthropic扩大其新型AI模型Mythos访问权限的计划。该模型能发现并利用软件漏洞,能力足以触发国家安全管控。Anthropic希望新增约70家机构使用,但官员认为扩大访问会加剧安全风险,并可能挤占已授权机构的计算资源。此事反映出Anthropic与华盛顿关系紧张,涉及军事用途争议与信任问题。此类模型能极大缩短漏洞发现与武器化之间的时间,因此推广决策首先是安全决策。白宫的策略是限制访问以降低即时风险,并优先保障已获授权机构的需求。

Anthropic安全/对齐政策/监管
17:24
Rohan Paul@rohanpaul_ai
60
Anthropic研究显示Claude能解决人类专家遗漏的真实生物信息学问题

Anthropic最新研究利用BioMysteryBench测试平台评估Claude在真实生物信息学问题上的能力。该测试将客观答案隐藏于真实数据集中,涵盖99项任务。在至少一位人类专家解决的76个问题上,Claude Mythos Preview模型准确率约为83%;更值得注意的是,在23个专家小组未能解决的问题上,该模型仍解决了其中约29.6%。然而,模型在困难问题上的成功重复性较低,表明其表现尚不稳定。研究指出,Claude最有效的模式并非充当“先知”,而是扮演快速研究协作伙伴的角色:通过分层使用方法、交叉验证证据并运用广泛背景知识来缩小搜索空间。

Anthropic数据/训练论文/研究
17:21
IT之家(RSS)
61
看穿大模型的"小心思":阿里千问开源可解释性模块 Qwen-Scope

阿里千问开源可解释性模块 Qwen-Scope,该模块基于 Qwen3 和 Qwen3.5 系列模型训练,通过稀疏自编码器提取可解释特征以分析大模型内在机制。开源权重覆盖 7 个大模型,包含 14 组稀疏自编码器,训练数据规模达 0.5B 词元。Qwen-Scope 能实现推理结果的定向控制、数据分类与合成、模型训练优化及评估冗余分析,在数据合成中使训练能效比提升约 15 倍。

Hugging Face安全/对齐开源/仓库