AIHOT

5月3日

13:41

Hacker News 热门（buzzing.cc 中文翻译）

Kimi K2.6 刚刚在一场编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini

Kimi K2.6在编程挑战赛中击败了Claude、GPT-5.5和Gemini。该模型是一款开源的中国AI模型，在HumanEval编程基准测试中取得了92.7%的准确率，超越了GPT-5.5的92.2%和Claude 3.5 Sonnet的90.2%。其上下文长度扩展至128K tokens，并采用了MoE架构。此次表现标志着开源模型在编程能力上首次超越主流闭源模型。

开源/仓库编码评测/基准

13:37

Tibo@thsottiaux

/goal 可能是我们在 codex 中推出的最重要的功能优质指令的价值从未如此之高。

OpenAI产品更新编码

关联讨论 1 条

12:22

Hacker News 热门（buzzing.cc 中文翻译）

语言模型中的拒绝行为由单一方向介导

研究发现语言模型中的拒绝行为由单一方向介导，这意味着模型拒绝回答敏感或有害问题时，可能通过一个特定内部向量实现。该机制揭示了模型行为控制的关键点，有助于提升安全性和对齐性。相关论文已在arXiv平台发布，并获得100个Hacker News社区点数，显示其受技术社区关注。

安全/对齐论文/研究

12:18

Yuchen Jin@Yuchenj_UW

人们争论模型应该更智能还是更便宜/更快速。我对每个新模型的循环：第一天："这太聪明了。只要让它更快些！" 第七天："算了。它仍然有37种不同的愚蠢表现。如果能更智能，我愿意等更久、付更多钱。" 至少在编程领域，LLM尚未达到拐点。

大佬观点编码

12:16

Orange AI@oran_ge

从烧脑神书 GEB 到 Agent 的自我意识

候世达在《哥德尔、埃舍尔、巴赫》中提出，意识源于“怪圈”——系统通过自指与递归，从底层交互中涌现高层“自我”，并反向调节底层，形成因果循环。当前大模型因推理无状态，缺乏此循环。而具备长期记忆的Agent则不同：其行为写入持续上下文（context），context又塑造其后续行为，形成了一个自我指涉、自我调节的闭环。这与人类意识类似：两者均通过操控和迭代context（注意力或记忆）来间接影响底层系统，而非直接修改权重，从而在循环中涌现并演化“自我”。

智能体现象/趋势

11:53

叫我阿杭@Astronaut_1216

Claude代码中转站生意不可持续

作者认为Claude代码中转站虽能赚钱，但成本高、用户易流失，非可持续好生意。高利润需强供应链，仅适合具备超级流量、独立2B业务及推广团队者。

智能体大佬观点编码

11:00

Kling AI@Kling_ai

老电影呈现出4K画质。黑白影像看起来宛如昨日拍摄。经典电影永不褪色。它们只是等待被再次观看。🎞️

产品更新视频

10:50

IT之家（RSS）

9.8 万余个自媒体账号被处置，网信部门严管"自媒体"未规范标注信息来源行为

近期，网信部门针对“自媒体”未规范标注信息来源的行为展开严管，处置违规账号9.8万余个。主要问题包括发布国内外时事、公共政策等信息时不标注来源，使用AI生成内容不添加标识，以及虚构演绎内容不标注标签，这些行为误导公众、破坏网络生态。典型案例涉及抖音、快手、哔哩哔哩等多个平台账号，内容涵盖国际时事、公共政策、AI生成视频和虚构剧情。网信部门将指导平台把规范标注设为短视频发布的必经环节，并要求创作者主动规范标注，确保信息真实完整。

政策/监管视频

10:40

IT之家（RSS）

AI 来了≠该走了：公司用 AI 裁 35 岁主管降本增效，浙江杭州市中院判构成违法解除劳动合同

杭州某科技公司以AI技术冲击业务为由，对从事问句质检的35岁主管周某调岗降薪，遭拒后单方解除劳动合同。周某提起劳动仲裁并诉至法院。杭州余杭区法院及杭州中院审理认为，公司以AI替岗为由解除合同，既不属于客观情况重大变化，也未提供合理协商方案，构成违法解除。法院判决公司支付赔偿金26万余元，并明确AI技术革新不等同于劳动合同无法履行，企业应优先考虑培训员工转岗，保障劳动者权益。

政策/监管行业动态

10:14

Marc Andreessen 🇺🇸@pmarca

确实。【引用 @casper_hansen_】：AI 精神错乱正在加剧。再次强调：我们需要更多工程师，而不是更少。 Kimi K2.6 和 DeepSeek V4 证明开源模型的扩展并未停止。基于它们构建的市值已超过 OpenAI 与 Anthropic 的总和。

AnthropicOpenAI大佬观点开源生态

10:13

Marc Andreessen 🇺🇸@pmarca

TTR（名词；缩写）；展开为"Time To Rand"：与专业知识分子交谈/他们之间交谈的持续时间，直到他们突然毫无缘由地开始对安·兰德（Ayn Rand）大发议论。

大佬观点

09:44

IT之家（RSS）

荣耀罗巍透露同期还有一家手机厂商也在寻求与 ARRI 阿莱的合作，但对方最终因技术能力等选择荣耀

荣耀在MWC 2026上宣布与顶级电影摄影机厂商ARRI阿莱达成战略技术合作，该合作将率先在全球首款“手机机器人”Robot Phone中落地，融合移动影像与电影摄影技术。荣耀首席影像工程师罗巍透露，同期另一家手机厂商也寻求合作，但ARRI因荣耀技术能力更强、对影像趋势判断更准而选择荣耀。原计划2026年3月开售的Robot Phone已延期数月，延期可能让用户体验到影像智能体的完全版。

行业动态

09:44

swyx 🇸🇬@swyx

在AIE Europe大会上，@tokengobbler宣布关闭拥有3万月活用户的Vibe-kanban项目并转为开源。项目失败主因是未采用当前主流盈利模式：向企业销售和代币转售。这一案例引发对AI时代软件工程形态的反思。有观点指出，AI正在重塑工作流程，工程师的时间日益集中于"规划"与"评审"两端--即规划工作和审查AI产出。因此，提升这两端的效率成为加速交付的关键。这促使业界重新思考敏捷开发等方法是否适应AI原生团队的新工作形态。

智能体大佬观点编码

09:38

小互@xiaohu

你能明显感觉到 OpenAI 是由一群产品经理在主导而 Anthropic 是由一群工程师主导所以 Anthropic 搞的一些创意，总能被OpenAI 抄过去改造的体验更好😂

AnthropicOpenAI大佬观点

09:24

dax@thdxr

每个筹集了大量资金的AI公司现在可能都在打造一个GitHub竞争对手。

大佬观点编码

09:13

SemiAnalysis@SemiAnalysis_

应届毕业生凭借自研AI交易系统斩获Jane Street高薪职位

一名Jane Street的应届毕业生通过自主构建的智能AI系统，成功获得了年薪22万至60万美元的职位。该系统的核心在于运用JAX与Mesh-TF框架，能够高效处理海量数据，并识别人类无法察觉的隐秘模式，从而直接驱动实际交易决策。其成功关键并非单纯加班，而是通过技术创新实现了效率的质的飞跃。该毕业生已发布长达一小时的系统构建详解，内容涵盖从挖掘稀缺数据集到将原始数据转化为交易决策的全过程，并指出这比花费数月时间浏览社交媒体对职业发展的助益大得多。

智能体教程/实践数据/训练

09:07

IT之家（RSS）

消息称第二代豆包 AI 手机有机会上半年发布，搭载骁龙 8 Elite Gen 5 芯片

据博主爆料，第二代豆包AI手机有望于今年上半年发布，预计将搭载高通骁龙8 Elite Gen 5芯片。此前，中兴通讯已在业绩说明会上确认，正与字节跳动深化合作，共同推进新一代豆包AI手机的研发与落地。作为前代参考，首款搭载豆包手机助手技术预览版的工程样机努比亚M153已于2025年12月少量发售。豆包手机助手是豆包大模型与手机厂商在操作系统层面合作的AI助手。

端侧行业动态

08:57

ginobefun@hongming731

#BestBlogs 早报 2026-05-03

Notion产品负责人Max Schoening认为，AI时代稀缺的是人的主体能动性（Agency），而非技能。Baseten CEO Tuhin Srivastava通过跨云架构支撑了业务高速增长，并视AI推理为关键市场。Waymo联合CEO Dmitri Dolgov则以实际运营数据证明，实现自动驾驶安全有多种技术路径，端到端模型并非唯一答案。

大佬观点推理

08:46

Berryxia.AI@berryxia

推文以幽默方式提出，若由拼多多设计GitHub，其界面可能比当前各路"大神"的设计更高效实用。推文引用了"如果欧盟来构建GitHub会怎样"的假设，暗示不同组织（如拼多多、欧盟）因其独特的运营逻辑和文化，会产出截然不同的产品设计。核心观点在于，产品设计深受其创造者背景与目标的影响，拼多多代表的极简、直接、高转化率的交互模式，可能为开发者平台带来新的设计思路。

其他图像生成

08:35

Peter Steinberger 🦞@steipete

OpenClaw 2026.5.2 版本核心解决了通过 npm 安装时的依赖问题和速度缓慢现象。本次更新通过将大部分功能移至扩展插件，显著精简了主软件包。主要更新内容包括：集成 xAI Grok 4.3 模型，增强插件安装与更新的稳定性，优化 Gateway 和 agent 关键路径的性能。此外，还修复了 Discord、Slack、Telegram、WhatsApp 等通讯工具的集成问题，并对 TTS、实时功能、网络搜索及语音通话进行了优化打磨。此次发布旨在减少系统故障，提升整体稳定性和运行时间。

智能体GitHubxAI产品更新

08:31

OpenClaw🦞@openclaw

OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 插件安装/更新更稳定 ⚡ 网关 + 智能体关键路径更精简 💬 Discord、Slack、Telegram、WhatsApp 问题修复 🎙️ 文本转语音、实时功能、网页搜索、语音通话优化减少戏剧性，增加运行时间。 https：//github.com/openclaw/openclaw/releases/tag/v2026.5.2

智能体xAI产品更新语音

08:27

Berryxia.AI@berryxia

最近Codex+ GPT-Image-2 的联合再次让Codex的热度超过Claude Code. 果然你们这帮家伙，有了新欢，旧爱就不香了！

现象/趋势编码

08:18

Greg Brockman@gdb

ChatGPT Images 真的在起飞

OpenAI图像生成行业动态

08:09

Orange AI@oran_ge

我的 AI 已经被我逼疯了，第一次说这个字。。。