AIHOT

4月30日

09:15

向阳乔木@vista8

66

开源项目Beads：用结构化任务管理解决AI Agent长任务"失忆"问题

开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式，转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库，允许多智能体并发写入且避免冲突，保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制，通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent，也适用于任何需要在多次AI会话间维持任务连续性的场景。

智能体MCP/工具开源/仓库

09:14

meng shao@shao__meng

63

GPT-5.5提示词指南

GPT-5.5因推理能力增强，提示词应转向精确定义结果、约束与停止条件，而非详细规定流程。相比前代，需采用更简短的结果导向提示，并重新评估推理强度需求。关键新增点包括显式人格设定与检索预算。指南强调不应直接迁移旧提示，避免限制模型搜索空间。此外，还涉及利用Preamble改善响应感知、设定停止条件、控制输出格式等实用技巧。

OpenAI推理教程/实践

09:14

Orange AI@oran_ge

54

改变命运的河床

文章借波士顿道路源于牛径的典故，引出“最小阻力之路”概念，比喻人常受家庭、社会等外在结构驱使，陷入被动循环。作者指出，专注于“解决问题”的思维会强化结构性冲突，导致努力无效。真正的转变在于从“逃离现状”转向“创造愿景”，通过建立清晰愿景与准确现实认知，形成结构性张力。这种创造源于爱而非恨，是主动的“基本选择”。最后，文章将“结构”思维延伸至产品、AI、人际关系与组织等领域，强调改变命运的关键在于重塑内在与外在的河床结构。

智能体大佬观点现象/趋势

09:13

swyx 🇸🇬@swyx

51

Talkie复古语言模型：基于1931年前文本的训练与伦理挑战

为应对互联网被AI生成内容污染的问题，研究者提出“低背景标记”设想，计划训练仅使用历史文本的复古模型。团队集结了包括GPT-1/2开发者在内的专家，通过训练复古OCR模型处理旧书籍、报纸等资料，并利用礼仪手册、词典等结构化历史文本合成RLHF数据。为确保数据纯净，他们开发了基于文档n-gram的时代错位分类器，精心筛选了数千亿1931年前的公共领域标记进行训练。最终发布了130亿参数的Talkie模型，旨在探索语言模型的泛化能力。然而，该模型在发布后表现出强烈的种族偏见倾向，引发了新的伦理担忧。

大佬观点数据/训练

09:11

AK@_akhaliq

49

OmniShotCut 基于Shot-Query Transformer的整体关系性镜头边界检测论文： https：//huggingface.co/papers/2604.24762

视频论文/研究

09:09

Sam Altman@sama

33

GPT-5.5要为自己举办一场派对。它把日期和时间定在了5月5日下午5：55。如果你想来参加，请在这里告诉我们：https：//luma.com/5.5 codex将帮助团队从回复中挑选参与者。5.5为派对提出了一些很棒的想法/要求，我们会照做的。

OpenAI大佬观点

08:45

向阳乔木@vista8

67

DeepSeek V4 Flash模型因响应速度快、成本低，获海外用户好评。用户强调应重实际效果而非基准测试，例如建议沉浸式翻译改用该模型。有用户称其速度优势显著，已将非复杂推理API调用切换至V4 Flash，体验无感秒处理，成本比Claude Haiku省90%且质量更优。

明盛：@vista8 Deepseek的速度绝对是一大未被完全发掘的优势. 试了v4flash之后我把所有不涉及复杂推理的llm api调用全切到flash了. 速度…

DeepSeek大佬观点推理

08:43

François Chollet@fchollet

48

AI无法端到端自动化整个工作岗位，因其缺乏自主性且需人工监督。目前尚无任何职业能被AI完全替代，包括翻译和客服。核心观点是AI自动化的是具体任务而非工作本身；当某项任务因AI变得更廉价高效时，反而会提升该岗位的整体需求。例如放射科医生并未被AI取代，其年薪超过50万美元且就业持续增长，因为阅片任务自动化后扩大了放射科服务的市场需求。

大佬观点现象/趋势

08:43

NVIDIA AI Developer@NVIDIAAIDev

43

开发者社区直播：圣何塞州立大学黑客马拉松获奖者 - 构建有影响力的智能体 https：//x.com/i/broadcasts/1YxNrZLXXBVxw

智能体行业动态

08:43

ClaudeDevs@ClaudeDevs

48

Built with Opus 4.7 Claude Code 黑客松圆满落幕！感谢全球 500 名参与者，以及联合主办方 @cerebral_valley。以下是获胜者如何结合多智能体编排、持久记忆、MCP 工具、沙箱执行和智能提示设计 🧵

AnthropicMCP/工具行业动态

08:41

TestingCatalog News 🗞@testingcatalog

62

XAI 🚨：全新的 Imagine Agent 正在 Grok 网页版 Beta 测试中推出！ Imagine Agent 可以在开放画布视图中生成图像和视频。它能执行相当复杂的任务，例如"生成一部1分钟的电影"、"生成 UGC 产品故事"、"生成完整的漫画集"等等。这是一个相当重大的发布！你也用上了吗？

xAI产品更新图像生成视频

关联讨论 1 条

08:40

Berryxia.AI@berryxia

55

越来越方便了，Agent来帮你完成Cloud Flare 中的创建账号，启动付费订阅，注册域名… 任务。

智能体产品更新部署/工程

08:39

Rohan Paul@rohanpaul_ai

8

日本刚刚展示了一款完全由纸板制成的无人机。它以120公里/小时的速度飞行，5分钟内即可组装完成，专为大规模集群使用而设计。最有趣的一点是，它可以在任何普通纸板工厂进行大规模生产。

其他

08:39

Rohan Paul@rohanpaul_ai

52

风投究竟看重什么？安德森揭示成功初创企业的关键特质

在2014年的对话中，Marc Andreessen向Sam Altman揭示了风险投资的残酷逻辑：每年约4000家可投资公司中，仅约200家获得顶级风投注资，而其中仅有15家能实现1亿美元收入，它们贡献了当年风投行业几乎全部的回报。因此，投资者评估初创企业时，主要不是看其是否全面可靠，而是寻找能否让其跻身那极少数赢家的“不对称优势”，例如产品病毒式传播、精准的市场时机或创始人非凡能力等。在幂律分布主导的行业里，“全面优秀”远不如“在决定性方面卓越”。对创业者而言，关键在于展示能显著改变概率的独特突出优势，因为平庸在风投领域几乎注定失败。

大佬观点现象/趋势

08:37

阿绎 AYi@AYi_AInotes

精选70

Google Gemini实现AI"交付时代"跨越，直接生成可下载办公文件

Google Gemini迎来重磅更新，用户现可在聊天中通过一句话指令，直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件，无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表，且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”，迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成，实现了降维打击，对依赖AI生成文档的初创公司构成巨大压力，并推动行业竞争焦点转向直接产出可用成果。

Google产品更新

关联讨论 4 条

推荐理由：Gemini原生生成文档这功能，不是简单的“能出Word”，而是把二十年Workspace生态变成AI的输出管道，那些靠格式转换吃饭的中间商要慌了。

08:13

SemiAnalysis@SemiAnalysis_

47

研究机构SemiAnalysis引入AI智能体团队，大幅提升研究效率

研究机构SemiAnalysis近日宣布引入名为MERLIN的Agentic研究总监及其团队。该团队能快速覆盖公司、财报和金融建模，启动分析仅需数分钟，远快于通常所需的15小时。同时，Agentic会议总监Claudia可即时处理海量会议资料并提供摘要；竞争分析研究员Snoopz则擅长搜集公开信息构建产品数据库与路线图。据其最新播客透露，整合这些AI智能体后，SemiAnalysis的人均Token使用效率已达Meta的两倍，实现了显著的“TokenMogging”效能提升。

智能体行业动态

08:09

Rohan Paul@rohanpaul_ai

43

研究揭示语言模型遇难题时内部活动会"收缩"

研究发现，当语言模型面对困难问题时，其内部“脑活动”会收缩到更少的路径中。模型在感到困惑时会压缩内部思考，表现为从广泛分散的神经元激活，坍缩为最终处理层中高度集中的信号。这是因为系统放弃了稳健的分布式记忆，将计算强制压缩到狭小的专门空间以应对陌生挑战。关键在于，这种收缩效应可被量化为一个原始数值，从而无需猜测问题对AI是否过难。通过读取此内部信号，便能自动为系统提供恰如其分的“垫脚石”以辅助其解决问题。

安全/对齐推理论文/研究

08:09

Rohan Paul@rohanpaul_ai

51

非常不错的资源。 claude-code-best-practice 在 GitHub 上趋势热榜，拥有 49，500+ ⭐️

智能体Anthropic教程/实践

07:51

OpenClaw🦞@openclaw

58

OpenClaw 2026.4.27 🦞 🧠 DeepInfra 提供商 📎 更好的文件附件功能 🛡️ 运营商管理的代理路由 🧭 更严格的模型选择 + 本地模型修复 🔧 网关、通道和会话可靠性实干多于自夸。 https：//github.com/openclaw/openclaw/releases/tag/v2026.4.27

智能体产品更新

07:41

dax@thdxr

35

我们开发了opentui，这样高管们就能在终端应用中输入指令，让他们感觉自己像黑客，并回忆起年轻时还能派上用场的日子。

产品更新编码

07:39

Berryxia.AI@berryxia

52

Moonlake推出3D Agent：AI自动化生成可编辑3D资产

Moonlake发布3D Agent，这是一个AI驱动的工具，能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景（包含数百物体）。它支持从零建模，自动处理独立部件和关节绑定，无需预设规则，并能重建完整可编辑的室内或室外场景。通过原生集成Blender，该工具实现了真实工作流的自动化，简化3D创作过程。

智能体产品更新多模态

07:14

宝玉@dotey

69

OpenAI发布GPT-5.5官方提示词指南：主张简短指令，转向结果导向

OpenAI在发布GPT-5.5后推出官方提示词指南，核心主张是摒弃冗长指令。指南指出，新模型具备更强推理能力，用户只需清晰描述期望结果、成功标准和限制条件，过细的步骤规划反而会限制模型搜索空间，导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示；为搜索设定“检索预算”以控制成本；在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。

OpenAI推理教程/实践

07:09

Satya Nadella@satyanadella

67

NVIDIA公布季度财报，AI业务年化收入突破370亿美元

NVIDIA在季度财报电话会议中宣布，其AI业务年化收入已突破370亿美元，同比增长123%。公司指出，当前正处于一个关键的平台转型期，技术栈正从由终端用户驱动的工作负载，转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革，扩大市场总规模，并重塑全球经济的价值创造模式。为把握此机遇，NVIDIA正专注于两大核心任务：提供强大的AI基础设施和解决方案，以赋能所有企业在这一智能体计算时代实现成果最大化。

Microsoft现象/趋势行业动态

07:09

OpenAI Developers@OpenAIDevs

精选63

你完全可以构建网络应用

OpenAI教程/实践编码部署/工程

推荐理由：OpenAI开发者官方转发了这篇‘直接构建web应用’的文章，说明这可能是他们认可的实践路径，对想用AI快速搭应用的开发者算是个值得收藏的参考。

07:08

Anthropic@AnthropicAI

59

科学博客上新：我们给Claude出了99个分析真实生物学数据的难题，并将其表现与专家小组进行了比较。在23个问题上，专家们被难住了。我们最新的模型解决了其中大约30%--以及其余的大部分问题。

Anthropic推理论文/研究

06:44

宝玉@dotey

62

我测试了 GPT-4o 和 Claude 3.5 Sonnet 在多种任务上的表现。 Claude 在需要深度思考的任务中表现更好，而 GPT-4o 在需要快速响应的任务中更出色。两者都是优秀的模型，但各有侧重。

智能体教程/实践

06:39

Rohan Paul@rohanpaul_ai

55

Replit 首席执行官 Amjad Masad：我们正进入后提示时代：AI 将从优化提示转向开发新界面和能在后台运行的自主智能体。 "完全自主的智能体将能够主动推送而非被动拉取，并在后台运行"

智能体大佬观点

06:37

Marc Andreessen 🇺🇸@pmarca

25

但后来… 【引用 @feelsdesperate】：我注意到AI让行政人员能够发送冗长复杂的邮件，这些邮件需要大量时间来回复。这是一种巨大的不对称，迟早必须得到解决。

其他现象/趋势

06:21

Luma@LumaLabsAI

58

优质内容值得拥有全球观众。上传你的视频。设置语言。Luma Agents 会处理翻译、唇形同步和针对每个市场的本地化工作。无需重新拍摄。无需单独制作流程。只需你的内容，触达所有需要的地方。走向全球 → http：//lumalabs.ai/app

智能体产品更新多模态视频

06:09

OpenAI Developers@OpenAIDevs

精选64

通过Figma插件，Codex现在可以将实施计划转化为可视化的FigJam白板。

MCP/工具OpenAI产品更新编码

推荐理由：Codex 这次更新不是小功能补丁，它把 Figma 从设计师专属变成了开发者的白板，generate_diagram 直接画架构图，做系统设计的可以扔了 Lucidchart 了。

06:09

Chubby♨️@kimmonismus

64

AI成增长引擎，谷歌搜索营收创新高

谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元，生成式AI产品收入年增近800%，大额合同储备翻倍。关键转折在于搜索业务：搜索广告收入增长19%，查询量创历史新高。这表明AI非但没有取代传统搜索，反而成为其业务的增长加速器，成功将生存威胁转化为发展动力。

Google搜索现象/趋势

06:09

Greg Brockman@gdb

61

使用codex app-server构建你自己的智能体【引用 @arrakis_ai】：Codex应用服务器被严重低估了。你可以通过ChatGPT账户将Codex级别的智能注入任何平台。我把它嵌入到Chrome里…运行完美无瑕。是的…它100%开源。 https：//github.com/GENEXIS-AI/chromex

OpenAI开源/仓库

06:09

Greg Brockman@gdb

40

我对GPT Image 2在应用构建中的实用性感到非常惊喜：【引用 @romainhuet】：GPT-5.5 + GPT-Image-2 is becoming one of the best combos for building apps！ @dkundel 分析了它为何如此有效。我们将这些见解融入了Build Web Apps插件中，因此Codex可以为您处理从设计到应用的循环。👌

OpenAI图像生成多模态大佬观点

06:08

Ethan Mollick@emollick

56

Gemini现在可以创建文档了，这是个不错的开始，但尚未达到前沿水平，正如你从我"霍格沃茨杠杆收购"测试中看到的那样。 PowerPoint比NotebookLM差得多，电子表格功能简陋，仍然没有思考轨迹，它的思考也不够深入。

Google评测/基准

05:36

Z.ai@Zai_org

59

模型规模化部署的挑战与GLM-5服务调试经验

模型能力的提升遵循扩展定律，但其在生产环境中的可靠性取决于如何应对“规模化阵痛”。博客通过GLM-5大规模服务的调试实例，分享了处理罕见乱码输出、重复及生僻字符生成等问题的经验。关键工作包括追踪并消除KV Cache的竞态条件、修复HiCache同步问题，以及引入LayerSplit技术以实现最高132%的吞吐量提升。这些实践旨在帮助社区避免类似陷阱，构建更健壮的推理基础设施。

教程/实践部署/工程

关联讨论 1 条

05:14

Replit ⠕@Replit

41

提示词时代正在终结。接下来是：新的界面和全自主代理，它们将推送而非拉取。 Amjad 谈后提示时代，与 @southpkcommons 直播中 ⠕ 完整对话如下。

智能体大佬观点现象/趋势编码

05:09

OpenAI Developers@OpenAIDevs

精选62

⚙️ 我们通过 Responses API 中的 WebSockets 让代理循环运行得更快随着 Codex 速度提升，瓶颈从推理转移到了低效的 API 调用 WebSockets 在工具调用之间保持响应状态活跃，帮助工作流程端到端运行速度提升高达 40% https：//openai.com/index/speeding-up-agentic-workflows-with-websockets

智能体OpenAI产品更新

推荐理由：这不是颠覆性更新，但对依赖 Responses API 搭 agent 的开发者是个实打实的好消息，loop 加速 40% 意味着延迟和成本双降，官方推荐的最佳实践值得直接套用。

04:44

宝玉@dotey

60

我就说你们咋逆向 Claude Design 的 System Prompt 的，原来都在请求的 Payload 里面，包括调用啥工具都有。可惜额度太少了，用几次就没了

AnthropicMCP/工具教程/实践

04:41

OpenAI@OpenAI

26

还在思考如何将Codex用于（几乎）所有事情吗？ Codex能协助更多支持性工作，从整理研究到制作电子表格、演示文稿和摘要。

OpenAI其他编码

04:39

Sundar Pichai@sundarpichai

63

谷歌Q1财报亮眼，AI投资驱动全线业务增长

谷歌2026年第一季度业绩表现强劲，AI投资与全栈策略正全面推动业务增长。公司搜索查询量因AI驱动创下历史新高，Google Cloud收入同比增长63%。Gemini模型发展势头迅猛，以GeminiApp为代表的消费者AI订阅业务也创下季度最佳纪录。公司即将举行财报电话会议，并将在20天后的Google I/O大会上分享更多进展。

Google搜索行业动态

关联讨论 1 条