AIHOT

5月1日

01:14

MiniMax (official)@MiniMax_AI

在@stripe Sessions的第一天真是🔥 我们的展位全天都挤满了精彩的对话。感谢大家的热情参与！第二天已经开始。来604号展位找我们吧👋

行业动态

01:14

MiniMax (official)@MiniMax_AI

在旧金山举行的AI Champions Dinner上，与会者围绕AI的发展方向展开关键讨论。核心议题是如何将AI从单纯的产品协作工具，转变为能驱动真实人际连接的平台。@Wati_io团队阐述了其构建理念：由AI处理复杂事务，从而让人能够实现大规模的人际沟通与连接。活动由@boltdotnew组织，@UnicornerNews联合主办，@MiniMax_AI等机构共同促成此次聚会。

行业动态

01:14

宝玉@dotey

CodexPotter 是一个命令行工具，通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件，随后在全新上下文中反复启动 Codex 会话，对照该文件检查并修正代码，直至输出与目标一致，默认最多进行 6 轮迭代。该工具适用于目标明确的任务（如按文档实现功能），而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具，以回应寻找类似 Claude Code 中 Ralph 插件的需求，并指出其不会像某些插件那样修改用户配置。

宝玉：请问有没有好用的 Ralph Loop for Codex？类似于 Claude Code 的 Ralph Wiggum Plugin https://git…

GitHub开源/仓库编码

01:12

Chubby♨️@kimmonismus

"claude-jupiter" 会是 Anthropic 的下一个 Sonnet 级模型吗？ Sonnet 4.8 与 Opus 4.7 以及 Mythos/Capybara 的引用一同出现在 Claude 代码源泄露中--所以这可能是一个内部代号，而非随机的 Discord 传闻。

Anthropic行业动态

01:10

阿绎 AYi@AYi_AInotes

模型进化方向相反，提示工程核心转向结构化思考

近期用户感觉GPT和Claude“变笨”，实因模型能力进化导致提示工程要求改变。官方指南揭示，两大模型进化方向相反：Claude Opus 4.7趋向字面执行指令，而GPT-5.5则更自主，能根据目标自行选择路径。因此，旧提示失效原因也相反——模糊提示在Claude上输出变窄，详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”，未来优势将属于思考最清晰、最明确自身需求的人。

AnthropicOpenAI大佬观点

01:09

Rohan Paul@rohanpaul_ai

Jensen Huang 谈 OpenClaw。 "OpenClaw 可能是最重要的软件发布，你知道的，或许是有史以来最重要的。" Nvidia 每月花费 100 万美元运行这些智能体，因为每个提示的令牌使用量增长了 1000 倍。

智能体大佬观点

00:44

向阳乔木@vista8

DeepSeek提出"视觉原语"多模态推理框架，用"指"的方式思考

DeepSeek团队提出全新多模态推理框架“Thinking with Visual Primitives”，核心是让模型在推理过程中像人类一样，使用“点”和“边界框”这类视觉原语来指代图像中的具体位置，以此作为思维的最小单位，旨在解决语言在精确描述空间位置时的“指代鸿沟”问题。模型采用DeepSeek-V4-Flash作为语言骨干，并设计了极致的视觉Token压缩流水线，将视觉Token用量压缩至其他前沿模型的十分之一。尽管视觉信息被大幅压缩，模型在空间推理、计数等任务上仍达到或超越了GPT-5.4、Claude-Sonnet-4.6等模型的性能。

DeepSeek多模态推理论文/研究

关联讨论 2 条

00:44

向阳乔木@vista8

DeepSeek论文AI解读：独立思考与数据清洗亮点

作者完成DeepSeek最新论文的AI解读，指出论文在独立思考方面表现突出，闪耀创新光辉。数据清洗过程细致严谨，通过多条件过滤将数据规模从近10万缩减至3万条。训练数据构建设计巧妙，例如大量迷宫题等趣味方法，体现了研究团队的创意。整体而言，论文在AI领域具有重要价值，获得高度评价。

DeepSeek教程/实践论文/研究

00:44

向阳乔木@vista8

DeepSeek-VL：面向真实场景的视觉语言模型

DeepSeek-VL旨在解决开源视觉模型在真实场景中应用效果不佳的问题。其核心方案是系统性地从数据、架构与训练三方面进行设计：数据构建强调从真实用户需求出发，并包含70%的纯文本以保留语言能力；模型架构创新性地采用SigLIP与SAM-B混合视觉编码器，兼顾高层语义与低层细节；训练策略则通过三阶段渐进式训练与模态平衡技术，有效缓解了视觉训练对语言能力的侵蚀，最终在同等规模下达到开源模型的顶尖水平。

DeepSeek多模态教程/实践

00:44

宝玉@dotey

Agent产品交互的两类主流模式与设计关键

当前AI Agent产品的交互主要分为两类：一是以Agent为中心，如Cursor的Agent模式和Codex，界面以对话列表指挥AI为主，手动修改为辅；二是以人操作为主、Agent为辅助，如GitHub Copilot，在传统软件界面旁增设侧边栏。设计者需首先明确软件是以Agent为核心还是辅助，否则易导致交互混乱。有观点指出，交互形式三年多来革新缓慢，关键在于缺乏对Agent从“无状态”到“有状态”处理的基础设施支持，状态机抽象有望推动交互设计丰富化。

Yangyi：为什么从gpt到现在已经三年多了还是这种交互侧边栏会话记录+对话详情+artifact 再多一点儿可能再分一个层级出四栏或者上下再分层级tab 之所以没…

智能体现象/趋势

00:43

OpenAI Developers@OpenAIDevs

学生们正在学习使用Codex进行构建，并通过构建来学习。以下是@UCBerkeley的学生在@joinHandshake举办的Codex Creator Challenge中构建的作品。

OpenAI教程/实践