AIHOT

4月29日

01:04

歸藏(guizang.ai)@op7418

近期第三条百万曝光内容了，这个 Skill 几天就干到了 3800 Star 【引用 @op7418】：http：//x.com/i/article/2047484171258634240

智能体MCP/工具教程/实践

01:03

Ant Ling@AntLingAGI

AntLingAGI宣布将其模型Ling-2.6-flash正式开源，该模型此前在OpenRouter平台上曾以"Elephant Alpha"为名提供API服务。目前，模型已在Hugging Face和ModelScope平台全面开放，供公众自由使用与构建。模型关键参数为总参数量1040亿，激活参数量74亿，在Artificial Analysis基准测试中输出速度约为每秒215个token，并支持BF16、FP8和INT4多种精度格式。此次开源得到了合作伙伴Novita Labs，以及lmsysorg的SGLang团队和vllm项目的技术支持。

开源/仓库模型发布端侧

01:00

SemiAnalysis@SemiAnalysis_

地球上每一块AI芯片都需要一种单一的薄膜材料。GPU、TPU、定制ASIC。无一例外。全球98%的供应由一家日本化学公司控制。目前没有可投入生产的替代品。唯一的生产商产能已排期至2027年。正在提价。交货期超过6个月。NVIDIA如此担忧，以至于他们自行承担一半资本支出以扩建供应商的晶圆厂。关键词是"umami"。目前无人讨论此事。但很快人们就会开始关注。

现象/趋势行业动态部署/工程

00:56

凡人小北@frxiaobei

我的AI搭档Finn：从直接使用Agent到智能工作流管理的转变

作者不再直接与多个AI Agent交互，而是通过核心AI搭档Finn来管理整个工作流。具体流程是：先在Codex中将单个Agent或技能调试稳定，然后交由OpenClaw平台运行，后续基本无需干预。用户只需向Finn提出需求，由其协调其他Agent执行，避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具，并通过白名单、审计和能力边界限制确保安全。例如，处理年度烂账的流程被调试为固定技能后，Finn能自动填表、定时盘点并发送邮件，成为集私人助理、财务总监和技术总监于一身的角色。

智能体MCP/工具教程/实践

00:53

Ant Ling@AntLingAGI

vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持，体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括：1040亿总参数与74亿激活参数的高度稀疏混合专家架构，结合了1：7 MLA与Lightning Linear注意力机制，支持262K上下文长度，并具备原生工具调用能力，可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

智能体开源生态模型发布

00:30

OpenRouter@OpenRouter

精选66

NVIDIA NemotronTM 3 Nano Omni 已在 OpenRouter 上线。这是一个用于智能体工作流的开源 30B-A3B 多模态模型：文本、图像、视频和音频输入 → 文本输出，拥有 256k 上下文窗口和高效的 MoE 架构，适用于计算机使用、文档和音视频推理。

智能体产品更新多模态

推荐理由：Nemotron 3 Nano Omni 是 NVIDIA 在开源多模态模型上的新动作，30B 参数 MoE 架构、256k 上下文、四模态输入，做 Agent 工作流的开发者值得试一下，尤其文档和音视频推理场景。

00:26

Rohan Paul@rohanpaul_ai

日本机场测试人形机器人应对劳动力短缺

为应对因游客激增和年轻劳动力不足引发的航空业人力危机，日本在东京羽田机场测试人形机器人。测试机型包括Unitree G1和UBTECH Walker E，旨在承担装载货物、搬运行李等繁重体力劳动。日本航空希望借此减轻约4000名地勤人员的工作负担，并计划未来将机器人用于清洁客舱和操作其他辅助设备。

具身智能行业动态

00:23

宝玉@dotey

试用Open Claude Design：开源有潜力但交互存差距

作者试用Open Claude Design项目，肯定其作为开源项目的学习价值，项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形，在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。

Tom Huang：正式开源 open claude design 🚀 超 95% 以上的还原度！浓缩和逆向所有 claude design 最先进的设计，最好看的模板💥 …

MCP/工具开源/仓库教程/实践编码

00:19

向阳乔木@vista8

OpenAI研究员离职观点：后训练前沿与AI依赖风险

基础模型能力不断增强，后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格，后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题：心理依赖使人们外包思考与决策；无力感源于AI强大后普通人的影响力下降；自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题，提升模型能力本身就是解决对齐问题的途径。

大佬观点安全/对齐现象/趋势

00:15

宝玉@dotey

针对用户询问使用Codex还是Claude更多的偏好，作者回应在GPT 5.5版本之后，更倾向于使用Codex和ChatGPT。主要原因是GPT的写作能力显著提升，新增了画图功能，并且Token焦虑问题暂时得到缓解，使得这些工具在当前更具实用性和吸引力。

potato：@dotey 我想问一下宝玉老师，现在用 codex 多一点还是 Claude 多一点？

OpenAI大佬观点编码

00:13

Replit ⠕@Replit

你会为自己在AI之前制作的幻灯片感到尴尬认识一下Replit Slides 首个拥有惊艳设计的AI幻灯片

产品更新图像生成

00:13

Chubby♨️@kimmonismus

在今天的通讯中，我主要关注了OpenAI与微软协议的重组。发生了什么变化？了解更多--请免费订阅http：//getsuperintel.com ：）

MicrosoftOpenAI行业动态

00:12

AK@_akhaliq

Apple 推出随机键值路由实现自适应深度缓存共享论文： https：//huggingface.co/papers/2604.22782

论文/研究部署/工程

00:11

MiniMax (official)@MiniMax_AI

很高兴能为 @mira_t_me 在 Telegram 上的 AI 智能体提供支持--多模态、大规模，服务于日常用户。欢迎加入这个生态系统 🤝

智能体行业动态

00:11

宝玉@dotey

用户@Alexu0317询问Opus 4.7和Sonnet 4.6的使用体验，指出在迭代项目文档时两者表现无显著区别，均存在遗忘和犯错问题。主推文回应强调，任何模型都受上下文窗口长度限制，窗口占用过满会导致效果下降。在文档写作场景中，若格式固定、要求不高，Sonnet和Opus差别不大；但对写作要求高的任务，Opus表现更优。这揭示了模型性能受上下文约束，且在不同应用场景下模型选择需基于任务复杂度。

Alex Xu：@dotey 宝玉老师能分享一下Opus 4.7 和Sonnet 4.6的使用体验吗？我在迭代项目文档的时候，发现Opus并不比Sonnet强。该忘的都忘，该犯…

教程/实践编码

00:11

AK@_akhaliq

从技能到人才将异构智能体组织为现实世界的公司论文： https：//huggingface.co/papers/2604.22446

智能体Hugging Face论文/研究

00:07

凡人小北@frxiaobei

远程技术面试模式正发生变化。面试官倾向于扮演甲方提出需求，应聘者则直接使用如Codex或Claude Code等AI编程工具，通过共享屏幕进行实时编码任务。这种方式能在半小时内直观评估候选人的真实能力。为应对应聘者可能使用AI作弊，面试官也采取了一些直接方法，例如要求候选人闭眼回答问题，以验证其即时思考与知识掌握程度。

凡人小北：听到一个字节面试官远程面试候选人，如何抓对方用 ai 作弊的方法，朴素到离谱。面试官突然说：你闭上眼睛回答这道题。

现象/趋势编码

00:07

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

哇。 Talkie，一个仅用1930年前文本训练的AI： A："如果你是一台机器，你会做什么？" Talkie-1930："做好工作……一台做不好工作的机器很快就会被丢弃。" "这将源于自我保护这一强大的本能。"

安全/对齐现象/趋势

00:05

AK@_akhaliq

微软推出 World-R1 强化文本到视频生成的3D约束论文： https：//huggingface.co/papers/2604.24764

Microsoft视频论文/研究

00:04

Epoch AI@EpochAIResearch

在我们关于机器人生产能多快实现规模化的报告之外，我们还发布了一系列关于机器人未来的@metaculus预测问题。如果你对这些趋势的发展方向有见解，欢迎参与讨论！

具身智能现象/趋势

00:01

Replit ⠕@Replit

Replit + 安全 | 与CTO Luis Héctor Chávez的社区问答 https：//x.com/i/broadcasts/1YxNrZYVeoZxw

安全/对齐行业动态

00:00

Sundar Pichai@sundarpichai

谷歌翻译二十周年：从简单短语到实时对话的演进

谷歌翻译迎来二十周年，已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段：2006年依靠统计机器学习分析词簇，2016年转向神经网络实现超越字面的翻译，如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话，最新模型甚至能通过耳机充当口译器，并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言，人们却逐渐将其视为常态。谷歌对此表达感谢，并展望未来二十年的技术突破。

Google多模态大佬观点

4月28日

23:59

elvis@omarsar0

关于如何开始构建LLM知识库的一些说明。 @karpathy 推广了这个概念，但大多数人不知道从哪里入手。每个人都应该创建LLM维基。明天有直播会议。分享了一个代码库示例，即将推出一项新技能。 https：//academy.dair.ai/blog/how-to-build-an-llm-knowledge-base

智能体检索增强教程/实践

23:58

Rohan Paul@rohanpaul_ai

精选71

Claude推出原生连接器，可直接操作Blender、Fusion等创意软件

Anthropic为Claude推出了一系列针对创意软件的原生连接器，使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API，例如在Blender中调试场景、批量编辑对象，在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”，如寻找菜单、记忆语法、编写一次性脚本等，从而实现更少的上下文切换、更直接的操作和更高的自动化程度，提升工作效率。

AnthropicMCP/工具产品更新

关联讨论 2 条

推荐理由：Claude 终于从聊天框走进了 Blender 和 Fusion 的生产现场，这对创意工作者来说是真正省时间的更新，做 3D 和设计的值得立刻试试 Blender connector。

23:53

凡人小北@frxiaobei

雷老板是懂营销的，本着拿人 token，替人带货的原则，替 Xiaomi MiMo 喊个话。

开源生态行业动态

23:53

OpenRouter@OpenRouter

精选61

我们研究了市场上Opus 4.7的数据，发现成本增加了12-27%，但短提示除外，实际上短提示的成本效益更高。完整文章：https：//openrouter.ai/announcements/opus-47-tokenizer-analysis

Anthropic现象/趋势部署/工程

推荐理由：OpenRouter 用自家平台数据实测 Opus 4.7 的真实成本变化，不是官方 PR 而是第三方视角，做成本预算的产品人和开发者值得看一眼再决定要不要迁移。

23:52

ClaudeDevs@ClaudeDevs

精选69

Claude Code 现在可以在长时间任务完成或需要您输入时，向您的手机发送推送通知。离开终端吧，完成后我们会通知您。

智能体Anthropic产品更新编码

推荐理由：Claude Code 终于让你能离开终端了，跑长任务时手机会收到通知，这对重度 coding agent 用户是个刚需补丁，虽然小但直接提升日常体验。

23:51

Ant Ling@AntLingAGI

精选62

AntLingAGI与SGLang团队合作，正式推出Ling-2.6-flash（亦称Elephant-alpha）即时指令模型，并在SGLang平台上实现了首发支持。该模型总参数量达104B，但活跃参数仅7.4B，专为低延迟的智能体工作流优化，能够实现即时响应。它在编码、文档处理和智能体任务中展现出极高的token效率，所用token数量显著减少。尽管活跃参数较少，其模型质量仍与当前SOTA水平相当，兼具速度与执行力，适合需要快速响应的生产级智能体应用。团队强调，快速且稳定的推理是提升用户体验的关键。

智能体模型发布部署/工程

推荐理由：104B 总参但只激活 7.4B，蚂蚁这步棋是冲着 Agent 场景的低延迟去的，做 Agent 产品的人值得跑一下看看实际体感。

23:49

Chubby♨️@kimmonismus

我删除了那条关于Anthropic搅拌机的帖子。你们让我思考并提出了有力的论据。也许我的判断下得太仓促了。我需要再想想。

其他

23:41

Rohan Paul@rohanpaul_ai

Miniloop推出AI劳动力平台，将市场进入工作转化为自主代理

当前，各类AI产品正不断涌现，致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台，能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流，实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员，据用户反馈每周可节省超过20小时，而成本仅为雇佣真人团队的十分之一。

智能体产品更新

23:34

阿绎 AYi@AYi_AInotes

DeepSeek V4 Pro质量是Claude的85%，价格只有七分之一。

通过ZenMux平台的PK模式实测，DeepSeek V4 Pro在处理结构化任务（如马斯克思维模型分析）时，输出逻辑清晰、表达母语化，质量达到Claude的85%，但价格仅为其七分之一。作者建议将80%的日常工作（如写代码、调研）交由DeepSeek处理，20%需要顶级文笔的任务使用Claude，可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具，帮助用户规避依赖单一API厂商的风险并提升选型效率。

阿绎 AYi：兄弟们，DeepSeek V4 Pro在ZenMux上免费放开了，登录就能跑，实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4…

DeepSeek现象/趋势编码评测/基准

23:24

dax@thdxr

我们的订阅用户已达5万月费仍为10美元使用限制比以往更高

编码行业动态

23:24

Chubby♨️@kimmonismus

在OpenAI和Anthropic等公司专注于开发AI模型本身的同时，Base44另辟蹊径，致力于构建这些智能体实际运行所需的基础设施平台。该平台最新推出了一键迁移功能，支持用户将项目从Salesforce、Shopify、WordPress、Lovable、Bolt和Replit这六大平台快速迁移至Base44。迁移过程不仅包含数据转移，还提供数据结构重建、自定义界面生成服务，并允许用户在自身数据之上构建智能体工作流。为庆祝功能发布，在5月5日东部时间零点前完成迁移的用户可获得25个免费积分。Base44此举凸显了其在AI技术栈中专注于可能更为关键的基础层。

智能体产品更新部署/工程

23:19

Ant Ling@AntLingAGI

灵码2.6-flash模型正式开源，专为高效智能体工作流打造

灵码2.6-flash模型现已开源，这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿，激活参数量为74亿，并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括：生成速度高达每秒215个token，在完整评估中仅消耗1500万token，效率突出；在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲；同时，其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。

智能体开源/仓库模型发布编码

23:18

阿绎 AYi@AYi_AInotes

精选71

优化CLAUDE.md：聚焦关键规则以提升AI协作效率

多数人编写的CLAUDE.md冗长无效，常因添加过多人格指令导致Claude仍会猜错命令或重写文件。有效的CLAUDE.md应是精炼的项目技术简报，控制在60-80行内。核心在于认识到Claude的注意力是稀缺资源，系统提示已占用部分容量。正确结构应包含：明确的关键命令、简洁的架构地图、强调禁止事项的硬性规则、清晰的工作流偏好，并避免重复AI已记忆的内容。这本质上是LLM时代的注意力经济学，通过具体、负向的规则能显著提升输出精准度。一份好的CLAUDE.md能随项目积累价值，节省沟通成本并固化工程规范。

智能体教程/实践编码

推荐理由：CLAUDE.md 写法这事门槛低但坑极多，这篇把「注意力稀缺」当核心逻辑来讲，比大多数 prompt 教程都更接近工程真相，用 Claude Code 的人读完直接砍文件就行。

23:17

Chubby♨️@kimmonismus

作者批评Anthropic正在重复OpenAI近期犯下的错误，即未聚焦核心产品，反而试图将Claude连接到各类外部工具。尽管官方宣称新推出的Blender连接器能让创意工作者直接在Claude中调试场景、构建工具或批量修改对象，但作者指出Claude Opus 4.7版本仍显失败，质疑公司是否应继续将资源投入此类附加功能开发。

MCP/工具产品更新大佬观点

23:15

OpenRouter@OpenRouter

精选64

@poolsideai 的首批公开基础模型刚刚在 OpenRouter 上发布！ Laguna M.1 和 Laguna XS.2。专为智能体编码和长周期工作从头构建。限时免费 ⬇️

智能体模型发布编码

推荐理由：Poolside 终于把自家模型放出来了，主打长上下文 agentic coding，免费期是薅羊毛窗口。做 coding agent 的团队值得拿 Laguna 跑一轮自己的 benchmark，看看和 Claude、Codex 的真实差距。

23:13

TestingCatalog News 🗞@testingcatalog

Plurai公司推出vibe-training方法，旨在解决AI代理在演示中表现良好但面对真实用户时易出错的痛点。该方法允许开发者通过提示或少量示例快速定义意图，自动生成边缘案例数据集，并训练出与特定用例对齐的专用模型。其核心优势在于能在几分钟内构建生产就绪的实时评估与防护机制，使用小型语言模型实现低于100毫秒的延迟，成本比使用大型语言模型作为评判器降低超过8倍，并将到达用户的故障率较前沿LLM评判器减少43%，从而以极低成本实现超越现有大模型的性能。

智能体产品更新部署/工程

23:10

向阳乔木@vista8

Agent时代下的CLI复兴与编程范式转变

推文指出，大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前，编程与构建已正交化，非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下，关键在于知道何时调用何种能力。多个Agent协作可超越线性增长，但需机制管理。不同用户培养的Agent会形成独特的“群体性格”，类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。

智能体大佬观点编码

23:07

Claude@claudeai

精选62

Claude 现已连接创意专业人士已在使用的工具。通过新的 Blender 连接器，您可以直接从 Claude 中调试场景、构建新工具，或对每个对象批量应用更改。

AnthropicMCP/工具产品更新

推荐理由：Blender 连接器意味着 Claude 开始认真渗透创意工作流，做 3D 的人终于不用在终端和 GUI 之间反复横跳了，虽然目前场景还窄，但方向对。