AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月25日周四
00:18Berryxia.AI66OpenAI发布首款自研AI芯片Jalapeño
00:15Hugging Face:Blog(RSS)66精选NVIDIA NeMo AutoModel:一行代码加速Transformer MoE模型微调
00:05向阳乔木57前SpaceX工程师洪力德深度访谈:猎鹰9号回收、星链物理优势与太空数据中心逻辑
00:05向阳乔木58字节火山引擎大会:洪定坤谈AI开发新范式
6月24日周三
23:52François Chollet28边缘案例与故障模式定义系统轮廓
23:49swyx 🔜 @aiDotEngineer19Karpathy 鼓励投身 AI 智能体开发
23:45Ethan Mollick64Anthropic 推出 Claude Tag:从工具到"同事"的企业 AI 体验与风险
23:34向阳乔木56Vista:连续追问AI三次可改善文章质量
23:13AYi61Notion 大规模招聘:AI 集成草莽时代结束
22:58IT之家(RSS)56汇丰调查:AI 目前仍无法取代人类财富顾问
22:58IT之家(RSS)52论文 AI 率改后反升,央视揭秘检测原理
22:48Nathan Lambert49Nathan Lambert 用 GLM 5.2 开讲 AI 基础
22:36Google DeepMind50DeepMind 播客探索 AI 智能体经济与群体思维
22:31公众号:火山引擎74精选字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
22:29Hacker News 热门(buzzing.cc 中文翻译)78精选里德·霍夫曼称SpaceX"不是一家人工智能公司",xAI则是"彻底的灾难"
22:20gabriel25Neuralink 年底尝试直接向 LLM 传递意图
21:29MarkTechPost(RSS)68Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令
21:05fofr13怀念2022年Stable Diffusion氛围
20:13AYi65Telegram创始人Durov劝学生别学编程?真相是断章取义
19:44PixVerse23PixVerse AI视频用于游戏过场动画
19:10公众号:卡尔的AI沃茨65快手KroWork:将AI Skill工作流打包成本地桌面App
19:03The Decoder:AI News(RSS)47Pangram CEO:语言模型会因论点雷同而暴露自己
18:50IT之家(RSS)55斯坦福毕业生对AI态度分化:乐观者视为探索工具,担忧者质疑伦理与环境
18:46meng shao19Zcode 接入 GLM-5.2 体验:快、好用、缺 Computer Use
18:00Chubby♨️71欧洲数字主权时代尚未开始已结束?欧盟等国加入美国主导的Pax Silica倡议
18:00公众号:小红书技术(dots.llm)51AICon 上海 2026|小红书质效:Agent 基建的规模化落地路径
17:44IT之家(RSS)58美团副总裁陶雪璇:大众点评反对和抵制 AI 评价
16:22MarkTechPost(RSS)432026年16大生成式AI编码工具对比:功能与适用场景
16:18Berryxia.AI50Anthropic内部演讲:99%工程师运行300+自改进agent swarm
16:15meng shao50邵猛用 TRAE Work 测试豆包2.1 Pro,视觉还原和前端设计能力超预期
16:11Elon Musk23Grok 作为搜索引擎表现优于 Google
15:42IT之家(RSS)43软银孙正义回应 AI 泡沫论:这是对 AI 的侮辱,人工智能仍处于发展初期
15:37eric zakariasson24Anthropic推Slack集成 可切换模型避锁定
15:20公众号:蚂蚁百灵(Ling)49Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运
15:14DogeDesigner19cb_doge:计算是新的石油
15:10OpenBMB65精选MiniCPM-V 4.6 在 Apple Core AI 上高速运行
15:04数字生命卡兹克63体验微信小微Agent:微信有史以来最大更新,但智能与便捷仍有不足
13:39MiniMax (official)39MiniMax M3与OpenCode构建仿人机器人目录
13:12AYi70用户丢截图给 StepFun step-3.7-flash,2分多钟生成可用的文章头图生成器
12:17宝玉72宝玉分享极客风 Skills 管理方式
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月25日
00:18
Berryxia.AI@berryxia
66
OpenAI发布首款自研AI芯片Jalapeño

OpenAI发布首款自研AI芯片Jalapeño,专为ChatGPT、Codex、API及未来Agent产品的LLM推理设计,由Broadcom生产。从设计到流片仅用9个月,借助AI模型辅助设计。首批样片实测性能功耗比显著优于当前顶级加速器,Broadcom CEO称性能媲美NVIDIA Blackwell与Google TPU,成本减半。若2026年底实现吉瓦级部署,推理成本有望降低约50%。Jalapeño仅针对推理,训练仍依赖NVIDIA。此举标志OpenAI从模型公司向全栈AI基础设施公司转型。

OpenAI: We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...

OpenAI大佬观点推理部署/工程
00:15
Hugging Face:Blog(RSS)
精选66
NVIDIA NeMo AutoModel:一行代码加速Transformer MoE模型微调

NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库,添加 Expert Parallelism、DeepEP 融合 all-to-all 调度和 TransformerEngine 内核。在 MoE 模型微调中,相比原生 v5,训练吞吐量提升 3.4–3.7 倍,GPU 内存减少 29–32%,仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B A55B 时,v5 因内存不足无法运行,而 AutoModel 凭借 EP=64 专家并行使训练可行。单节点 30B MoE 模型(如 Qwen3-30B-A3B)同样获得可量化的性能优势。

开源/仓库教程/实践数据/训练

推荐理由:英伟达的 NeMo AutoModel 把 MoE 模型微调速度提高了三倍多,内存省了近三分之一,代码只需改一行 import,做训练的可以立刻升级。
00:05
向阳乔木@vista8
57
前SpaceX工程师洪力德深度访谈:猎鹰9号回收、星链物理优势与太空数据中心逻辑

前SpaceX猎鹰9号首席制造工程师洪力德(Louis Hong)接受访谈,指出2015年12月21日猎鹰9号首次入轨回收是行业转折点,将每公斤发射成本从1-2万美元降至约3000美元(星舰目标100美元以下)。星链基于真空传输速度比光纤快一倍的物理优势于2015年启动。SpaceX与xAI合并的底层逻辑是太空数据中心:免审批、利用高转换效率太阳能,解决美国电网25%-40%缺电及AI算力需求。马斯克用人重成长速度而非经验,如曾用Mini Cooper团队创新火箭制造。

xAI现象/趋势
00:05
向阳乔木@vista8
58
字节火山引擎大会:洪定坤谈AI开发新范式

字节火山引擎大会上,洪定坤分享了AI开发的三个核心方法论:1. 原型驱动开发——用AI生成可交互原型替代PRD,提前暴露分歧。2. AI Development系统化——AI写Spec→功能实现→Browser Use验证→自动提交上线。3. Harness基建——上下文工程、架构约束、团队知识Memory、技术债梳理,能将可交付性从40~60分提升至80分。

大佬观点编码部署/工程
6月24日
23:52
François Chollet@fchollet
28
理解复杂系统的最佳方式是通过边缘案例和故障模式,因为它们定义了系统的轮廓。
大佬观点推理
23:49
swyx 🔜 @aiDotEngineer@swyx
19
受 @karpathy 言论启发,阐述为什么你应该从事 AI 智能体工作。

swyx 🔜 @aiDotEngineer: Inspired by @karpathy's words on why you - yes YOU - should work on AI Agents

智能体大佬观点
23:45
Ethan Mollick@emollick
64
Anthropic 的 Claude Tag 让企业成员共享同一 Claude 实例,使其能异步自主行动、吸收隐性知识,从工具变为"同事"。这带来严重锁效应:团队无法查看或编辑 Claude 的独立记忆,解雇 Claude 会导致工作流和隐性知识丢失。定价按 token 计费,Claude 可无限制工作,企业难以像工具那样管控成本,token 预算耗尽将全员停工。此外,Claude 接入私有频道可能访问用户无权限的仓库和工具,引入新安全风险。AI 公司正从争夺 IT 预算转向争夺劳动力支出,Claude Tag 是这一转型的里程碑。

Arvind Narayanan: The new Claude Tag feature seems extremely useful, but at the same time, a dangerous bargain for enterprises because of ...

智能体Anthropic大佬观点安全/对齐
23:34
向阳乔木@vista8
56
Vista:连续追问AI三次可改善文章质量

Vista分享经验:将3小时播客访谈交由AI生成文章时,通过连续追问“还有什么细节需要补充?”(约三次)能有效补全遗漏细节,显著改善输出质量,使文章更具故事性。她建议将这一追问流程封装为Agent Skill,以便复用。

智能体教程/实践
23:13
AYi@AYi_AInotes
61
Notion 大规模招聘:AI 集成草莽时代结束

Notion 发布招聘帖,职位列表中找不到传统 Prompt Engineer,取而代之的是模型行为工程师、AI 评估师、AI 治理专员、客户体验知识架构师等工程化岗位,负责调优模型行为边界、评估输出质量、设计权限与审计体系。Notion 认为 AI 负责执行,人类负责定义价值,因此同步扩招销售、客户成功、知识架构师。实习生要求对艺术、历史、社会科学有兴趣,强调判断力。招聘帖采用 ASCII 艺术设计,获得高传播。

Notion: ______ | We're hiring | |______| \ (•◡•) / \ / -- | | |_ |_ Open roles: → AI Applications Engineer → AI Conversation Des...

现象/趋势部署/工程
22:58
IT之家(RSS)
56
汇丰调查:AI 目前仍无法取代人类财富顾问

汇丰控股调查约1万名富裕及高净值人士,62%受访者视专业人士为投资想法主要来源,仅12%认为AI最重要。客户用AI了解选项,但最终决策依赖人类顾问的判断与责任。麦肯锡称资产不足100万美元的客户或逐步被AI取代,花旗增聘顾问把握增长。年轻一代更倾向结合AI与顾问,但人类顾问的判断、验证和个性化解读最难替代。

现象/趋势行业动态
22:58
IT之家(RSS)
52
论文 AI 率改后反升,央视揭秘检测原理

毕业季高校毕业生论文面临 AIGC 检测新关卡。有学生论文 AI 率为 62%,远超学校 15% 红线,尝试用大模型改写后检测升至 94%。首都师范大学副院长蔡海龙指出,AI 检测本质是基于概率的分类,用 AI 查 AI 无法明确判定;中文语意丰富易致歧义误判。当前检测依赖困惑度与突发性等特征,准确性无法达 100%。专家建议建立透明可回溯的 AI 使用标注制度,实行“人工评议为主、AI 检测为辅”的人机共判模式。

现象/趋势
22:48
Nathan Lambert@natolambert
49
Nathan Lambert 用 GLM 5.2 开讲 AI 基础

Nathan Lambert 发布了一期 AI 基础讲座视频,使用 GLM 5.2 模型生成。内容涵盖语言模型概述、LM Head、Softmax 与对数概率、训练样本结构、概率计算、后训练中的三种掩码、解码、交叉熵损失、优化与微调、预训练到 SFT 流程、KL 散度与熵、Sigmoid 与成对似然、强化学习 MDP 框架等。视频包含时间戳目录,并持续收集观众问题用于后续 Q&A。

安全/对齐教程/实践
22:36
Google DeepMind@GoogleDeepMind
50
DeepMind 播客探索 AI 智能体经济与群体思维

Google DeepMind 发布播客,由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖:AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化(群体思维)风险,以及分布式智能的解决方案。播客还设有详细时间戳分段,帮助听众聚焦不同话题。

智能体DeepMindGoogle现象/趋势
22:31
公众号:火山引擎
精选74
字节跳动技术副总裁洪定坤:AI Coding 的实践与探索

在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,但可交付性仅40-60分;结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发,能力沉淀至TRAE(日均Token消耗5.6万亿,增长50倍),并推出TRAE Work。

大佬观点现象/趋势编码

推荐理由:洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲,尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证,是所有推 AI 编程的团队必看的复盘。
22:29
Hacker News 热门(buzzing.cc 中文翻译)
精选78
里德·霍夫曼称SpaceX"不是一家人工智能公司",xAI则是"彻底的灾难"

LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”,6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”;xAI则是“彻底的灾难”,所有11位联合创始人已离职,Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型,理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞,称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间,但Cursor可能已过巅峰。他建议年轻人不要抵制AI。

大佬观点安全/对齐现象/趋势

推荐理由:Reid Hoffman 对 xAI 和 SpaceX 的批评几乎不留情面,这种硅谷核心人物的公开呛声本身就值得一读,他对监管干预的担忧和对 Gen Z 的劝诫也很有现实感。
22:20
gabriel@gabriel1
25
词语是我们思考概念的极度简化的指针 如果我们能直接向大语言模型给出原始意图,我们可以花少 90% 的时间与它们交谈 不过有点不好的是,你需要一个大脑植入物才能高效工作,尽管它超酷

Elon Musk: @yunta_tsai Maybe first attempt at this for Neuralink later this year

xAI大佬观点
21:29
MarkTechPost(RSS)
68
Nous Research为Hermes Agent技能系统新增/learn命令,无需手写SKILL.md即可将工作流捕获为斜杠命令

Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后,Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/,自动映射为斜杠命令(如/plan、/axolotl)。技能采用三级加载(Level 0返回名称与描述约3k tokens,Level 1加载全文,Level 2加载特定文件),避免大技能库撑满上下文窗口。除/learn外,还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用,仪表板额外提供“Learn a skill”按钮。

智能体产品更新开源生态
21:05
fofr@fofrAI
13
我有时会怀念那些Stable Diffusion 2022的氛围。
其他图像生成
20:13
AYi@AYi_AInotes
65
Telegram创始人Durov劝学生别学编程?真相是断章取义

网上流传Telegram创始人Durov劝学生别学编程和AI、只学数学物理的说法是断章取义。真实对话中,Durov只建议优先打好数学基础,马斯克补充物理加数学,Durov还明确表示数学基础打好后计算机科学非常值得学。没人提出放弃编程或AI。谣言传播是踩中了AI时代的技能焦虑。实际上,AI能写基础代码后,核心壁垒是数学教的拆解问题逻辑和物理教的建模因果思维。最优路径应是数学物理打底、编程落地、AI加速迭代。

Abdullah AL-Khmais: مؤسس تليجرام، ينصح الطلاب: لا تضيعوا وقتكم في تعلم البرمجة والذكاء الاصطناعي.. أدرسوا الرياضيات و الفيزياء جيدا. و إيلون...

大佬观点现象/趋势
19:44
PixVerse@PixVerse_
23
使用AI为你的游戏制作过渡过场动画?太棒了。整个场景充满夏日清新感。期待新项目完成 @patata1216

美咲: ぜんざいのアトリエ開発迷走中😅 海エリアはやっぱり釣りでしょう、とかなんとか言うことで、釣りミニゲームを組み込み。 AI開発らしく、Pixverseで作ったAI動画を差し込んで作ってみたよ。 やってみると、こういうバリエーション動画を作る...

图像生成教程/实践视频
19:10
公众号:卡尔的AI沃茨
65
快手KroWork:将AI Skill工作流打包成本地桌面App

快手新发布KroWork,能将多个AI Skill串成的工作流直接打包为本地桌面应用。用户安装后可在Launchpad中一键下载到本机,双击即可按预设流程运行,无需反复打开对话框或重新配置参数。KroWork支持定时任务(如每天9点自动执行),并允许从Kro Workshop复制他人工作流二次开发。作者用其复刻了Prompt Organizer提示词生成器和Daily Trend Brief(每日AI趋势简报)等日常工具。KroWork定位与Claude Cowork、Codex Site、Claude Code Artifacts相似,旨在将重复工作流沉淀为可分享的本地应用。

智能体MCP/工具教程/实践
19:03
The Decoder:AI News(RSS)
47
Pangram CEO:语言模型会因论点雷同而暴露自己

AI文本检测器Pangram的CEO Max Spero表示,其深度学习分类器是一个黑箱,通过捕捉语言模型在组织文档时留下的结构模式来识别AI生成文本。Spero指出,语言模型在语法和逻辑上可能优于普通人,但论点高度同质化:若要求LLM就某个主题生成100个论点,它们会集中在狭窄范围内,而人类论点的空间则非常多样。这种雷同是AI文本的显著特征。

大佬观点现象/趋势
18:50
IT之家(RSS)
55
斯坦福毕业生对AI态度分化:乐观者视为探索工具,担忧者质疑伦理与环境

斯坦福大学毕业生对AI态度分化。计算机科学专业哈桑认为AI是探索宇宙的工具,鼓励乐观应对;地球系统专业海尔担忧开发不符合伦理,但认可AI可用于训练气候模型。AI已冲击就业,初入职场劳动者就业水平下降,计算机专业也面临求职困难。部分学生依赖AI完成作业导致考试成绩与作业差距扩大,课程恢复监考和口试。心理学专业哈兰反感AI对环境的破坏,认为数据中心消耗大量资源。

现象/趋势行业动态
18:46
meng shao@shao__meng
19
Zcode 接入 GLM-5.2 体验:快、好用、缺 Computer Use

邵猛分享其 AI 编程工具 Zcode 开始使用 GLM-5.2 模型,第一天体验感受:速度快、好用。但对比另一工具 Codex,Zcode 在能力全面性上仍有差距,尤其缺少 Computer Use 功能。最后感谢 @SeTriones 提供 GLM API Key。

编码评测/基准
18:00
Chubby♨️@kimmonismus
71
欧洲数字主权时代尚未开始已结束?欧盟等国加入美国主导的Pax Silica倡议

欧盟、德国、荷兰和希腊加入美国主导的Pax Silica倡议,该倡议旨在保障芯片、关键矿产、能源和算力的AI供应链安全。美国官员Jacob Helberg明确将Pax Silica定位为反对“数字主权”的工具,主张“创新主权”——即各国不应自建技术栈,而应融入美国体系。欧洲多年来高喊技术自主,但在AI成为现实时却选择与美国体系整合,其数字主权尚未开始便已结束。有评论称欧洲主动走入这扇“笼门”,放弃自建技术栈的机会。

Arnaud Bertrand: It's over, Europe has officially given up on its digital sovereignty: they just signed up to Pax Silica, the US initiati...

政策/监管行业动态
18:00
公众号:小红书技术(dots.llm)
51
AICon 上海 2026|小红书质效:Agent 基建的规模化落地路径

小红书质效研发团队在 AICon 上海 2026 公布两项 Agent 基础设施实践。Self-GC 系统通过 ContextObject 对象化建模与三阶段提交机制(Async Plan、Rehearsal、Delayed Commit),将上下文转为可索引的生命周期管理,生产环境实现 10%-20% 输入 Token 下降且保持 90%+ 无影响率。Seal 企业级 AI 个人助理依托 NEX 沙箱实现运行时隔离,结合 Self-GC 与 SealRouter(Auto 模型路由)达成成本减半,并采用 L0-L2 分层记忆体系构建可溯源知识闭环,从 3 天内测到两周完成全员覆盖。

智能体MCP/工具教程/实践
17:44
IT之家(RSS)
58
美团副总裁陶雪璇:大众点评反对和抵制 AI 评价

6月24日,美团副总裁陶雪璇在大众点评必吃榜10周年盛典上表示,大众点评对AI评价持明确反对和抵制态度。她指出,AI生成的评价可能话术漂亮但未真实体验过餐厅,且AI在应用环节的模型幻觉问题依然严重,会影响评价的真实性。评价如同社区公告板,不属于商家、用户或平台任何一方。

大佬观点
16:22
MarkTechPost(RSS)
43
2026年16大生成式AI编码工具对比:功能与适用场景

生成式AI已重塑软件开发,从逐行自动补全扩展到全应用生成、多智能体构建管道和自然语言代码库交互。文章对比了16个最佳工具:Atoms*支持自然语言生成可部署应用并并行运行多模型;GitHub Copilot提供IDE内智能补全与代理模式;Tabnine主打本地化私密代码补全;Replit为云端IDE与AI代理;Warp增强终端AI;Hugging Face提供开源模型平台;Codacy自动化代码质量分析;Metabob基于图神经网络检测深层缺陷;aiXcoder可本地运行开源代码模型;Bloop将代码搜索转向AI智能体基础设施;Mintlify等覆盖IDE插件、云部署到代码质量管理多种场景。

编码评测/基准
16:18
Berryxia.AI@berryxia
50
Anthropic内部演讲:99%工程师运行300+自改进agent swarm

Anthropic内部透露,99%工程师运行300+自改进agent swarm。核心是“close the loop”——模型自验证输出,包含计划、动态工作流、自我检查并迭代。效果远超多数300美元agent课程,但token消耗更高。

智能体Anthropic大佬观点
16:15
meng shao@shao__meng
50
邵猛用 TRAE Work 测试豆包2.1 Pro,视觉还原和前端设计能力超预期

邵猛使用 TRAE Work 测试了字节跳动最新发布的豆包2.1 Pro 模型。官方称豆包2.1 系列在 Coding 和 Agent 能力上显著提升,VLM 能力保持领先,综合能力介于 Claude Opus 4.6 和 4.8 之间。实测中,模型先思考整体规划与实现过程,再读取设计图理解场景和细节,调用最合理的 Skill 规划网页逻辑,分步骤实现后通过本地预览和视觉验证确保效果。最终输出在视觉还原、交互和技术实现上非常细致,包括布局、字体选择、自适应布局,甚至为每个部分配上具有实际意义的图片而非占位符。

多模态编码评测/基准
16:11
Elon Musk@elonmusk
23
几个月前我开始用 Grok 作为搜索引擎,现在只用 Google 纠正拼写错误,因为做这类事用 Grok 较慢。Grok 在各方面都优于 Google。试试 Grok。

Cernovich: I switched the Grok as my search engine a few months ago. I only use Google now to correct typos / check spelling, as it...

xAI大佬观点
15:42
IT之家(RSS)
43
软银孙正义回应 AI 泡沫论:这是对 AI 的侮辱,人工智能仍处于发展初期

软银创始人兼首席执行官孙正义在 6 月 24 日的年度股东大会上表示,人工智能仍处于发展初期,任何声称行业出现泡沫的言论都是“对人工智能的侮辱”。他将软银比作“下金蛋的鹅”,抱怨公司市值(约 37 万亿日元)与资产总额(约 74 万亿日元)之间的巨大落差。孙正义同时宣布软银已开始量产机器人,并推动旗下 Arm 从芯片设计者向芯片提供者转型。

大佬观点现象/趋势
15:37
eric zakariasson@ericzakariasson
24
有趣地观察到Anthropic从以最佳模型为护城河转向构建工具生态系统,与常见开发和非开发工作流进行恰当集成。如果我是CTO,我只会要一个Slack集成,可以在任何时候切换模型……以避免锁定。主推文:在Slack中与模型无关的智能体。

Gergely Orosz: Interesting to observe Anthropic going from the moat being the best model to building a tooling ecosystem with right int...

智能体Anthropic大佬观点
15:20
公众号:蚂蚁百灵(Ling)
49
Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运

蚂蚁 ASystem Core 与 SGLang-JAX 团队在 TPU v7x 上优化了 1T 参数稀疏 MoE 模型 Ling-2.6-1T 的推理性能。核心是 Fused MoE V2 Pallas kernel,将 scatter、expert FFN 和 gather 合并,通过计算与数据搬运重叠降低延迟。相比 V1,MoE prefill latency 从 5.16 ms 降至 2.42 ms(降 53%),decode kernel latency 从 0.249 ms 降至 0.211 ms。仅替换 MoE kernel 即可使 prefill throughput 提升 24.8%,decode throughput 提升 18.5%–35.3%。在 SGLang decode benchmark 下,16 颗 TPU v7x 的 output throughput 达到 16 张 H200 的 1.29x–1.77x。该工作还完整支持 hybrid backbone,包括 hybrid KV/recurrent memory pools、GLA linear attention 及 single-controller data parallelism。

推理教程/实践部署/工程
15:14
DogeDesigner@cb_doge
19
config: 计算是新的石油
大佬观点
15:10
OpenBMB@OpenBMB
精选65
🥳感谢分享,@MLBoy_DaisukeMajima 🚀 MiniCPM-V 4.6 在设备上以这样的速度运行,实在令人印象深刻--尤其是在 Apple Core AI 上以不到 2B 参数跑出。 干得漂亮,推动高效多模态 AI 向前发展。🫡

MLBoy_DaisukeMajima: 📸 MiniCPM-V 4.6 - one of the strongest vision models under 2B params - now runs at ~51 tok/s on iPhone 17 Pro via Apple...

多模态开源/仓库端侧

推荐理由:社区把 MiniCPM-V 4.6 搬上 iPhone 17 Pro,跑出 51 tok/s,还给了代码和模型,做端侧多模态的可以直接跑起来了。
15:04
数字生命卡兹克@Khazix0918
63
体验微信小微Agent:微信有史以来最大更新,但智能与便捷仍有不足

微信小微Agent常驻左上角,支持语音/文本输入,基座模型为微信自研WeLM(WeLM-V4-80B MoE,激活3B)及DeepSeek。可发消息、红包、语音通话,但每一步需用户确认,且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈(限最近2天)、公众号、视频号,支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”,不能删除好友或取消关注。作者认为这是微信最大更新,但在智能程度和便捷性上仍有不足。

智能体MCP/工具评测/基准
13:39
MiniMax (official)@MiniMax_AI
39
用户@whosamberella为学习仿人机器人知识,利用MiniMax M3进行调研,并在OpenCode中搭建了一个仿人机器人目录网站(humanoid-index-one.vercel.app)。其SVG原型不仅能展示,还能帮助学习不同仿人机器人的特征。MiniMax将其过程概括为:研究→综合→构建。

Amber Shen: I wanted to learn about humanoid robots 🤖, then decided the most reasonable thing to do was build myself a humanoid cat...

智能体教程/实践
13:12
AYi@AYi_AInotes
70
用户丢截图给 StepFun step-3.7-flash,2分多钟生成可用的文章头图生成器

用户将截图丢给 StepFun 的 step-3.7-flash 模型(运行在 Codex 中),2 分多钟生成可用的网页版文章头图生成器,支持修改文案和导出 PNG,总成本仅 $0.06。模型能自行理解参考图并实现完整功能逻辑,但视觉还原度仅六七分,手绘涂鸦风需手动调整。StepFun 同步推出 Startup Program,早期团队可获 API 额度、生态支持及资源对接。

图像生成多模态教程/实践
12:17
宝玉@dotey
72
宝玉分享极客风 Skills 管理方式

为解决多 Agent 下 Skills 存放混乱问题,宝玉提出:Skills 只装在项目内以节省 LLM 上下文窗口;所有原件统一存放于 ~/GitHub,每个项目通过软链接指向原件,再为 Claude Code 创建 .claude/skills → .agents/skills 入口。更新只需拉取一次源码,所有项目自动同步;修复 bug 可直接反哺开源项目。用户可用自然语言让 Agent 自动创建软链接,无需记忆命令。

LinearUncle: 我快疯了。日常同时用 4个 coding agent,skills 各写各的: /.agents/skills、/.codex/skills、~/.claude/skills 已经一团浆糊,CC 里找不到 Codex 的 skill,反过来...

智能体Anthropic教程/实践编码
‹ 上一页
1…1920212223…50
下一页 ›