10:37

karminski-牙医@karminski3

FlashMemory：将DeepSeek-V4上下文显存压缩至1.3GB并提升准确率

DeepSeek-V4支持1M上下文，显存约10GB（对比DeepSeek-V3.2约84GB）。FlashMemory论文进一步将显存压至1.3GB，并在LongBench-v2等长文本评测上准确率平均提升0.6%。核心是神经内存索引器（小模型），通过预测所需历史片段按需加载，实现注意力降噪。训练采用解耦双编码器架构，无需加载DeepSeek-V4基座模型，训练成本大幅下降。论文：arxiv.org/abs/2606.09079；项目：github.com/libertywing/FlashMemory-Deepseek-V4。

DeepSeek 推理教程/实践部署/工程

10:29

歸藏(guizang.ai)@op7418

万字长文复盘爆款 Skills：Agent 不是聊天框，Skill 是关键中间层

@op7418 万字长文复盘爆款 Skills 经验，核心观点：Agent 不是聊天框，会放大能力差距；Skill 是普通用户用好 Agent 的关键中间层。好 Skill 需设计、维护与分发；生态不能只做仓库列表，需要内容、产品、案例、反馈形成迭代飞轮。基于真实案例。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体 MCP/工具大佬观点

10:24

宝玉@dotey

宝玉（@dotey）将钓鱼的闲适与 AI Agent 使用体验结合，创作打油诗：钓鱼时"鱼咬不咬随它去"，对应使用 Agent 时"跑完没跑不必盯，起身续水伸个腰"。引用 @yihong0618 的朋友圈钓鱼签名作为灵感来源，比喻 Agent 运行如同钓鱼，无需时刻紧盯，可放轻松等待结果。

yihong0618: 朋友圈一个钓鱼的大哥的微信签名: 一竿一线一山水,一漂一钩一逍遥。

其他大佬观点

10:11

Berryxia.AI@berryxia

AI Agent 放大能力差距，而非抹平差异

Berry Xia 赞同观点：Agent 不会缩小用户能力差距，反而会放大差距。头部用户已搭建文档、规则、memory、MCP、CLI、工具调用、权限、安全沙箱等系统，普通用户仍停留在聊天框。目标清晰、品味强的人被 Agent 放大优势；目标混乱、缺乏文档的人被放大混乱。作者认为 AI 时代并非完全平权，善于使用 AI 工具的能力可被放大数万倍，原本几倍的差距现在可能扩大到数百倍。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体现象/趋势

10:00

Ethan Mollick@emollick

有趣的是，我现在关于冷门科幻作家、现代主义诗人或包豪斯建筑的帖子收到的评论比以前更有见地，但这完全归功于AI垃圾账户。很快，广泛的文化兴趣会成为AI写作的标志吗？

大佬观点现象/趋势

09:59

向阳乔木@vista8

最近发现不敢给周围非 X 和 AI圈的人演示AI做的东西和实现过程了，会引发深深的焦虑… 他们会觉得AI过于强大，自己严重落伍，想学又不知道从哪里入手。

大佬观点现象/趋势

09:34

IT之家（RSS）

钉钉换帅后《置身钉内》作者再发文：无效的形式化工时既消耗人力，也与技术发展的初衷相悖

钉钉ONE项目产品经理在7.5万字离职信《置身钉内》引发争议后再次发文回应。她指出AI开发存在不限于钉钉的共同困境——新老交替、产品形态探索期，但许多探索经验可帮助节约成本。AGI的本质一是放大文明能力解决现有难题，二是把人从机械重复工作中解放出来，让时间留给创意与情感。她认为长期来看重复工作将减少，创意工作不拼工时，无效的形式化工时既消耗人力，也与技术发展的初衷相悖。

现象/趋势部署/工程

09:30

Ethan Mollick@emollick

由于我最近迷上了AI与诗歌，来看看Fable如何将《杜伊诺哀歌》做成游戏--"把握情绪"。它制作了一个漂亮的小型艺术游戏，包括翻译里尔克（不过我也坚持加入了一些A. S. Kline优秀译作的片段）。https://duino-elegies.netlify.app/

图像生成大佬观点

09:30

Rohan Paul@rohanpaul_ai

单卡实测：DiffusionGemma 速度是 Gemma4 的 4 倍，但事实错误多 6 倍

atomic[.]chat 在单张 H100（FP8）上对比 DiffusionGemma 26B A4B 与 Gemma4 26B A4B 在事实性写作任务中的表现。DiffusionGemma 速度达 763 tok/s（3.7 秒），是 Gemma4（218 tok/s，15.1 秒）的 4 倍，但错误率显著更高。在 Steve Jobs 传记、Tetris 历史和 BeOS 故事三项任务中，Gemma4 答对 45 个事实、错 5 个；DiffusionGemma 仅对 33 个、错 28 个。主题越冷门错误越多：Jobs 4 错、Tetris 12 错、BeOS 12 错，例如将 Jobs 母亲写为 Clara Clley、为 Tetris 发明者虚构同事 Geri Gulovik、将 BeBox 价格误报为 $9,999（实价 $1,600）。原因在于 DiffusionGemma 一次生成 256 tokens 并多轮抛光，只追求文本流畅性而非事实准确性。Google 官方也建议在事实重要时使用常规 Gemma4。

atomic.chat: Diffusion Gemma is 4x faster, but makes 6x more mistakes! We benchmarked the new diffusion LLM against its autoregressiv...

Google 评测/基准

09:29

meng shao@shao__meng

Re-Ink：再保险合约智能提取与审核参考实现

Re-Ink 是 @LandingAI 金融 AI Hackathon 冠军项目，针对再保险承保中约 40% 时间消耗的行政文档录入痛点，构建端到端自动化方案。核心使用 LandingAI 的 Agentic Document Extraction (ADE) 实现 PDF/DOCX 条约的结构解析与上下文感知字段提取（合同标识、日期、金融条款、参与方等），无需正则或模板。关键设计为人机协同闭环：提取数据经人工审核后以单事务持久化，校验失败即回滚。Agent 层用两个 LangGraph Agent 封装入库前引导与审批后分析逻辑。Academy 调查显示手动提取错误率超 6%，运营预算约 14% 用于修复此类错误。

LandingAI: http://x.com/i/article/2065098287758348288

智能体教程/实践部署/工程