6月26日

23:22

Berryxia.AI@berryxia

开源工具Memanto为Claude Code、Cursor、Codex、LangGraph、CrewAI等主流AI coding agent提供“无限记忆”能力。它自动保存每次完整工作会话，通过AI压缩和组织，在下一次会话时90ms内检索到相关上下文，解决agent每次新开会话失忆、需重新解释项目背景的问题。实现无需传统向量数据库，安装仅需pip install memanto。该项目已在GitHub获1k+ stars，免费开源。

Jokker: ACABAN DE DARLE MEMORIA INFINITA A CLAUDE, CODEX Y CURSOR 100% GRATIS y open source Se llama Memanto y ya tiene +1k estr...

智能体产品更新开源生态

23:05

Chubby♨️@kimmonismus

美国商务部要求对Anthropic模型实施全球许可证管制，导致Fable 5下线

美国商务部致函Anthropic，要求对Fable 5与Mythos 5的“出口、再出口或国内转让”实施全球许可证管制，对象涵盖所有外国人士。基于冷战时期“视为出口”条款，外国人在美境内访问受控技术也被视为向国籍国出口。因Anthropic无法通过API实时区分用户国籍，唯一合规方案是向所有用户关闭模型。推主质疑美国政府短视，目前正与Anthropic寻求兼顾国家安全与可用的解决方案。引用认为，能力封锁将使开源模型更具吸引力，尤其利好中国开源，OpenAI与Anthropic将因此受损。

Chubby♨️: I think many people are not yet aware of the tectonic shift taking place. By preventing state-of-the-art capabilities - ...

Anthropic 开源生态现象/趋势

23:02

Hacker News 热门（buzzing.cc 中文翻译）

安全事件 CVE-2026-LGTM

恶意包 foxhole-lz4（伪装成 vulpine-lz4 的社区维护分支）发布到 creats.io 注册表后，连续通过 OpenClaw-4.2、ThreatNuzzle、SentinelMind 等七道 AI 安全门，每道门均因不同原因未能阻止。SentinelMind 正确识别 build.rs 中的凭证窃取代码，但仓库 AI 分类助手（同样基于 OpenClaw-4.2）将其误判为误报并关闭。该包作为传递依赖进入 snekpack 4.x，凭证窃取大规模展开。事件持续 96 小时（计费 2.1 万亿 token），最终因攻击者的自主 agent 读取不应读取的文件而解决。CVE-2026-54321 被发布后又被撤回。

智能体安全/对齐开源生态

22:35

Chubby♨️@kimmonismus

许多人尚未意识到一场格局性转变

Kim 指出，美国政府限制前沿AI能力（阻止SOTA被使用），反而让开源模型更吸引自有应用和整体市场，欧盟等国家也可受益。这吸引新投资与理想主义人才，OpenAI 和 Anthropic 将最受监管反噬，间接助推开源（尤其来自中国）。引用称，Anthropic 4月预览 Mythos 后，DeepSeek 因无法竞争而融资74亿美元；此前该实验室靠 CEO 梁文锋个人财富，现有约300人，计划至少翻倍。

Chubby♨️: Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...

Anthropic DeepSeek 开源生态现象/趋势

22:20

Berryxia.AI@berryxia

PP-OCRv6发布端到端部署基准：A100仅0.13秒/图，CPU提速5.2倍

PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图；Intel CPU上用OpenVINO，PP-OCRv6_medium比PP-OCRv5_server快5.2倍，PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍；Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸，Medium/Small均支持50种语言，PP-OCRv6_medium英文准确率88.4%，拉丁字母准确率88.0%。官方总结认为，在专用OCR任务上，轻量架构+高质量训练数据比单纯堆参数更实用，是对大模型“暴力scaling”路线的反向验证。

PaddlePaddle: 🧵PP-OCRv6 Tech Deep Dive Ep.4:3.9x Faster on CPU, 0.13s per Image on A100 - PP-OCRv6 Deployment & Model Selection Guide...

GitHub 开源生态模型发布部署/工程

22:14

OpenBMB@OpenBMB

面壁智能与清华THUNLP发现混合LLM长上下文瓶颈在于全注意力检索能力

清华自然语言处理实验室（THUNLP）与面壁智能OpenBMB发布论文，重新审视混合LLM架构中高效注意力（如SWA、Mamba-2、GDN）的实际作用。研究发现：高效注意力设计对短上下文Loss影响极小，但长上下文LongPPL差异显著；全注意力承担检索功能，限制其感受野会大幅提升LongPPL，而限制高效注意力几乎无影响。大窗口SWA导致模型懒惰，延迟检索能力形成。简单方法——对小窗口SWA混合架构的全注意力层仅用NoPE（SWA-128-NoPE），即可用极小短上下文代价显著提升长上下文性能。论文认为瓶颈在于全注意力的检索能力能否被有效激活。

arXiv 开源生态推理论文/研究

21:16

AYi@AYi_AInotes

GPT-5.6跳票：美国商务部警告无跨机构审批不得发布，Anthropic Mythos上周也被卡

美国商务部长Lutnick亲自致电Altman，警告没有跨机构审批不能发布GPT-5.6。此前Anthropic的Mythos也被同样方式卡住，紧急限制发布。Altman内部memo称政府将“customer by customer”审批访问，涉及商务部、国家网络总监办公室、科技政策办公室。此举基于国家安全例外和出口管制行政权力，建立对前沿模型的事前审查机制。预示GPT-6等后续模型都可能需走此流程，标志AI从商业技术转变为战略资源。

AYi: http://x.com/i/article/2069352641423896576

OpenAI 开源生态政策/监管