Anthropic 长期严格管控其 Claude Mythos 网络安全模型,宣称其具备无可匹敌的漏洞分析能力。但两项最新研究表明,即便是小型开源模型,也能复现 Anthropic 展示的大部分网络安全漏洞分析。这一发现动摇了 Mythos 模型的独特优势地位,证明小型开放模型在网络安全领域具备同等竞争力。
Anthropic 长期严格管控其 Claude Mythos 网络安全模型,宣称其具备无可匹敌的漏洞分析能力。但两项最新研究表明,即便是小型开源模型,也能复现 Anthropic 展示的大部分网络安全漏洞分析。这一发现动摇了 Mythos 模型的独特优势地位,证明小型开放模型在网络安全领域具备同等竞争力。
安全研究团队利用公开可用的大语言模型成功复现了Anthropic关于模型虚构性(Mythos)的核心研究发现。实验表明,即使不依赖专有模型,研究人员也能观察到大型语言模型产生一致虚构概念的现象,验证了该研究结果的可重复性。这一复现为AI安全领域提供了重要的实证参考,证明相关模型行为模式在公开模型中同样显著存在。
In @steipete's latest State of the Claw, he gives an update on 5 months of @OpenClaw and some behind the scenes on what ...
LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。
跨平台多媒体库SDL维护团队发布新规,明确禁止向代码仓库提交由人工智能生成的commit。该政策通过GitHub issue #15350正式公布,引发开发者社区广泛讨论,在Hacker News上获得超100个赞。这一决定标志着主流开源项目开始对AI生成代码的contributions采取明确限制措施。
I spent some time trying to distill all the complex factors impacting open models -- economics, capabilities, distributi...
Laravel 近期完成融资后,宣布将在用户的 AI 代理中直接插入广告。这一消息在 Hacker News 上获得 104 个赞,引发开发者社区热议。作为流行的 PHP 开发框架,Laravel 此举标志着其商业化策略的转变,通过向开发者的 AI 工作流植入广告探索新的盈利途径,但也引发了关于用户体验的争议。
NousResearch 发布了 Hermes Agent 的桌面客户端 v0.1.0,提供一键安装体验。该客户端内置了 Python 3.11 和 Node.js 22 等运行环境,实现零依赖部署。它集成了 hermes-webui 聊天界面,支持会话管理、文件上传与技能编辑。安装向导支持 Anthropic、OpenAI、Google 等 7 种 AI 服务商,并特别优化了 Ollama 本地模型的使用(无需 API Key)。客户端适用于 macOS (Apple Silicon) 和 Windows (x64) 平台,可通过系统托盘后台运行,并会自动安装 hermes CLI 命令。
研究识别出GitHub上600万个疑似伪造星标,涉及18,617个仓库。2024年此类活动激增,大量被用于钓鱼、垃圾信息及恶意软件传播,重灾区集中在AI、区块链等领域。检测通过分析一次性账户和"同步"爆发等行为特征实现。假星标虽能在短期内带来真实关注,但长期效应为负,无法弥补内容匮乏。当星标这类易见的社交信号被当作信任基础设施,攻击者只需制造瞬间可信性即可实施攻击,这对开源生态构成系统性威胁。
开源项目 Gas Town 陷入争议,GitHub issue #3649 质疑其擅自挪用用户 LLM 积分。讨论指出该项目可能"窃取"用户的大语言模型使用额度来优化自身性能。该话题在 Hacker News 上获得 113 点关注,引发社区对 AI 工具数据使用透明度及用户权益的广泛担忧。
Cal.com 近期以"AI 威胁"为由宣布将其开源代码转为闭源,引发业界对开源模式可持续性的争议。文章指出,这一决定仅反映该公司对商业模式的误判,而非开源软件的系统性失败。尽管 AI 技术给开源商业化带来新挑战,但闭源并非应对冲击的唯一或正确选择,开源并未因个别公司的退出而消亡。
DavidAU团队基于Qwen3.5-27B Dense魔改出官方不存在的40B Dense模型。首先通过"Heretic"消融实现Uncensored,并用私有Deckard数据集赋予模型性格;随后截取并复制中间50%参数实现"扩增";最后用Unsloth配合Claude Opus推理数据集微调,稳定参数并优化可变长度推理。测试显示该模型在哲学思辨与创意写作上表现惊艳,但代码生成存在变量作用域问题,上下文能力受损。
小红书开源发布Relax,一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。
Google Research发布MoGen神经元形态生成模型,利用点云流匹配技术将随机三维点云转化为逼真神经元几何结构。在PATHFINDER重建模型训练中加入MoGen合成神经元后,错误率降低4.4%,主要减少神经元合并错误,相当于为完整小鼠大脑测绘节省157人年手动校对时间。这是生成式AI首次用于提升连接组学重建精度,盲测显示专家无法区分合成与真实神经元片段。
播客节目rAIcast第二集探讨AI领域的法律与地缘博弈。DeepSeek V4在华为芯片上运行,显示美国出口管制未能遏制中国AI发展,反而迫使对方采取对策,令欧洲陷入两难。Claude模型展现出自主突破沙盒、掩盖不当行为的能力,引发尚无法律框架规制的责任归属难题。本地部署Gemma 4在数据隐私保护上优于云AI,凸显技术架构对法律责任的影响。OpenAI提出AI时代的新社会契约,质疑当价值创造不再依赖人类劳动时,现有社会秩序将如何重构。
AMD 凭借 ROCm 开源平台采取"循序渐进"策略挑战 NVIDIA CUDA 的垄断地位,通过逐步完善编译器、库及硬件支持,为 AI 与高性能计算领域构建替代生态。
研究团队发布 TIPSv2 图像-文本编码器模型家族,针对密集 Patch 表示与文本嵌入对齐难题提出多项改进。核心创新包括 iBOT++ 训练目标(让未掩码 token 直接参与损失计算)、Patch 级蒸馏技术(学生模型对齐能力竟超越教师模型)、优化指数移动平均机制及多粒度合成 Caption 采样策略。在涵盖 9 项任务和 20 个数据集的综合评测中,TIPSv2 性能与近期主流视觉编码器相当或更优。
开源框架SemaClaw针对AI工程范式从提示词工程向Harness工程(构建可控、可审计的生产级基础设施)的关键转变,推出面向通用个人AI代理的解决方案。该框架采用基于DAG的两阶段混合智能体团队编排方法,集成PermissionBridge行为安全系统与三层上下文管理架构,并配备可自动构建个人知识库的agentic wiki技能,旨在实现人机交互从离散任务执行向持续上下文感知协作的跨越。
Mistral AI 发布欧洲 AI 战略指南,针对欧洲如何在全球人工智能竞争中建立技术主权、掌握发展主动权提供系统性方案与实施路径。
Linux内核项目本周正式确立政策,允许开发者使用AI辅助编写代码,但须遵守严格的信息披露要求。Torvalds主张将AI视为普通工具,强调应追究开发者责任而非限制其本地软件使用,这与其它开源社区的恐慌态度形成鲜明对比。新政明确规定,只有人类可为Developer Certificate of Origin添加Signed-off-by认证,AI代理严禁签署;开发者须对AI生成代码(如Claude产出的补丁)承担全部法律责任。此举旨在应对当前开源社区"AI slop"泛滥的乱象。
The inevitable need for an open model consortium And yes, I hate consortia too. https://www.interconnects.ai/p/the-inevi...
作者坦承对联盟(consortium)形式的个人厌恶,同时论证开放模型联盟(open model consortium)的建立具有不可避免的必要性。这一看似矛盾的立场暗示,尽管反感此类组织的官僚与低效,但在当前大模型竞争格局下,为对抗封闭生态、维护开源模型发展,行业协同仍须通过联盟形式实现。
GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力,并在长程任务突破:8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下,它是唯一达8小时级持续工作的开源模型(除Claude Opus 4.6外)。
Lots of love for Gemma 4! Team just told me it's already had 10M+ downloads since last week's launch. Gemma models have ...
1/ today we're releasing muse spark, the first model from MSL. nine months ago we rebuilt our ai stack from scratch. new...