Qwen团队推出开源稀疏自编码器套件Qwen-Scope,将SAE特征转化为实用工具。该套件支持四大应用方向:无需提示工程即可通过直接操控内部特征引导模型输出;用极少样本对目标数据进行分类与合成,提升长尾能力;追踪代码切换和重复生成问题的根源并进行修复;通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制,并开发出超越现有研究范围的应用。相关资源已开放。
Qwen团队推出开源稀疏自编码器套件Qwen-Scope,将SAE特征转化为实用工具。该套件支持四大应用方向:无需提示工程即可通过直接操控内部特征引导模型输出;用极少样本对目标数据进行分类与合成,提升长尾能力;追踪代码切换和重复生成问题的根源并进行修复;通过分析特征激活模式优化评测基准并减少冗余。团队希望社区利用Qwen-Scope深入探索Qwen模型内部机制,并开发出超越现有研究范围的应用。相关资源已开放。
Vera 是一种新型编程语言,专为机器自动编写代码而设计,旨在推动编程自动化。该语言已在 GitHub 平台开源发布,项目地址为 github.com/aallan/vera。自亮相以来,在技术社区 Hacker News 上引发热议,相关帖子获得了 100 点的热度指标,显示出业界对其创新潜力的广泛关注。
腾讯发布开源混合专家模型Hy3-preview,总参数量2950亿,激活参数量210亿。其在Artificial Analysis综合智能指数上得分42,落后于近期开源的GLM-5.1、DeepSeek V4 Flash及Qwen3.6 27B等推理模型。具体评测表现不均衡:在真实世界任务基准GDPval-AA上落后于主要竞品,但在研究级物理评测CritPt上与高分模型GLM-5.1持平;其相对弱项在于AA-Omniscience指数,幻觉率较高。模型采用Tencent HY社区许可协议,商业使用受限,已在Hugging Face和SiliconFlowAI平台提供。
开源一个教程Skill 打磨了十几版,效果还不错,已推到GitHub 如果想在五一假期高质量充电,或随时给自己生成一份定制高质量教程 欢迎下载 基本逻辑: 1、输入任意主题及参考资料,AI会优先以参考资料为核心,然后根据需要进行高质量素材和...
初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布,其全部代码完全由AI生成。开发者仅用25天,借助Opus和GPT等大模型独立完成。该项目基于C/C++源码,需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发,并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。
开源法律人工智能项目“迈克”正式发布。该项目旨在提供免费、可访问的法律AI工具,其核心变化在于将原本可能收费或封闭的法律AI技术开源化,允许开发者自由使用、修改和分发。项目网站mikeoss.com已上线,相关讨论在Hacker News上获得了超过100个社区积分。
太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。
阿里千问开源可解释性模块 Qwen-Scope,该模块基于 Qwen3 和 Qwen3.5 系列模型训练,通过稀疏自编码器提取可解释特征以分析大模型内在机制。开源权重覆盖 7 个大模型,包含 14 组稀疏自编码器,训练数据规模达 0.5B 词元。Qwen-Scope 能实现推理结果的定向控制、数据分类与合成、模型训练优化及评估冗余分析,在数据合成中使训练能效比提升约 15 倍。
一项名为“对齐打地鼠”的研究发现,微调大型语言模型会激活其对受版权保护书籍的检索能力,这揭示了AI对齐过程中的新风险:模型在优化后可能无意中回忆版权内容。该研究通过代码分析证实了这一现象,相关开源代码已发布在GitHub。此话题在科技社区引发关注,在Hacker News上获得103点积分,凸显了版权与AI发展之间的潜在冲突。
ClawGym是一个可扩展框架,旨在解决Claw式环境中缺乏系统化开发框架的瓶颈,支持个人智能体开发的全生命周期。其核心包括:ClawGym-SynData数据集,通过角色驱动意图与技能基础操作合成1.35万个筛选任务,配备模拟工作空间和混合验证机制;ClawGym-Agents模型系列,基于黑盒轨迹监督微调训练,并探索在并行化任务沙箱中的轻量级强化学习流程;以及ClawGym-Bench评估基准,包含200个经过自动过滤与人工-LLM双重校准的测试实例。相关资源即将在GitHub开源发布。
开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。
The Codex App Server is massively underrated. You can inject Codex-level intelligence into any platform using your ChatG...
LLM Python库和CLI工具发布0.32a0 alpha版本,进行了两项核心架构升级。首先,模型输入现支持表示为消息序列,能直接处理包含多轮对话历史的完整上下文,解决了此前难以载入已有对话的局限。其次,模型响应升级为支持由不同类型部分组成的流式输出,以更好地适配现代前沿模型处理多样化输入(如图像、音频)和输出(如结构化JSON、工具调用)的能力。此次重构旨在让该库的抽象层跟上LLM技术自2023年以来的快速演进。
Today, Ling-2.6-1T is officially open-sourced (from @AntLingAGI) 1T total parameters · 63B active parameters Built for r...
Ling-2.6-1T just dropped by @AntLingAGI , one day after Ling 2.6 Flash. Both optimized for the same goal: usable intelli...
当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。
AntLingAGI正式开源其万亿参数旗舰模型Ling-2.6-1T。该模型采用总参数1万亿、激活参数630亿的架构,核心设计理念是“令牌高效”,旨在以极低的令牌开销实现顶尖智能。它通过“快速思考”机制优化,具备可靠的多步骤执行能力,在指令遵循、工具使用和上下文控制方面表现优异。模型为实际生产需求优化,部署便捷,兼容广泛的智能体框架,适用于从代码生成到错误修复等多种任务。
🚀 Today, we are launching Ling-2.6-1T, a trillion-parameter flagship model designed for precise instruct task execution...
FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。
FlashQLA是基于TileLang开发的高性能线性注意力内核,专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构,以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率,在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时,其将GDN流程拆分为两个内核的策略会带来额外内存开销,但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线,实现了超过2倍的内核级加速。
poolside公司发布了Laguna系列模型,包括其首个开源模型XS.2。该模型为33B总参数/3B激活参数的MoE架构,专为智能体编码和长程任务设计,完全内部训练,支持单GPU运行,并采用Apache 2.0许可。同时,推文作者高度赞赏poolside官网的设计风格,并利用其开源的“Brand to DESIGN.md Skill”工具,将网站设计提炼为DESIGN.md文档,进而复刻出设计Demo。相关设计文件与模型资源均已开源,供社区参考使用。
Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...
一款名为“提示词优化大师”的纯文本Skill获得了超过6000个Star。其核心价值在于针对不同的具体使用场景和工具,提供差异化的优化提示词。例如,在代码生成场景中,会根据用户是使用Claude Code还是Cursor来调整提示词;在图像生成场景中,则会区分Midjourney等不同工具来提供相应的提示词。该Skill的设计思路类似于精心编写的“元Prompt”,旨在提升用户与各类AI模型交互的效率和效果。
开源项目Auto-Architecture实现了针对CPU优化的Karpathy's Loop算法,该算法原由AI研究员安德烈·卡帕西提出,常用于神经网络训练与推理的优化循环。项目将这一循环方法专门适配于CPU架构,旨在提升计算效率与资源利用率。该项目已在GitHub开源,并在Hacker News上获得103个点赞,展示了社区对其技术思路的关注。
开源项目jcode通过替换Claude的默认调用框架,实现内存占用减少20倍、启动速度加快245倍的惊人提升,并支持AI代理自我迭代的“Self-Dev”模式。同时,蚂蚁发布的Ling-2.6-1T模型以“token效率”为核心,能将成本降至可比模型的四分之一,综合智能接近GPT-5.4非推理水平。这两者共同揭示AI行业竞争重点正从参数规模转向真实生产环境下的成本与效率。
说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...
Warp宣布开源后,其GitHub仓库在一天内获得超过3万星标,热度极高。此举被视为开创了“AI原生的开源协作范式”,其核心在于引入AI代理(如Oz代理)自动执行编码、测试、代码审查和技术文档生成等任务。这预示着未来开发者的角色将转向提出创意、把控质量和决策方向。此举与Cal.com因AI风险而闭源的做法形成鲜明对比,Warp通过AI技术将开源协作的优势极大化。用户现可在线实时观察数百个AI代理协同处理代码、修复漏洞的进程,这可能是未来十年软件开发模式的一次重要预演。
Warp is now open-source.
Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。
本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案,用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明,Sigmoid注意力能提升25%的细胞类型分离度,改善细胞类型内聚性,并降低验证损失,同时训练速度提升高达10%。理论分析揭示,Sigmoid具有全局有界导数和对角雅可比结构,这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中,训练1.6亿参数模型时,Softmax出现梯度爆炸,而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid,在H100上实现515 TFLOPS,性能超越现有方案,并原生支持生物序列所需的填充处理。
Warp is now open-source.
SKILL.md文件将调用接口、执行流程和工具副作用混合在自然语言中,导致技能发现和风险评估脆弱。新研究提出SSL三层类型化JSON表示:调度层处理调用信号,结构层管理执行场景,逻辑层定义原子动作和资源使用,基于Schank和Abelson的脚本理论。通过LLM规范化器转换现有文件,技能发现MRR从0.573提升至0.707,风险评估宏观F1从0.744提升至0.787。研究发布了6,184技能语料库、403任务查询和500风险标记技能,强调随着技能注册表扩展,需结构化表示以提升管理效率。
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。
Warp is now open-source.
Ling-2.6-flash is now officially open-sourced 🚀 (from @AntLingAGI) Was "Elephant Alpha" on OpenRouter. Now fully open f...
作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。
正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...
灵码2.6-flash模型现已开源,这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿,激活参数量为74亿,并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括:生成速度高达每秒215个token,在完整评估中仅消耗1500万token,效率突出;在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲;同时,其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。
微软开源了前沿语音人工智能项目VibeVoice,该项目已在GitHub上发布。VibeVoice能够生成高度自然、富有表现力的语音,支持多种语言和情感语调,显著提升了合成语音的真实感与感染力。其开源策略旨在推动语音AI领域的协作与创新,降低开发门槛。该项目在技术社区获得关注,在Hacker News上获得了103个投票点数。