Steve Yegge 宣布 Gas Town 项目正式发布 v1.0 版本,标志着该软件从早期被戏称为"小丑秀"的混乱开发阶段进入稳定正式版。文章回顾了项目迭代过程中的关键转折与改进,该发布在 Hacker News 获得 101 点关注热度。
Steve Yegge 宣布 Gas Town 项目正式发布 v1.0 版本,标志着该软件从早期被戏称为"小丑秀"的混乱开发阶段进入稳定正式版。文章回顾了项目迭代过程中的关键转折与改进,该发布在 Hacker News 获得 101 点关注热度。
小红书开源发布Relax,一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。
LangAlpha是一款专为华尔街金融场景打造的AI编程助手,定位为面向交易与金融分析优化的Claude Code替代品。该项目已开源并托管于GitHub仓库ginlix-ai/langalpha,在Hacker News发布当日获得102个赞。工具针对金融行业复杂的数据处理、量化分析和交易执行需求进行了专门适配,旨在为金融从业者提供更精准的代码生成与数据分析能力。
"They See Your Photos"(theyseeyourphotos.com)项目揭示用户上传照片可能面临的隐私泄露风险,通过直观演示展示图像元数据及内容如何被第三方获取与分析。该网站在 Hacker News 平台获得 104 点热度关注,以可视化方式警示公众关于数字影像在未经授权情况下被访问与识别的安全隐患。
开发者仅用3周时间,借助Claude和Codex开发了一款社交媒体管理工具,并在GitHub开源。该项目在Hacker News发布后立即获得102个点赞,展示了AI辅助编程在快速构建产品原型方面的高效性。项目代码已托管于brightbeanxyz/brightbean-studio仓库,为开发者提供了可参考的AI协作开发实践案例。
Claudraband 是专为高级用户设计的 Claude Code 增强工具,针对专业开发者优化,已开源至 GitHub。
Claude Code Pro Max 5x 用户反馈,在 moderate usage(中等使用强度)下,流量配额仅 1.5 小时即耗尽。该问题已提交至 GitHub issue,引发对配额限制合理性的质疑。
Linux 内核官方文档新增 coding-assistants.rst,明确贡献者使用 AI 辅助工具时的披露义务与代码审查标准,要求声明 AI 生成内容并确保符合内核编码规范,为开源大型项目整合 LLM 提供首个官方指引框架。
LMSYS Org推出HiSparse分层内存系统,针对稀疏注意力仍受限于GPU内存容量的问题,将非活跃KV缓存卸载至主机内存,仅在GPU HBM保留热缓冲区,并通过专用CUDA内核高效管理数据交换(采用LRU策略与页表更新)。该系统在256并发请求下实现超3倍吞吐量提升,GLM-5.1-FP8模型长上下文场景性能提升达5倍,支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。
inclusionAI团队发布了TC-AE项目,旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛,促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架,强调协作与知识共享。此举预期将加速AI工具在多元领域的应用,并推动技术发展的透明性与包容性。
研究团队发布了TC-AE,一种用于深度压缩自动编码器的新方法,旨在突破现有模型的令牌容量限制。该方法通过创新的架构设计,显著提升了模型在压缩表示中保留信息的能力,实现了更高的压缩效率与重建质量。具体指标显示,TC-AE在多个基准测试中,相较于传统深度压缩自动编码器,将有效令牌容量提升了约30%,同时保持了较低的计算开销。这项工作为高密度数据压缩与表示学习提供了新的技术路径。
SuperLocalMemory V3.3("活脑")作为本地优先的Zero-LLM智能体记忆系统发布,实现完整认知记忆分类。核心创新包括:Fisher-Rao量化感知距离(FRQAD)以100%精度识别高保真嵌入;艾宾浩斯自适应遗忘曲线实现6.7倍区分力;7通道认知检索(语义、关键词、实体图、时间、扩散激活、巩固、Hopfield联想)在LoCoMo基准零LLM模式下达70.4%,多跳任务提升23.8个百分点。支持长时内隐记忆参数化与自动认知管道,纯CPU运行,月下载超5000次。
inclusionAI发布了cuLA项目,这是一套为线性注意力变体编写的CUDA内核。该内核完全采用NVIDIA的CuTe DSL和CUTLASS C++库进行开发,旨在高效实现Transformer模型中的线性注意力机制。此举专注于底层计算优化,通过利用先进的CUDA编程抽象和高效模板库,有望提升大语言模型在推理和训练过程中的计算性能与效率。
Hugging Face 正式发布 TRL v1.0,这是一个专为大语言模型后训练设计的开源库。该版本整合了 SFT、RLHF 等多种高效微调技术,提供从监督微调到人类反馈强化学习的完整工具链。新库支持与 Transformers、PEFT 等主流框架无缝集成,显著简化了模型对齐流程。此次更新旨在降低大语言模型微调门槛,推动AI技术民主化,使开发者能够更便捷地提升模型在对话、安全等方面的性能表现。
第20期开源成果更新引入多个新组织与全新模型类型,收录 NVIDIA Nemotron Super、Sarvam 及 Cohere Transcribe 等最新模型。此次扩展显著丰富了开源生态的模型种类与来源多样性,覆盖更多技术领域与应用场景,为开发者提供更广泛的模型选择。
Lightfeed Extractor 发布基于 TypeScript 的 LLM 网页数据提取库,支持通过自然语言提示和 Zod schema 从 HTML、Markdown 或纯文本中提取结构化数据。核心功能包括 HTML 转 Markdown 预处理、JSON 模式输出、失败 JSON 自动修复及 token 追踪。可与 Playwright 集成加载动态页面,或配合 browser-agent 实现自然语言导航后提取,适用于电商竞品监控等生产级场景。
Mooncake团队与Volcano Engine在SGLang框架中推出Elastic EP功能,解决大规模DeepSeek MoE模型"宽"专家并行部署的可靠性瓶颈。该技术通过解耦专家与GPU的刚性绑定并维护冗余副本,可在32 GPU集群中容忍最多16个rank故障,将服务恢复时间从2-3分钟缩短至10秒以内,降幅达90%。基准测试显示,该方案在实现极端韧性的同时,吞吐量、TTFT和TPOT等关键指标与标准DeepEP持平,实现零静态性能损耗。
SGLang亮相Jensen Huang主题演讲AI生态图谱,三天内密集举办五场活动。团队与RadixArk合办200人技术聚会,在LinkedIn总部举办搜索与推荐LLM系统研讨,并参与700人规模的Novita行业论坛。官方培训实验室发布Miles RL框架,解决生产环境训练-推理不匹配难题;LinkedIn工程师分享预填充优化方案,在H100上实现2–3倍吞吐量提升并回馈上游。
ServiceNow AI团队在Hugging Face上发布了语音智能体评估框架EVA。该框架通过标准化测试集与多模态指标,系统评估语音助手在对话理解、任务完成及交互自然度等方面的性能,旨在量化衡量智能体在复杂真实场景下的表现,助力研究人员客观比较不同模型,推动技术优化。
OpenSage是新一代Agent开发工具包,推动智能体开发从人工设计转向AI自主编程范式。该系统支持LLM自动构建智能体拓扑、动态编写管理工具(具备沙箱隔离与异步执行),以及维护分层图结构记忆系统。与现有方案需人工设计不同,OpenSage实现了拓扑、工具和记忆的全面AI自动化生成,并内置软件工程与安全工具套件。
本周MiniMax Skills社区上线,精选上百种覆盖开发、学习、办公及内容创作的Skill,包括基于M2.7模型创建的PPT制作、PDF编辑等Skill已开源,用户可在MaxClaw或MiniMax Agent中一键添加。MaxClaw新增支持同时部署多个Claw,可自定义命名与设定,支持工作流拆分和多角色协作。通过MiniMax Agent桌面端部署本地OpenClaw时,预置多款安全诊断Skill以降低高危操作风险,并能自主诊断修复。MaxClaw沙箱升级,新环境支持root权限,用户可自由安装依赖库与浏览器,OpenClaw框架也可自行升级。
开源RL框架Miles正式支持ROCm,可在AMD Instinct MI300/350 GPU上原生运行大规模语言模型后训练。该框架采用解耦架构分离rollout生成与模型优化,针对RL工作负载中占比70-90%的推理场景优化。在单节点8卡MI300X上训练Qwen3-30B-A3B的实测显示,rollout吞吐达1.1k-1.3k tok/GPU/s,AIME准确率从66.5%提升至72.9%。现提供预构建容器,支持GRPO、Megatron-LM和FSDP后端。
Kimi支持的个人开发者开源项目OneClaw下载量突破10万,提供一键安装包,1分钟即可在本地部署原版OpenClaw,无需命令行或环境配置。功能包括纯净卸载、自由切换模型、远程控制,支持连接飞书、企微、钉钉、QQ、Kimi Claw;内置2万+技能的技能商店,可无损迁移记忆和Skills。Kimi提供包月方案和API按需购买。使用地址:oneclaw.cn。
YC 孵化的 Compresr 发布 Context Gateway,在 AI Agent 与 LLM 间自动压缩过长对话历史。后台预计算实现即时压缩,支持 Claude Code、Cursor 等,默认 75% 上下文阈值触发。curl 一键安装,TUI 向导配置。
Hugging Face 发布了 LeRobot v0.5.0 版本。该版本在数据集、模型、任务和社区四个维度上进行了全面扩展。具体包括:引入了新的现实世界和模拟数据集,推出了支持多任务学习的模型,并扩展了任务范围至移动操作和双臂协调。社区方面,提供了更易用的库、演示应用和教学资源。此次更新的核心目标是降低机器人技术的应用门槛,推动其民主化发展。
SpeciesNet 是开源 AI 模型,旨在帮助全球各地的人们保护和保存野生动物。该模型为野生动物保护提供技术支持,助力生物多样性保护事业。
inclusionAI 团队发布了 AReaL-tau2-merge-sft-235B 模型。该模型参数量达2350亿,采用合并与监督微调技术构建。其目标是推动人工智能技术发展并通过开源开放模式实现AI民主化,致力于让先进AI技术更广泛可及。
inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念,旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式,这是一种高效且通用的模型文件格式,便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛,促进更广泛的研究与应用开发。
inclusionAI推出开源模型ZwZ-2B-GGUF,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛,促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径,强调技术普及与包容性发展。
inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及,使其更易于获取和应用。
inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型,这是一个拥有300亿参数、专门针对电信领域进行监督微调(SFT)的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化,以提升在该垂直领域的专业性能和应用效果。
inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型,参数量达 300 亿,采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及,旨在降低技术使用门槛,促进AI在零售领域的专业化应用与创新。
inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化,其具体训练数据与性能指标尚未在本次公告中详细披露。
inclusionAI 发布了 ZwZ-2B 模型,这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K,并在多项基准测试中性能显著提升,特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。
阶跃星辰将 Step 3.5 Flash 的预训练、中训练和训练框架全部开源,支持开发者进行更深度模型定制,以打造专属 AI 智能体。
FireRed-OCR 开源发布,为端到端方案新SOTA,小红书提出低成本文档识别训练范式,无缝兼容Qwen系列加速方案,是开箱即用的工业级OCR结构化专家。
inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛,促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数,体现了其在处理复杂任务方面的潜力,同时强调开放协作对加速AI创新与社会普惠的关键作用。