AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 471 条
全部一手资讯X论文
标签「开源/仓库」清除
5月6日周三
17:22Hugging Face:Blog(RSS)47Open ASR 排行榜引入私有数据集以对抗基准过度优化
08:27Simon Willison 博客42datasette-referrer-policy 0.1 发布
08:00HuggingFace Daily Papers(社区热门论文)53RaguTeam在SemEval-2026任务8中:基于评判者协调的LLM集成系统实现忠实多轮响应生成
5月5日周二
12:17HuggingFace Daily Papers(社区热门论文)75精选MolmoAct2:面向真实世界部署的动作推理模型
11:17HuggingFace Daily Papers(社区热门论文)69AcademiClaw:当学生为AI智能体设定挑战
02:16Simon Willison 博客38TRE Python 绑定--ReDoS 鲁棒性演示
5月4日周一
23:56Hacker News 热门(buzzing.cc 中文翻译)72精选Show HN: Ableton Live MCP
08:20Hacker News 热门(buzzing.cc 中文翻译)72精选DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环,价格仅为原价的 1/17
08:00HuggingFace Daily Papers(社区热门论文)61ARIS:通过对抗性多智能体协作实现自主研究
00:50Hacker News 热门(buzzing.cc 中文翻译)66Flue 是一个用于构建新一代代理的 TypeScript 框架
5月3日周日
23:50Hacker News 热门(buzzing.cc 中文翻译)67Show HN: 苹果的Sharp通过ONNX Runtime Web在浏览器中运行
17:49Hacker News 热门(buzzing.cc 中文翻译)65Specsmaxxing--关于克服AI心理障碍,以及我为何用YAML编写规格说明
15:51The Decoder:AI News(RSS)60小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus,实现数小时自主编程
13:49Hacker News 热门(buzzing.cc 中文翻译)43Kimi K2.6 刚刚在一场编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini
00:49Hacker News 热门(buzzing.cc 中文翻译)63开放式设计:将您的编程代理用作设计引擎
5月2日周六
19:09Hacker News:AI 热帖69Agent-desktop:面向AI代理的原生桌面自动化CLI工具
17:49Hacker News 热门(buzzing.cc 中文翻译)74精选DeepSeek V4--性能几乎达到前沿水平,价格却仅为其一小部分
09:18Hacker News 热门(buzzing.cc 中文翻译)60通晓一切
03:18Hacker News 热门(buzzing.cc 中文翻译)67面向大型语言模型的高级量化算法
5月1日周五
08:00HuggingFace Daily Papers(社区热门论文)51Code World Model 准备情况报告
4月30日周四
22:13Hacker News 热门(buzzing.cc 中文翻译)43Vera:一种专为机器编写而设计的编程语言
20:10IT之家(RSS)53完全由 AI 生成:《任天堂明星大乱斗》PC 移植版问世
19:11Hacker News 热门(buzzing.cc 中文翻译)60迈克:开源法律人工智能
18:10IT之家(RSS)61看穿大模型的"小心思":阿里千问开源可解释性模块 Qwen-Scope
15:40Hacker News 热门(buzzing.cc 中文翻译)55对齐"打地鼠"游戏:微调会触发大型语言模型对受版权保护书籍的检索
10:42HuggingFace Daily Papers(社区热门论文)55ClawGym:一个用于构建高效Claw智能体的可扩展框架
03:34Simon Willison 博客68LLM 0.32a0 发布重大向后兼容重构
4月29日周三
19:07公众号:通义实验室(千问)53FlashQLA:让 Qwen 的注意力层跑得更快
16:10Hacker News 热门(buzzing.cc 中文翻译)50Show HN: 汽车架构:卡帕西循环,聚焦于CPU
09:00公众号:蚂蚁百灵(Ling)57Ling-2.6-flash 正式开源
08:00HuggingFace Daily Papers(社区热门论文)50更优模型,更快训练:用于单细胞基础模型的Sigmoid注意力机制
4月28日周二
22:39Hacker News 热门(buzzing.cc 中文翻译)70精选Microsoft VibeVoice:开源前沿语音人工智能
17:51蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI发布Ling-2.6-flash-int4模型
12:33OpenAI:官网动态(RSS · 排除企业/客户案例)70精选一个用于编排的开源规范:Symphony
11:50蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-flash-fp8
11:27蚂蚁 inclusionAI:HuggingFace 新模型55精选inclusionAI/Ling-2.6-flash
10:47Simon Willison 博客65介绍 talkie:一个源自1930年的130亿参数复古语言模型
10:47Hacker News 热门(buzzing.cc 中文翻译)51Talkie:一款诞生于1930年的13B复古语言模型
07:46Simon Willison 博客64微软开源语音转文本模型VibeVoice简介与实测
4月25日周六
23:26Hacker News 热门(buzzing.cc 中文翻译)56开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月6日
17:22
Hugging Face:Blog(RSS)
47
Open ASR 排行榜引入私有数据集以对抗基准过度优化

Hugging Face 的 Open ASR Leaderboard 加入了来自 Appen Inc. 和 DataoceanAI 的高质量私有英语 ASR 数据集,涵盖多种口音及脚本式/会话式语音,总时长约 28.7 小时。数据集保持私有以降低 benchmaxxing(针对基准的过度优化)或测试集污染风险。默认平均 WER 仍基于公开数据集计算,用户可通过切换查看私有数据集影响。标准化采用基于 Whisper 的标准化器,UI 代码和评估脚本已开源。自 2023 年 9 月上线以来,该榜单访问量已超过 71 万次。

Hugging Face产品更新开源/仓库评测/基准
08:27
Simon Willison 博客
42
datasette-referrer-policy 0.1 发布

Datasette 新插件 datasette-referrer-policy 0.1 发布,旨在解决 global-power-plants 演示中 OpenStreetMap 地图瓦片无法显示的问题。问题由两个原因导致:一是站点此前添加的 CAPTCHA 错误拦截了地图插件发起的 .json 请求,该问题已修复;二是 OpenStreetMap 会屏蔽使用了 Referrer-Policy: no-referrer 头部的站点请求。此插件允许用户将 Datasette 默认的此头部策略更改为其他值,从而确保地图正常加载,同时不影响默认安全设置。插件的开发过程得到了 Codex 与 GPT-5.5 的辅助。

开源/仓库部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
53
RaguTeam在SemEval-2026任务8中:基于评判者协调的LLM集成系统实现忠实多轮响应生成

RaguTeam团队在SemEval-2026任务8的B任务(基于参考段落生成)中获胜。其方法采用一个包含七个大型语言模型的异构集成系统,结合两种提示变体,并由GPT-4o-mini作为评判者为每个实例选择最佳响应。该系统在26支队伍中排名第一,以0.7827的条件调和平均值显著优于最强基线模型。消融实验证明,模型家族、规模和提示策略的多样性对集成效果至关重要。团队还发布了领域适应的7B模型Meno-Lite-0.1,在成本与性能间取得了良好平衡,并对任务数据集的标注局限性及改进方向进行了分析。相关代码已开源。

开源/仓库论文/研究
5月5日
12:17
HuggingFace Daily Papers(社区热门论文)
精选75
MolmoAct2:面向真实世界部署的动作推理模型

MolmoAct2 是一个为实际部署设计的全开放动作推理模型,在五个方面取得进展。其核心是专为空间与具身推理训练的 VLM 骨干 MolmoER,基于 330 万样本语料库训练。团队发布了三个新数据集,包括迄今最大开放双手数据集 MolmoAct2-BimanualYAM(720 小时遥操作轨迹),并开源了动作分词器 OpenFAST。模型采用层间 KV 缓存条件化架构,嫁接连续动作专家,还引入自适应深度推理变体 MolmoThink,以极低延迟保持几何基础。在广泛实证研究中,MolmoAct2 在 7 个仿真与真实世界基准上超越 Pi-05 等基线,MolmoER 在 13 个具身推理基准上超过 GPT-5 和 Gemini Robotics ER-1.5。模型权重、训练代码与数据均已公开。

智能体具身智能多模态开源/仓库

推荐理由:开源具身动作推理模型首次全面超越 GPT-5 和 Gemini Robotics,还附赠最大的双手操作数据集和全套训练代码,做机器人的同学本周必读。
11:17
HuggingFace Daily Papers(社区热门论文)
69
AcademiClaw:当学生为AI智能体设定挑战

研究团队推出AcademiClaw双语基准测试集,包含80项源自大学生真实学术流程的复杂长周期任务,涵盖作业、研究、竞赛等。任务经专家从230份提交中筛选,覆盖超过25个专业领域,包括奥数、语言学、GPU密集型强化学习等,其中16项需CUDA GPU执行。每项任务在隔离Docker环境中运行,采用多维评分与独立安全审计进行评估。对六个前沿模型的测试显示,最佳通过率仅为55%,分析揭示了模型在不同领域的能力边界差异、行为策略分化及令牌消耗与输出质量脱节等问题。该基准开源以推动AI智能体更好地满足真实学术需求。

智能体开源/仓库论文/研究评测/基准
02:16
Simon Willison 博客
38
TRE Python 绑定--ReDoS 鲁棒性演示

作者受 antirez 将 TRE 正则表达式引擎集成到 Redis 的启发,深入探索了 Ville Laurikari 开发的 TRE 引擎。他利用 Claude Code 构建了一个基于 ctypes 的实验性 Python 绑定库,并针对该库进行了一系列恶意的正则表达式攻击测试。结果显示,由于 TRE 引擎不支持回溯机制,其在抵御这些攻击方面的表现远优于 Python 标准库中的正则表达式实现。

GitHub开源/仓库编码
5月4日
23:56
Hacker News 热门(buzzing.cc 中文翻译)
精选72
Show HN: Ableton Live MCP

这是一个名为 Ableton Live MCP 的开源项目,它通过模型上下文协议(MCP)将 Ableton Live 音乐制作软件与大型语言模型(如 GPT、Claude)连接起来。该项目在 Hacker News 上获得了 100 点热度,其核心功能是让 LLM 能够读取和控制 Ableton Live 的会话数据,从而可能实现基于自然语言指令的音乐创作与自动化流程。

MCP/工具开源/仓库

推荐理由:给 Ableton Live 接上了 LLM 的大脑,让 AI 能直接操作 DAW,虽然还只是原型,但已经能看到未来音乐制作的人机协作模式。做音频 Agent 的可以拿来玩。
08:20
Hacker News 热门(buzzing.cc 中文翻译)
精选72
DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环,价格仅为原价的 1/17

DeepClaude项目在GitHub上发布,它是一个结合了DeepSeek V4 Pro模型的Claude代码代理循环工具。该工具的核心优势在于显著降低了使用成本,其价格仅为原Claude方案的1/17,即便宜了约17倍。这一开源方案为开发者提供了一个高性能且极具成本效益的代码生成与处理替代选择。

Anthropic开源/仓库编码

推荐理由:用 DeepSeek V4 Pro 跑 Claude Code 代理循环,成本直接打到一杯奶茶钱,虽说不一定每个任务都能媲美原版,但便宜成这样还要什么自行车?
08:00
HuggingFace Daily Papers(社区热门论文)
61
ARIS:通过对抗性多智能体协作实现自主研究

ARIS是一个开源自主研究框架,旨在通过对抗性多智能体协作机制提升长周期研究工作的可靠性。其默认配置要求执行模型推进研究,同时推荐由不同模型家族的评审者对中间成果提出批判性修订,以应对“看似合理但缺乏证据支持”的核心失效模式。框架包含三层架构:执行层提供可复用技能与工具;编排层协调多种工作流并路由至评审者;保障层则实施三阶段证据检查流程,包括完整性验证、结果与主张映射以及交叉审计。原型系统还包含一个需经评审批准的自改进循环。

智能体arXivMCP/工具开源/仓库
00:50
Hacker News 热门(buzzing.cc 中文翻译)
66
Flue 是一个用于构建新一代代理的 TypeScript 框架

Flue 是一个用于构建新一代智能代理的 TypeScript 框架。该框架旨在简化下一代代理的开发流程,其官网为 flueframework.com。相关资讯在 Hacker News 平台上获得了 100 点热度。

智能体开源/仓库
5月3日
23:50
Hacker News 热门(buzzing.cc 中文翻译)
67
Show HN: 苹果的Sharp通过ONNX Runtime Web在浏览器中运行

苹果的图像处理库Sharp现可通过ONNX Runtime Web在浏览器中直接运行。该项目已在GitHub开源,实现了将原本依赖本地Node.js环境的Sharp功能迁移至Web平台,用户无需本地安装即可在浏览器中进行图像处理。该发布在Hacker News上获得了103点关注度,展示了Web端机器学习与本地工具融合的新进展。

开源/仓库端侧
17:49
Hacker News 热门(buzzing.cc 中文翻译)
65
Specsmaxxing--关于克服AI心理障碍,以及我为何用YAML编写规格说明

作者提出“Specsmaxxing”概念,旨在通过优化规格说明来克服AI心理障碍,即AI因指令模糊而产生的不可预测输出。其核心解决方案是采用YAML格式编写详细、结构化的规格说明,这能显著提升AI响应的准确性和一致性。为此,作者开源了一套配套工具包,供开发者实践此方法。该文章在Hacker News上获得了104点热度。

开源/仓库教程/实践
15:51
The Decoder:AI News(RSS)
60
小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus,实现数小时自主编程

小米发布开源模型 MiMo-V2.5-Pro,其编程基准测试成绩接近 Anthropic 的 Claude Opus 4.6,同时令牌消耗量减少 40% 至 60%。该模型能持续数小时自主处理单一任务,标志着中国开源模型竞争焦点正从单纯追求基准分数,转向降低运行成本与提升任务持久性。小米借此进一步深入与 DeepSeek 等国内开源提供商的竞争。

Anthropic开源/仓库模型发布编码
13:49
Hacker News 热门(buzzing.cc 中文翻译)
43
Kimi K2.6 刚刚在一场编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini

Kimi K2.6在编程挑战赛中击败了Claude、GPT-5.5和Gemini。该模型是一款开源的中国AI模型,在HumanEval编程基准测试中取得了92.7%的准确率,超越了GPT-5.5的92.2%和Claude 3.5 Sonnet的90.2%。其上下文长度扩展至128K tokens,并采用了MoE架构。此次表现标志着开源模型在编程能力上首次超越主流闭源模型。

开源/仓库编码评测/基准
00:49
Hacker News 热门(buzzing.cc 中文翻译)
63
开放式设计:将您的编程代理用作设计引擎

开源项目“Open Design”发布,旨在将编程智能体转化为设计引擎。该项目允许开发者利用代码生成和修改用户界面等设计元素,推动设计与开发流程的融合。项目在GitHub开源,并在Hacker News社区获得103点热度,显示出开发者对此类工具的积极关注。其核心变化在于为编程代理赋予了视觉设计能力,可能提升界面开发效率。

智能体开源/仓库编码
5月2日
19:09
Hacker News:AI 热帖
69
Agent-desktop:面向AI代理的原生桌面自动化CLI工具

Agent-desktop 是一款基于 Rust 构建的原生桌面自动化命令行工具,专为 AI 代理设计。它通过操作系统无障碍访问树为任何应用程序提供结构化访问,无需依赖截图、像素匹配或浏览器。该工具包含快速单二进制 CLI 和 C-ABI 动态库,支持 Python、Swift、Go 等多种语言直接调用,避免每次命令 fork 进程。核心特性涵盖 53 个命令,包括观察、交互、键盘鼠标操作;采用渐进式骨架遍历,在密集应用中可减少 78–96% 的令牌使用;工作流经 AI 优化,使用确定性元素引用,且所有交互优先尝试纯无障碍 API。目前支持 macOS 13.0+ 系统,需授予无障碍权限。

智能体开源/仓库部署/工程
17:49
Hacker News 热门(buzzing.cc 中文翻译)
精选74
DeepSeek V4--性能几乎达到前沿水平,价格却仅为其一小部分

DeepSeek发布了V4版本模型,其性能已接近行业最前沿水平,但在价格上具有显著优势,仅为主要竞争对手的一小部分。该模型在多项基准测试中表现出色,能以极低的成本提供顶级的AI能力,有望大幅降低企业和开发者的使用门槛,推动AI技术的更广泛普及。

大佬观点开源/仓库模型发布

推荐理由:Simon Willison 实测结论很直白,DeepSeek V4 性能几乎摸到前沿,价格却便宜一个量级,对预算卡死的团队是重大利好。
09:18
Hacker News 热门(buzzing.cc 中文翻译)
60
通晓一切

GitHub上开源了“Understand Anything”项目,这是一个AI驱动的工具,旨在帮助用户理解和解释各类复杂概念与信息。该项目发布后在Hacker News社区获得102个积分,反映出科技开发者对其技术潜力的高度关注。工具可能整合自然语言处理等技术,以提升知识获取与理解的效率。

智能体多模态开源/仓库
03:18
Hacker News 热门(buzzing.cc 中文翻译)
67
面向大型语言模型的高级量化算法

英特尔开源了面向大型语言模型的高级量化算法AutoRound。该算法通过改进的量化策略,能在保持模型性能的同时显著降低存储与计算需求,支持将模型权重压缩至低至3/4比特。相比传统方法,它在多个基准测试中实现了更高的精度,尤其适用于资源受限的部署场景。项目代码已在GitHub发布,并获得开发者社区关注。

开源/仓库部署/工程
5月1日
08:00
HuggingFace Daily Papers(社区热门论文)
51
Code World Model 准备情况报告

Meta 发布了用于代码生成与推理的 Code World Model,并对其进行了前沿风险准备情况评估。报告显示,该模型在预设的可能带来灾难性风险的领域测试中,未表现出超越当前 AI 生态系统的额外前沿风险。基于评估结果,Meta 决定以开放权重模型的形式公开发布 CWM。

Meta安全/对齐开源/仓库模型发布
4月30日
22:13
Hacker News 热门(buzzing.cc 中文翻译)
43
Vera:一种专为机器编写而设计的编程语言

Vera 是一种新型编程语言,专为机器自动编写代码而设计,旨在推动编程自动化。该语言已在 GitHub 平台开源发布,项目地址为 github.com/aallan/vera。自亮相以来,在技术社区 Hacker News 上引发热议,相关帖子获得了 100 点的热度指标,显示出业界对其创新潜力的广泛关注。

GitHub开源/仓库编码
20:10
IT之家(RSS)
53
完全由 AI 生成:《任天堂明星大乱斗》PC 移植版问世

初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布,其全部代码完全由AI生成。开发者仅用25天,借助Opus和GPT等大模型独立完成。该项目基于C/C++源码,需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发,并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。

智能体AnthropicOpenAI开源/仓库
19:11
Hacker News 热门(buzzing.cc 中文翻译)
60
迈克:开源法律人工智能

开源法律人工智能项目“迈克”正式发布。该项目旨在提供免费、可访问的法律AI工具,其核心变化在于将原本可能收费或封闭的法律AI技术开源化,允许开发者自由使用、修改和分发。项目网站mikeoss.com已上线,相关讨论在Hacker News上获得了超过100个社区积分。

智能体开源/仓库
18:10
IT之家(RSS)
61
看穿大模型的"小心思":阿里千问开源可解释性模块 Qwen-Scope

阿里千问开源可解释性模块 Qwen-Scope,该模块基于 Qwen3 和 Qwen3.5 系列模型训练,通过稀疏自编码器提取可解释特征以分析大模型内在机制。开源权重覆盖 7 个大模型,包含 14 组稀疏自编码器,训练数据规模达 0.5B 词元。Qwen-Scope 能实现推理结果的定向控制、数据分类与合成、模型训练优化及评估冗余分析,在数据合成中使训练能效比提升约 15 倍。

Hugging Face安全/对齐开源/仓库
15:40
Hacker News 热门(buzzing.cc 中文翻译)
55
对齐"打地鼠"游戏:微调会触发大型语言模型对受版权保护书籍的检索

一项名为“对齐打地鼠”的研究发现,微调大型语言模型会激活其对受版权保护书籍的检索能力,这揭示了AI对齐过程中的新风险:模型在优化后可能无意中回忆版权内容。该研究通过代码分析证实了这一现象,相关开源代码已发布在GitHub。此话题在科技社区引发关注,在Hacker News上获得103点积分,凸显了版权与AI发展之间的潜在冲突。

安全/对齐开源/仓库数据/训练论文/研究
10:42
HuggingFace Daily Papers(社区热门论文)
55
ClawGym:一个用于构建高效Claw智能体的可扩展框架

ClawGym是一个可扩展框架,旨在解决Claw式环境中缺乏系统化开发框架的瓶颈,支持个人智能体开发的全生命周期。其核心包括:ClawGym-SynData数据集,通过角色驱动意图与技能基础操作合成1.35万个筛选任务,配备模拟工作空间和混合验证机制;ClawGym-Agents模型系列,基于黑盒轨迹监督微调训练,并探索在并行化任务沙箱中的轻量级强化学习流程;以及ClawGym-Bench评估基准,包含200个经过自动过滤与人工-LLM双重校准的测试实例。相关资源即将在GitHub开源发布。

智能体开源/仓库数据/训练论文/研究
03:34
Simon Willison 博客
68
LLM 0.32a0 发布重大向后兼容重构

LLM Python库和CLI工具发布0.32a0 alpha版本,进行了两项核心架构升级。首先,模型输入现支持表示为消息序列,能直接处理包含多轮对话历史的完整上下文,解决了此前难以载入已有对话的局限。其次,模型响应升级为支持由不同类型部分组成的流式输出,以更好地适配现代前沿模型处理多样化输入(如图像、音频)和输出(如结构化JSON、工具调用)的能力。此次重构旨在让该库的抽象层跟上LLM技术自2023年以来的快速演进。

GitHubMCP/工具开源/仓库部署/工程
4月29日
19:07
公众号:通义实验室(千问)
53
FlashQLA:让 Qwen 的注意力层跑得更快
开源/仓库推理部署/工程
16:10
Hacker News 热门(buzzing.cc 中文翻译)
50
Show HN: 汽车架构:卡帕西循环,聚焦于CPU

开源项目Auto-Architecture实现了针对CPU优化的Karpathy's Loop算法,该算法原由AI研究员安德烈·卡帕西提出,常用于神经网络训练与推理的优化循环。项目将这一循环方法专门适配于CPU架构,旨在提升计算效率与资源利用率。该项目已在GitHub开源,并在Hacker News上获得103个点赞,展示了社区对其技术思路的关注。

开源/仓库部署/工程
09:00
公众号:蚂蚁百灵(Ling)
57
Ling-2.6-flash 正式开源

Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。

开源/仓库开源生态模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
50
更优模型,更快训练:用于单细胞基础模型的Sigmoid注意力机制

本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案,用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明,Sigmoid注意力能提升25%的细胞类型分离度,改善细胞类型内聚性,并降低验证损失,同时训练速度提升高达10%。理论分析揭示,Sigmoid具有全局有界导数和对角雅可比结构,这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中,训练1.6亿参数模型时,Softmax出现梯度爆炸,而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid,在H100上实现515 TFLOPS,性能超越现有方案,并原生支持生物序列所需的填充处理。

开源/仓库数据/训练论文/研究
4月28日
22:39
Hacker News 热门(buzzing.cc 中文翻译)
精选70
Microsoft VibeVoice:开源前沿语音人工智能

微软开源了前沿语音人工智能项目VibeVoice,该项目已在GitHub上发布。VibeVoice能够生成高度自然、富有表现力的语音,支持多种语言和情感语调,显著提升了合成语音的真实感与感染力。其开源策略旨在推动语音AI领域的协作与创新,降低开发门槛。该项目在技术社区获得关注,在Hacker News上获得了103个投票点数。

Microsoft开源/仓库语音

推荐理由:微软把前沿语音模型直接开源放 GitHub,对做语音产品的团队来说是真金白银的基建降本,不用再从零训一个了。
17:51
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型,作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命,以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧
12:33
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
一个用于编排的开源规范:Symphony

Symphony 是一个用于 Codex 编排的开源规范,能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行,显著提升工程团队的产出效率,同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式,将日常开发流程转化为由智能体持续驱动的工作流。

智能体OpenAI产品更新开源/仓库

推荐理由:OpenAI 把 Codex 的编排层抽成开源规范,等于告诉所有做 coding agent 的团队,底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。
11:50
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型,致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化,显著提升了推理效率并降低了计算资源消耗,是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧
11:27
蚂蚁 inclusionAI:HuggingFace 新模型
精选55
inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员,旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由:蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace,名字带 flash 大概率是轻量推理模型,但官方描述几乎空白,没有 benchmark 也没有用例,建议等社区实测再决定是否投入精力。
10:47
Simon Willison 博客
65
介绍 talkie:一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie,这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练,而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练,可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力,并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧
10:47
Hacker News 热门(buzzing.cc 中文翻译)
51
Talkie:一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型,其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风,在文本生成中呈现出独特的复古韵味。项目已在官网发布,并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布
07:46
Simon Willison 博客
64
微软开源语音转文本模型VibeVoice简介与实测

微软于2026年1月发布开源语音转文本模型VibeVoice,采用MIT许可证并内置说话人日志功能。社区提供的4位量化MLX版本约5.71GB。实测在128GB内存的M5 Max MacBook Pro上,使用mlx-audio工具处理一段60分钟音频耗时约8分45秒,峰值内存占用达30.44GB。模型默认支持最长25分钟音频,通过调整参数可处理至多1小时音频,输出为带时间戳和说话人ID的JSON格式,便于用Datasette Lite浏览分析。

Microsoft开源/仓库教程/实践语音
4月25日
23:26
Hacker News 热门(buzzing.cc 中文翻译)
56
开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能

开源项目Stash发布,为AI代理提供长期记忆与上下文管理能力。它通过独立存储和检索对话历史,使开发者无需依赖特定API即可为应用添加持久化记忆功能。该项目已在GitHub开源,并获Hacker News社区关注,降低了构建复杂AI代理的门槛。

智能体开源/仓库部署/工程
‹ 上一页
1…56789…12
下一页 ›