AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源/仓库」清除
4月28日周二
20:25SenseTime59SenseNova U1 Lite系列开源,统一多模态理解与生成
17:51蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI发布Ling-2.6-flash-int4模型
13:24ChatGPT42OpenAI Codex 提示词惊现重复指令,禁止谈论虚构生物
12:33OpenAI:官网动态(RSS · 排除企业/客户案例)70精选一个用于编排的开源规范:Symphony
11:50蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-flash-fp8
11:27蚂蚁 inclusionAI:HuggingFace 新模型55精选inclusionAI/Ling-2.6-flash
10:48Peter Steinberger 🦞35开源项目获PR管理及测试CI解决方案
10:47Simon Willison 博客65介绍 talkie:一个源自1930年的130亿参数复古语言模型
10:47Hacker News 热门(buzzing.cc 中文翻译)51Talkie:一款诞生于1930年的13B复古语言模型
10:45歸藏(guizang.ai)60小米MiMo开源激励计划,作者欲为Codepilot用户争Token补贴
10:42歸藏(guizang.ai)74精选小米 MiMo-V2.5 系列模型全部开源
10:38阿绎 AYi69OpenAI开源语音控制组件,开启自然语音交互新范式
10:21OpenClaw🦞50OpenClaw大版本发布 本地模型功能增强
09:55meng shao71VLAA-GUI: 让 GUI 智能体学会"停下、恢复、搜索"
09:45meng shao75精选小米开源MiMo-V2.5系列大模型
07:46Simon Willison 博客64微软开源语音转文本模型VibeVoice简介与实测
07:23Berryxia.AI69小米开源MiMo-V2.5系列模型,支持百万token上下文
04:26AK51小米MiMo-V2.5模型上线Hugging Face
03:45Fuli Luo76精选小米开源MiMo-V2.5双模型,并提供百亿免费代币
00:24凡人小北34频繁发版暴露测试环节缺失
4月27日周一
12:00向阳乔木48全模态测试遇阻,开发者改造开源UI适配多模型
4月26日周日
23:19Berryxia.AI60微软开源TRELLIS.2:单图3秒生成高质量3D模型
13:51Peter Steinberger 🦞48Summarize 0.14.0发布,新增多项实用功能
4月25日周六
23:26Hacker News 热门(buzzing.cc 中文翻译)56开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能
22:44meng shao60Obscura:专为AI Agent与规模化爬取设计的轻量级无头浏览器引擎
22:17meng shao63腾讯混元发布首个重建基础设施后模型「Hy3 preview」
20:42Hacker News 热门(buzzing.cc 中文翻译)46Show HN: 由您的代理维护的卡帕西风格大语言模型维基(支持 Markdown 和 Git)
19:13Berryxia.AI56开源OCR模型性能突破,支持90余种语言与完整布局解析
18:17Hacker News:AI 热帖60展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)
18:17Peter Steinberger 🦞62并行扫描代码库,自动关闭无效议题
17:42Hacker News 热门(buzzing.cc 中文翻译)58Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力
14:42Hacker News 热门(buzzing.cc 中文翻译)43将 IBM Quantum 后端替换为 /dev/urandom
14:13阿绎 AYi65开源工具25秒深度克隆网站设计系统,设计或从"手艺"变为"数据"
4月24日周五
22:17蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI/DR-Venus-4B-SFT-GGUF
15:41Steve Yegge:Medium(RSS)62Gas City 正式发布
14:45Hacker News 热门(buzzing.cc 中文翻译)56Show HN: Agent Vault - 面向代理的开源凭证代理和存储库
11:44小互56OpenAI 刚发的 Workspace Agent,开源版来了
11:24Ethan Mollick54DeepSeek发布全新开源模型
08:00HuggingFace Daily Papers(社区热门论文)53TexOCR: 推动文档OCR模型实现可编译的页面到LaTeX重建
4月23日周四
17:50公众号:腾讯混元67精选Hy3 preview发布并开源:混元重建后首个模型,Agent能力大幅提升
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月28日
20:25
SenseTime@SenseTime_AI
59
SenseNova U1 Lite系列开源,统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构,原生统一了多模态理解与生成能力。其核心优势包括:在开源模型中具备领先的效率,紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益;支持原生的图像-文本交织生成,单一模型即可在单次流程中生成连贯交织的图文内容,适用于制作指南等实用场景;并拥有高密度信息渲染能力,擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布
17:51
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型,作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命,以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧
13:24
ChatGPT@ChatGPTapp
42
在 OpenAI Codex 的 GitHub 代码库中,其模型配置文件内的系统提示词被发现存在重复行。该指令明确要求模型避免谈论地精、小妖精、浣熊、巨魔、食人魔、鸽子或其他动物与虚构生物,除非与用户查询绝对且明确相关。这一重复的约束性提示引发了社区对其背后原因及模型训练细节的讨论。

arb8020: gpt-5.5 prompt for codex seems to have a duplicated line trying to get it to not talk about creatures? Never talk about ...

OpenAI开源/仓库编码
12:33
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
一个用于编排的开源规范:Symphony

Symphony 是一个用于 Codex 编排的开源规范,能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行,显著提升工程团队的产出效率,同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式,将日常开发流程转化为由智能体持续驱动的工作流。

智能体OpenAI产品更新开源/仓库

推荐理由:OpenAI 把 Codex 的编排层抽成开源规范,等于告诉所有做 coding agent 的团队,底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。
11:50
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型,致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化,显著提升了推理效率并降低了计算资源消耗,是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧
11:27
蚂蚁 inclusionAI:HuggingFace 新模型
精选55
inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员,旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由:蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace,名字带 flash 大概率是轻量推理模型,但官方描述几乎空白,没有 benchmark 也没有用例,建议等社区实测再决定是否投入精力。
10:48
Peter Steinberger 🦞@steipete
35
终于为PR/Issue管理、远程测试执行、用于测试的大规模CI基础设施找到了优秀的解决方案。简化了许多工作。

OpenClaw🦞: One more thing: OpenClaw 2026.4.26 is stacked because the Clawtributors showed up hard. Bug reports, fixes, edge cases, ...

产品更新开源/仓库编码
10:47
Simon Willison 博客
65
介绍 talkie:一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie,这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练,而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练,可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力,并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧
10:47
Hacker News 热门(buzzing.cc 中文翻译)
51
Talkie:一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型,其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风,在文本生成中呈现出独特的复古韵味。项目已在官网发布,并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布
10:45
歸藏(guizang.ai)@op7418
60
作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态,该模型采用MIT协议,允许自由商用、二次训练与微调。同时,小米推出了Orbit 100T Token计划,包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持,如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai): 小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...

开源/仓库模型发布
10:42
歸藏(guizang.ai)@op7418
精选74
小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型,采用宽松的MIT协议,允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型:专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro,以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时,小米推出Orbit 100T Token计划,包含面向AI开发者的“百万亿Token创造者激励计划”,提供最高价值659元的Credits,以及面向Agent框架团队的“Agent生态共建计划”,为其用户提供MiMo token限免支持。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布端侧

推荐理由:小米把 MiMo-V2.5 全线 MIT 开源,Pro 版在 agent 和编码榜单冲到开源第一,百万亿 Token 激励计划更是直接送钱让你用,做 Vibe Coding 的人没理由不去薅一把。
10:38
阿绎 AYi@AYi_AInotes
69
OpenAI开源语音控制组件,开启自然语音交互新范式

OpenAI开源了gpt-realtime-1.5的官方语音控制组件,允许用户直接用自然语音控制应用UI状态,而非仅进行语音转文本。该组件是一个完整的React参考实现,开发者可快速集成。其核心在于工具由应用预定义,模型只能调用这些受限动作,确保了安全可控。这标志着语音正从输入层升级为顶层控制层,为设计、驾驶等双手操作场景提供了新的交互可能,是交互范式的重要转折。

OpenAI Developers: You can build interactive applications with gpt-realtime-1.5, so users can control app state more naturally with voice. ...

MCP/工具OpenAI开源/仓库语音
10:21
OpenClaw🦞@openclaw
50
OpenClaw 2026.4.26 🦞 🎙️ Google 直播访谈 🦙 更好的 Ollama/本地模型 🧳 迁移 Claude + Hermes 配置 🔐 单命令 Matrix 端到端加密 重大发布。本地模型享用盛宴。 https://github.com/openclaw/openclaw/releases/tag/v2026.4.26
产品更新开源/仓库端侧
09:55
meng shao@shao__meng
71
VLAA-GUI: 让 GUI 智能体学会"停下、恢复、搜索"

研究指出,当前GUI智能体的核心瓶颈在于系统设计,而非模型能力,表现为假性成功和死循环等问题。VLAA-GUI框架通过三个模块应对:STOP验证器确保任务真正完成,RECOVER循环中断器打破重复操作,SEARCH代理直接获取外部知识。在OSWorld基准测试中,该框架助力Opus 4.6模型取得77.5%的成功率,首次超越人类水平(72.4%);在WindowsAgentArena上,结合Gemini 3.1 Flash也以61.0%创下新纪录。这表明,精心的系统设计与强大的模型能力同等重要。

Cihang Xie: 🚀 GUI agents are advancing fast - yet they still stumble on surprisingly simple things: • declare success too early • g...

智能体开源/仓库论文/研究
09:45
meng shao@shao__meng
精选75
小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型,包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro,以及支持多模态代理的310B参数MoE模型MiMo-V2.5,两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术,以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式,通过多教师策略蒸馏提升模型综合能力。同时,小米推出100T Token的创造者激励计划,为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

Fuli Luo: Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...

智能体开源/仓库模型发布端侧

推荐理由:小米把万亿参数 MoE 做到开源且百万上下文,MTP 三层原生集成让推理速度翻三倍,这在国内大厂开源里是第一个真正敢放权重的万亿级模型,做 Agent 的值得认真看看。
07:46
Simon Willison 博客
64
微软开源语音转文本模型VibeVoice简介与实测

微软于2026年1月发布开源语音转文本模型VibeVoice,采用MIT许可证并内置说话人日志功能。社区提供的4位量化MLX版本约5.71GB。实测在128GB内存的M5 Max MacBook Pro上,使用mlx-audio工具处理一段60分钟音频耗时约8分45秒,峰值内存占用达30.44GB。模型默认支持最长25分钟音频,通过调整参数可处理至多1小时音频,输出为带时间戳和说话人ID的JSON格式,便于用Datasette Lite浏览分析。

Microsoft开源/仓库教程/实践语音
07:23
Berryxia.AI@berryxia
69
小米开源MiMo-V2.5系列模型,支持百万token上下文

小米正式开源MiMo-V2.5系列模型,采用MIT许可证,允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口:MiMo-V2.5-Pro专为复杂Agent和编码任务设计,在开源模型的GDPVal-AA和ClawEval基准测试中排名第一;MiMo-V2.5是原生多模态模型,具备强大的Agent能力。小米强调,模型的价值不应仅由排行榜衡量,而应取决于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码
04:26
AK@_akhaliq
51
小米 MiMo-V2.5 已在 Hugging Face 发布 https://huggingface.co/collections/XiaomiMiMo/mimo-v25
多模态开源/仓库模型发布
03:45
Fuli Luo@_LuoFuli
精选76
小米宣布开源两个大模型:专攻复杂智能体和编码任务的MiMo-V2.5-Pro,以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度,并采用允许商业部署和微调的MIT许可证。同时,小米为开发者和创作者提供了100万亿token的免费额度,鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名,更在于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

推荐理由:小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源,还送 100T 免费 token,诚意拉满。做 coding agent 的团队值得认真看看,这可能是目前开源阵营里最强的代码智能体基座。
00:24
凡人小北@frxiaobei
34
OpenClaw 这么频繁的发版,我一开始以为他们掌握了什么自动化测试的黑科技,直到我最近做了两次升级。 😤 虽然 AI 时代讲究一个快,但好歹咱尊重下测试环节。

OpenClaw🦞: OpenClaw 2026.4.25 🦞 🔊 TTS got serious 🧩 Plugins start faster 📊 OTEL can see the weird stuff 🛠️ Browser + install/u...

开源/仓库行业动态部署/工程
4月27日
12:00
向阳乔木@vista8
48
全模态测试遇阻,开发者改造开源UI适配多模型

开发者在测试多个Chatbot客户端时,发现普遍不支持上传音视频文件进行对话,这给全模态大模型的测试带来了不便。因此,他选择了一个开源Chatbot UI项目,并计划用Codex对其进行改造以适配需求。该开源项目参考了ChatGPT、Grok、Gemini和Perplexity等主流产品的界面,设计了多个不同的机器人对话界面,目前在GitHub上已获得近1万颗星。

多模态开源/仓库部署/工程
4月26日
23:19
Berryxia.AI@berryxia
60
微软开源TRELLIS.2:单图3秒生成高质量3D模型

微软开源了40亿参数的TRELLIS.2模型,可将单张图片在3秒内转换为具备完整PBR材质(粗糙度、金属度、不透明度)的专业级3D资产。该模型生成的并非粗糙网格,而是直接可用于生产流程的高质量模型,能够准确处理开放表面、空心结构以及复杂几何体,显著提升了图像到3D内容的生成效率与实用性。

Microsoft多模态开源/仓库
13:51
Peter Steinberger 🦞@steipete
48
总结 📝0.14.0 版本已发布。 通过 `--fast` 启用 GPT-5.5 快速模式,浏览器扩展支持 Reddit 帖子提取,本地 PDF `--extract` 功能,以及自动模型配置修复 + Meta 网站兼容性修复。https://github.com/steipete/summarize/releases/tag/v0.14.0
产品更新开源/仓库编码
4月25日
23:26
Hacker News 热门(buzzing.cc 中文翻译)
56
开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能

开源项目Stash发布,为AI代理提供长期记忆与上下文管理能力。它通过独立存储和检索对话历史,使开发者无需依赖特定API即可为应用添加持久化记忆功能。该项目已在GitHub开源,并获Hacker News社区关注,降低了构建复杂AI代理的门槛。

智能体开源/仓库部署/工程
22:44
meng shao@shao__meng
60
Obscura:专为AI Agent与规模化爬取设计的轻量级无头浏览器引擎

Obscura是一个用Rust编写的轻量级无头浏览器引擎,专为AI Agent自动化和大规模网络爬取优化。其核心优势在于极致的性能与资源效率,内存占用仅30MB,页面加载约85毫秒,远超Headless Chrome。项目采用务实架构,复用Servo的DOM与V8引擎,并构建独立网络层。关键特性包括深度反检测的“隐身模式”,能随机化指纹并拦截追踪域名;通过兼容Chrome DevTools Protocol,实现与Puppeteer/Playwright生态无缝对接。此外,它内置了DOM转Markdown等专为AI Agent优化的功能,旨在作为高效的常驻网页感知端点。

Chris Laub: A Rust dev just killed Headless Chrome. It's called Obscura. The open-source headless browser purpose-built for AI agent...

智能体开源/仓库部署/工程
22:17
meng shao@shao__meng
63
腾讯混元发布首个重建基础设施后模型「Hy3 preview」

腾讯混元团队在重建基础设施后,推出首个MoE架构模型Hy3 preview,总参295B,支持256K上下文。团队确立能力体系化、评测真实性、性价比三大原则,推动模型向实用转型。评估显示,Hy3在复杂推理与长上下文任务上进入第一梯队,代码与智能体能力进步显著。其突出亮点是能深度挖掘非结构化对话中的隐含约束,并转化为结构化输出,体现了强大的实际应用潜力。

Tencent Hy: 👋Hi /haɪ/, we're the Tencent Hy /haɪ/ team🐧 Today, we open source Hy3 preview (295B A21B), a leading reasoning and age...

开源/仓库推理模型发布编码
20:42
Hacker News 热门(buzzing.cc 中文翻译)
46
Show HN: 由您的代理维护的卡帕西风格大语言模型维基(支持 Markdown 和 Git)

项目“Wuphf”是一个受卡帕西风格启发的大语言模型维基系统,支持Markdown格式和Git版本控制。其核心特点是可由用户设定的AI代理自动维护和更新内容,实现了知识库的持续自主管理。该项目已在GitHub开源,并在Hacker News上获得了100点热度。

智能体开源/仓库部署/工程
19:13
Berryxia.AI@berryxia
56
开源OCR模型性能突破,支持90余种语言与完整布局解析

一款新的开源OCR模型在olmocr基准测试中达到85.9%的SOTA性能。该模型参数量为40亿,由90亿参数精简而来,支持超过90种语言并附带基准测试。其核心能力包括保留完整的文档布局信息,能从图像和图表中提取并生成说明文字,同时对手写文本、数学公式、表单及表格具备强大的识别与解析支持。

多模态开源/仓库模型发布
18:17
Hacker News:AI 热帖
60
展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)

WUPHF 是一个为 AI 员工设计的协作办公平台,通过一个命令即可启动,在本地提供 Web 界面。它将不同角色的 AI 智能体置于一个共享的虚拟办公室中,使其可见、可争论并协作完成任务。平台为每个智能体提供私人笔记,团队共享一个基于 Markdown 和 Git 的本地维基,智能体可自主将可靠信息同步至团队知识库。项目目前处于 1.0 版本前的预发布阶段,默认使用 Claude Code,支持通过命令行参数灵活配置。

智能体MCP/工具产品更新开源/仓库
18:17
Peter Steinberger 🦞@steipete
62
构建了clawsweeper,它能并行运行50个codex,全天候深度扫描issues和prs,并关闭那些已经实现或毫无意义的内容。 今天关闭了约4000个issues,还有几千个正在处理中。(速率限制相当严格)https://github.com/openclaw/clawsweeper
智能体开源/仓库编码
17:42
Hacker News 热门(buzzing.cc 中文翻译)
58
Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力

开源项目“Browser Harness”发布,旨在赋予大型语言模型(LLM)在浏览器中自主完成任意任务的能力。该工具通过提供一个可编程的浏览器控制框架,使LLM能够像人类一样操作网页,执行点击、输入、导航等复杂交互。此举有望突破当前AI代理在自动化网络操作方面的限制,扩展LLM的实际应用场景。该项目已在GitHub开源,并在Hacker News社区获得100点热度关注。

智能体MCP/工具开源/仓库
14:42
Hacker News 热门(buzzing.cc 中文翻译)
43
将 IBM Quantum 后端替换为 /dev/urandom

一个GitHub项目演示了将IBM Quantum量子计算后端替换为Linux系统的伪随机数生成器/dev/urandom。实验表明,使用经典随机源替代后,在特定量子线路模拟任务中仍能产生与量子后端相似的输出结果,其保真度达到约0.5。该项目以讽刺手法质疑当前某些量子计算演示的实际效用,暗示其可能并未展现出超越经典随机过程的明显优势。

安全/对齐开源/仓库现象/趋势
14:13
阿绎 AYi@AYi_AInotes
65
开源工具25秒深度克隆网站设计系统,设计或从"手艺"变为"数据"

开源工具Hyperbrowser能在约25秒内深度解析并克隆网站(如Anthropic官网)的完整设计系统,自动提取颜色、字体、间距等样式,并总结设计语言,生成结构化文档。这标志着设计正从依赖手艺的“像素级模仿”转变为可快速解析、复制的结构化数据,大幅降低了借鉴成熟设计系统的门槛,未来竞争焦点可能转向对设计DNA的快速吸收与再创造。

MCP/工具开源/仓库教程/实践
4月24日
22:17
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI/DR-Venus-4B-SFT-GGUF

该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程,旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式,降低技术门槛,促进创新生态的构建。

开源/仓库模型发布端侧
15:41
Steve Yegge:Medium(RSS)
62
Gas City 正式发布

Gas City 是 Gas Town 的彻底重写版本,作为构建自定义智能体工厂的 SDK 于本周发布 v1.0.0。它将技术栈解构为可组合的、声明式的 “pack” 构建块,用于部署任意拓扑的协作智能体团队。系统默认包含一个完整的 “Gas Town” pack,可作为原版的直接替代品。Gas City 基于 MEOW 栈和 Dolt 构建,提供智能体身份、消息传递、上下文、状态等开箱即用的服务,并暴露 Factory Worker API,完全开源并采用 MIT 许可证。

智能体GitHub开源/仓库开源生态
14:45
Hacker News 热门(buzzing.cc 中文翻译)
56
Show HN: Agent Vault - 面向代理的开源凭证代理和存储库

Infisical团队开源了Agent Vault,这是一个专为AI代理设计的凭证代理与存储库。该项目旨在安全地管理AI代理在运行时所使用的API密钥、数据库密码等敏感凭证,防止其直接暴露在代码或环境中。Agent Vault作为代理与外部服务之间的中间层,集中处理身份验证,从而提升安全性并简化凭证管理流程。该项目已在GitHub发布,并在Hacker News上获得了101点关注度。

智能体开源/仓库部署/工程
11:44
小互@xiaohu
56
OpenAI 刚发的 Workspace Agent,开源版来了

开源项目 openclaw-managed-agents 提供了类似 OpenAI Workspace Agent 的功能,核心特点是支持接入任意大模型(如 Claude、GPT、Gemini 等)并可自托管于自有服务器,成本可低至每月4欧元。其采用独立 Docker 沙箱架构,确保每个用户会话隔离运行,实现凭证安全与互不影响,且子 agent 调用过程全程可观测。该方案适用于为企业搭建可灵活切换模型的 AI Agent 服务、为 SaaS 产品添加隔离的 AI 助手、构建社交平台机器人或运行内部受控、仅能访问指定 API 的安全 Agent。

Stain Lu: we built an open-source version of workspace agents - any model, self-hosted - per-session sandbox - credential isolatio...

智能体开源/仓库部署/工程
11:24
Ethan Mollick@emollick
54
现在又有了新的DeepSeek模型,而且似乎是完全开放权重的。基准测试成绩不错,但对于开源模型来说,这并不总是那么有意义。应该很快就能实际体验了。
DeepSeek开源/仓库模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
53
TexOCR: 推动文档OCR模型实现可编译的页面到LaTeX重建

现有文档OCR主要针对纯文本或Markdown,丢弃了使LaTeX对科学出版至关重要的结构和可执行属性。研究将科学PDF重建为可编译LaTeX的页面级任务,并为此引入了基准测试TexOCR-Bench和大规模训练语料TexOCR-Train。TexOCR-Bench采用多维评估套件,联合评估转录保真度、结构忠实度和端到端可编译性。利用TexOCR-Train,通过监督微调和强化学习训练了一个20亿参数的TexOCR模型,其强化学习的可验证奖励源自直接强制执行可编译性和引用完整性的LaTeX单元测试。在TexOCR-Bench上对21个前沿模型的实验表明,现有系统经常违反关键文档不变性,包括一致的章节结构、正确的浮动体放置和有效的标签-引用链接,这损害了编译可靠性和下游可用性。分析进一步揭示,带有可验证奖励的强化学习相比仅用监督微调能带来一致改进,尤其在结构和编译指标上。

开源/仓库数据/训练论文/研究部署/工程
4月23日
17:50
公众号:腾讯混元
精选67
Hy3 preview发布并开源:混元重建后首个模型,Agent能力大幅提升
智能体开源/仓库模型发布

推荐理由:混元重建后的第一枪,Agent能力大幅提升且直接开源,虽然已过首发热度,但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。
‹ 上一页
1…1718192021…25
下一页 ›