AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源/仓库」清除
4月16日周四
19:58公众号:龙猫LongCat(美团)38LongCat-AudioDiT:突破零样本TTS音色克隆上限
17:08Hacker News 热门(buzzing.cc 中文翻译)Show HN: Libretto - 让 AI 浏览器自动化操作具有确定性
14:38Hacker News 热门(buzzing.cc 中文翻译)Darkbloom - 在闲置的 Mac 上进行私有推理
01:37Hacker News 热门(buzzing.cc 中文翻译)开源并未消亡。Cal.com 只是得出了错误的结论
4月15日周三
14:41Hacker News 热门(buzzing.cc 中文翻译)Gas Town:从小丑秀到 v1.0
14:41karminski-牙医哪来的 Qwen3.5-40B Dense?
12:44宝玉开源项目推荐:BlockNote
11:00公众号:小红书技术(dots.llm)52小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎
09:27Hacker News 热门(buzzing.cc 中文翻译)Show HN: LangAlpha--如果Claude Code是为华尔街打造的会怎样?
4月14日周二
22:03Peter Steinberger 🦞这次发布让我异常开心,因为我完全没有参与 -- @vincent_koc 和维护团队做得很好。 我很快回来继续开发 OpenClaw,今天/明天我在为温哥华的 @TEDTalks 做准备。🇨🇦 【引用 @openclaw】:OpenClaw 2026.4.14 🦞 更多可靠性更新: ✨ 更智能的 GPT-5.4 路由和恢复 🌐 Chrome/CDP 改进 🧵 子代理不再卡住 💬 Slack/Telegram/Discord 修复 ⚡️ 各项性能改进 当时在睡觉,但我们还是发布了。https://github.com/openclaw/openclaw/releases/tag/v2026.4.14
05:25Rohan PaulStrix:将 AI 融入安全测试-验证-修复闭环
04:25swyx 🐣60Anh开源写作技能模板助力提升
01:16AK35GLM-5.1赛车游戏上线Hugging Face
4月13日周一
23:50Hacker News 热门(buzzing.cc 中文翻译)他们看到了你的照片
21:54Hacker News 热门(buzzing.cc 中文翻译)Show HN: 我用了3周时间,借助Claude和Codex开发了一款社交媒体管理工具
12:34Rohan PaulOpenBMB发布开源多语言TTS模型VoxCPM 2
12:32Hacker News 热门(buzzing.cc 中文翻译)Show HN: Claudraband - 面向高级用户的 Claude 代码
04:33Rohan PaulLinux内核确立AI辅助编程政策:开发者须对AI代码承担全责
4月12日周日
22:30Nathan Lambert我和 @xeophon 将继续公开吐槽开源模型许可证错误,为期一年
21:55Hacker News 热门(buzzing.cc 中文翻译)尽管使用频率不高,Pro Max 5x 的流量配额仍在 1.5 小时内用尽
4月11日周六
09:41Hacker News 热门(buzzing.cc 中文翻译)在为 Linux 内核做贡献时使用 AI 辅助
4月10日周五
00:00LMSYS:Blog(Chatbot Arena 团队)HiSparse:分层内存系统加速稀疏注意力
4月9日周四
17:30公众号:通义实验室(千问)56VimRAG:图文视频全模态知识库开源框架
11:32宝玉你可以用 baoyu-skills 的 baoyu-slide-deck 来生成 Slides,比如: > /baoyu-slide-deck 用手绘风格画 <PDF文件路径或者素材路径&…
07:18karminski-牙医Agentshire发布3D AI Agent可视化插件,支持天气系统与NPC社交
4月8日周三
23:56Jeff DeanHedged requests(受 Tail at Scale 论文启发)应用于单机 DRAM 多通道读取,p99.99 延迟降低 5-15 倍
14:06蚂蚁 inclusionAI:HuggingFace 新模型34inclusionAI/TC-AE
12:16Peter Steinberger 🦞CodexBar 0.20 发布 🎚️
05:41SemiAnalysis来自 GTC 演讲,NIXL 的维护者表示他们乐意接受 RIXL 补丁进入上游,就像他们已经接受 Trainium Neuron 支持补丁和 XPU 补丁进入上游一样。乐意在我们的 slack 中进一步交流,并将你介绍给合适的 NIXL 人员,这样你就不需要维护你的二等分支了 @KranenKyle。也许那些接受其他芯片厂商补丁进入上游的 NIXL 人员也可以把你介绍给 flashinfer 的人。
4月7日周二
17:26蚂蚁 inclusionAI:GitHub 新仓库54inclusionAI/TC-AE
4月6日周一
22:30TiboOpenClaw 现已完美适配 GPT-5.4,Peter 和团队整了个大的
08:00HuggingFace Daily Papers(社区热门论文)SuperLocalMemory V3.3:"活脑"--生物启发式遗忘与认知量化的Zero-LLM智能体记忆系统
4月4日周六
01:29François CholletKeras 发布 Kinetic:一键部署云端 TPU/GPU 任务
00:37François CholletKeras 团队将于今天上午10点 PT 进行一场社区会议。还有25分钟开始。会议对所有人开放--欢迎加入了解最新功能和未来规划,并提出你的问题!
4月3日周五
23:06Deedy这是我今年见过最好的 LLM 推理博客文章
16:39karminski-牙医72精选Gemma4有8个模型, 选哪个? 一文看懂!
4月2日周四
15:05蚂蚁 inclusionAI:GitHub 新仓库40inclusionAI/cuLA:基于CuTe DSL与CUTLASS C++的线性注意力变体CUDA内核
07:16Tibo算了,其实想起来了,我们决定开源 Codex 核心,因为这样可以……
4月1日周三
23:03Jim Fan精选CaP-X开源发布:大模型智能体进入物理世界
3月31日周二
17:34公众号:通义实验室(千问)36CoPaw 1.0 发布:定制小模型、安全机制与多智能体全面进化
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月16日
19:58
公众号:龙猫LongCat(美团)
38
LongCat-AudioDiT:突破零样本TTS音色克隆上限

美团技术团队推出的LongCat-AudioDiT模型,实现了零样本TTS音色克隆,让AI直接学习声音本身的规律,跳过中间处理环节,从而突破音色克隆的上限。

开源/仓库论文/研究语音
17:08
Hacker News 热门(buzzing.cc 中文翻译)
Show HN: Libretto - 让 AI 浏览器自动化操作具有确定性

Libretto 是一款开源 AI 浏览器自动化工具,通过技术手段解决传统 AI 自动化中的不确定性问题,使浏览器操作具备确定性和可预测性。该项目已在 GitHub 发布,并在 Hacker News 获得 100 点关注,为开发者提供了更可靠的 AI 驱动浏览器自动化方案。

智能体开源/仓库
14:38
Hacker News 热门(buzzing.cc 中文翻译)
Darkbloom - 在闲置的 Mac 上进行私有推理

Darkbloom 发布了一款工具,支持在闲置 Mac 电脑上执行私有 AI 推理,利用本地空闲算力完成机器学习计算,避免数据上传云端。该项目主打隐私保护,所有推理均在设备本地运行。该消息在 Hacker News 上获得 113 个点赞,详情见 darkbloom.dev。

开源/仓库端侧部署/工程
01:37
Hacker News 热门(buzzing.cc 中文翻译)
开源并未消亡。Cal.com 只是得出了错误的结论

Cal.com 近期以"AI 威胁"为由宣布将其开源代码转为闭源,引发业界对开源模式可持续性的争议。文章指出,这一决定仅反映该公司对商业模式的误判,而非开源软件的系统性失败。尽管 AI 技术给开源商业化带来新挑战,但闭源并非应对冲击的唯一或正确选择,开源并未因个别公司的退出而消亡。

开源/仓库开源生态
4月15日
14:41
Hacker News 热门(buzzing.cc 中文翻译)
Gas Town:从小丑秀到 v1.0

Steve Yegge 宣布 Gas Town 项目正式发布 v1.0 版本,标志着该软件从早期被戏称为"小丑秀"的混乱开发阶段进入稳定正式版。文章回顾了项目迭代过程中的关键转折与改进,该发布在 Hacker News 获得 101 点关注热度。

开源/仓库编码
14:41
karminski-牙医@karminski3
哪来的 Qwen3.5-40B Dense?

DavidAU团队基于Qwen3.5-27B Dense魔改出官方不存在的40B Dense模型。首先通过"Heretic"消融实现Uncensored,并用私有Deckard数据集赋予模型性格;随后截取并复制中间50%参数实现"扩增";最后用Unsloth配合Claude Opus推理数据集微调,稳定参数并优化可变长度推理。测试显示该模型在哲学思辨与创意写作上表现惊艳,但代码生成存在变量作用域问题,上下文能力受损。

开源/仓库开源生态数据/训练
12:44
宝玉@dotey
开源项目推荐:BlockNote

BlockNote是基于React的开源富文本编辑器,采用Notion风格Block模式,基于ProseMirror和Tiptap构建。通过高层封装显著降低集成门槛,几行代码即可部署完整UI。核心亮点是原生AI支持,可接入OpenAI等模型实现写作辅助。协议分层需注意:核心功能采用MPL-2.0允许商业自由使用,但AI集成等xl-系列高级包基于GPL-3.0,闭源项目需购买商业许可。适合追求快速落地的CMS、知识库等场景。

AnthropicOpenAI检索增强开源/仓库
11:00
公众号:小红书技术(dots.llm)
52
小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎

小红书开源发布Relax,一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。

智能体开源/仓库开源生态
09:27
Hacker News 热门(buzzing.cc 中文翻译)
Show HN: LangAlpha--如果Claude Code是为华尔街打造的会怎样?

LangAlpha是一款专为华尔街金融场景打造的AI编程助手,定位为面向交易与金融分析优化的Claude Code替代品。该项目已开源并托管于GitHub仓库ginlix-ai/langalpha,在Hacker News发布当日获得102个赞。工具针对金融行业复杂的数据处理、量化分析和交易执行需求进行了专门适配,旨在为金融从业者提供更精准的代码生成与数据分析能力。

智能体开源/仓库编码
4月14日
22:03
Peter Steinberger 🦞@steipete
这次发布让我异常开心,因为我完全没有参与 -- @vincent_koc 和维护团队做得很好。 我很快回来继续开发 OpenClaw,今天/明天我在为温哥华的 @TEDTalks 做准备。🇨🇦 【引用 @openclaw】:OpenClaw 2026.4.14 🦞 更多可靠性更新: ✨ 更智能的 GPT-5.4 路由和恢复 🌐 Chrome/CDP 改进 🧵 子代理不再卡住 💬 Slack/Telegram/Discord 修复 ⚡️ 各项性能改进 当时在睡觉,但我们还是发布了。https://github.com/openclaw/openclaw/releases/tag/v2026.4.14

OpenClaw🦞: OpenClaw 2026.4.14 🦞 More reliability updates: ✨ Smarter GPT-5.4 routing and recovery 🌐 Chrome/CDP improvements 🧵 Sub...

智能体MCP/工具开源/仓库
05:25
Rohan Paul@rohanpaul_ai
Strix:将 AI 融入安全测试-验证-修复闭环

Strix 是开源自主渗透测试框架,以 AI 作为确定性安全工具之上的自适应操作员。其核心机制围绕动态测试、POC 验证、自动修复 Pull Request 和 CI/CD 钩子构建,可在代码合并前阻断不安全代码。不同于传统扫描器仅抛出猜测,Strix 采用攻击者风格测试,通过浏览器操作、流量检查等方式验证漏洞可利用性,使安全发现附带证明和修复方案直接融入开发流程。

智能体开源/仓库部署/工程
04:25
swyx 🐣@swyx
60
如果你想提升写作水平,Anh是我在开发工具HN社区中认识的最稳定输出的高手之一,她刚刚开源了她的写作技能模板供你使用! 【引用 @byAnhtho】:http://x.com/i/article/2043500390885494784

anhtho 🍊: http://x.com/i/article/2043500390885494784

开源/仓库教程/实践
01:16
AK@_akhaliq
35
Hugging Face 上的 GLM-5.1 日落赛车游戏玩起来挺有趣 app: https://huggingface.co/spaces/victor/sunset-racing-glm-5.1
Hugging Face产品更新开源/仓库
4月13日
23:50
Hacker News 热门(buzzing.cc 中文翻译)
他们看到了你的照片

"They See Your Photos"(theyseeyourphotos.com)项目揭示用户上传照片可能面临的隐私泄露风险,通过直观演示展示图像元数据及内容如何被第三方获取与分析。该网站在 Hacker News 平台获得 104 点热度关注,以可视化方式警示公众关于数字影像在未经授权情况下被访问与识别的安全隐患。

多模态开源/仓库
21:54
Hacker News 热门(buzzing.cc 中文翻译)
Show HN: 我用了3周时间,借助Claude和Codex开发了一款社交媒体管理工具

开发者仅用3周时间,借助Claude和Codex开发了一款社交媒体管理工具,并在GitHub开源。该项目在Hacker News发布后立即获得102个点赞,展示了AI辅助编程在快速构建产品原型方面的高效性。项目代码已托管于brightbeanxyz/brightbean-studio仓库,为开发者提供了可参考的AI协作开发实践案例。

智能体AnthropicOpenAI开源/仓库
12:34
Rohan Paul@rohanpaul_ai
OpenBMB发布开源多语言TTS模型VoxCPM 2

OpenBMB发布开源TTS模型VoxCPM 2,仅2B参数支持30种语言,无需语言标签即可生成语音。Apache-2.0许可,8GB显存可运行。支持文本描述创建新声音、可控克隆与终极克隆,保留说话人细节。输出48kHz音质,RTX 4090实时推理达0.3 RTF。兼容PyTorch、LoRA微调及Nano-VLLM部署,适用于影视、游戏、有声书等专业场景。

开源/仓库端侧语音
12:32
Hacker News 热门(buzzing.cc 中文翻译)
Show HN: Claudraband - 面向高级用户的 Claude 代码

Claudraband 是专为高级用户设计的 Claude Code 增强工具,针对专业开发者优化,已开源至 GitHub。

智能体Anthropic开源/仓库编码
04:33
Rohan Paul@rohanpaul_ai
Linux内核确立AI辅助编程政策:开发者须对AI代码承担全责

Linux内核项目本周正式确立政策,允许开发者使用AI辅助编写代码,但须遵守严格的信息披露要求。Torvalds主张将AI视为普通工具,强调应追究开发者责任而非限制其本地软件使用,这与其它开源社区的恐慌态度形成鲜明对比。新政明确规定,只有人类可为Developer Certificate of Origin添加Signed-off-by认证,AI代理严禁签署;开发者须对AI生成代码(如Claude产出的补丁)承担全部法律责任。此举旨在应对当前开源社区"AI slop"泛滥的乱象。

开源/仓库开源生态编码
4月12日
22:30
Nathan Lambert@natolambert
我和 @xeophon 将继续公开吐槽那些在开源模型许可证上犯错的公司。错误难免,但用了愚蠢的许可证就会被点名。赌 MiniMax 下次会修复,毕竟社区情绪对中国实验室目前至关重要。
开源/仓库开源生态
21:55
Hacker News 热门(buzzing.cc 中文翻译)
尽管使用频率不高,Pro Max 5x 的流量配额仍在 1.5 小时内用尽

Claude Code Pro Max 5x 用户反馈,在 moderate usage(中等使用强度)下,流量配额仅 1.5 小时即耗尽。该问题已提交至 GitHub issue,引发对配额限制合理性的质疑。

智能体Anthropic开源/仓库编码
4月11日
09:41
Hacker News 热门(buzzing.cc 中文翻译)
在为 Linux 内核做贡献时使用 AI 辅助

Linux 内核官方文档新增 coding-assistants.rst,明确贡献者使用 AI 辅助工具时的披露义务与代码审查标准,要求声明 AI 生成内容并确保符合内核编码规范,为开源大型项目整合 LLM 提供首个官方指引框架。

GitHub开源/仓库编码
4月10日
00:00
LMSYS:Blog(Chatbot Arena 团队)
HiSparse:分层内存系统加速稀疏注意力

LMSYS Org推出HiSparse分层内存系统,针对稀疏注意力仍受限于GPU内存容量的问题,将非活跃KV缓存卸载至主机内存,仅在GPU HBM保留热缓冲区,并通过专用CUDA内核高效管理数据交换(采用LRU策略与页表更新)。该系统在256并发请求下实现超3倍吞吐量提升,GLM-5.1-FP8模型长上下文场景性能提升达5倍,支持DeepSeek-V3.2等采用DeepSeek Sparse Attention架构的模型。

开源/仓库推理部署/工程
4月9日
17:30
公众号:通义实验室(千问)
56
VimRAG:图文视频全模态知识库开源框架

VimRAG 是一个开源框架,通过模态统一记忆技术,支持图文视频全模态知识库,告别分模态处理,实现一体化管理。

检索增强多模态开源/仓库
11:32
宝玉@dotey
baoyu-skills 发布 baoyu-slide-deck 工具,支持通过命令行基于 PDF 或素材文件生成手绘风格幻灯片。该功能实现了类似傅盛公司此前展示但未公开的手写画风 PPT 效果,现已开源在 GitHub 上供研究使用。

黑泽: @dotey 前几天,傅盛公司的人来我们公司讲他的小龙虾 PPT 是怎么做的。那时候给我们看他的 Skill,我还以为他们是公开的呢,结果只有这个没有公开。但是对他的那个手写的画风印象特别深刻,想要研究一下。这下宝玉老师出了这个 Skill...

智能体开源/仓库编码
07:18
karminski-牙医@karminski3
Agentshire发布3D AI Agent可视化插件,支持天气系统与NPC社交

Agentshire推出基于Three.js的3D AI Agent可视化插件,支持天气系统、昼夜循环及NPC自主社交功能。相比2D方案Star-Office-UI,该插件为多Agent协作任务提供更生动的三维演示场景。项目目前处于初期阶段,GitHub star数较少,建议谨慎评估后使用。

智能体开源/仓库
4月8日
23:56
Jeff Dean@JeffDean
受 Tail at Scale 论文启发的 Hedged requests 技术被用于单机 DRAM 多通道场景,通过向所有通道并发发送读取请求并采用最快响应,将 p99.99 读取延迟降低 5-15 倍。实现该方案的 tailslayer 项目已开源。
GitHub开源/仓库部署/工程
14:06
蚂蚁 inclusionAI:HuggingFace 新模型
34
inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目,旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛,促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架,强调协作与知识共享。此举预期将加速AI工具在多元领域的应用,并推动技术发展的透明性与包容性。

开源/仓库模型发布
12:16
Peter Steinberger 🦞@steipete
CodexBar 0.20 版本发布,新增 Perplexity 和 OpenCode Go 提供商支持,无需重新登录即可切换 Codex 账户,并修复 Claude token 重复计费导致的成本虚高问题。成本历史记录现支持合并会话数据,目前共追踪 16 家提供商。
智能体GitHub开源/仓库编码
05:41
SemiAnalysis@SemiAnalysis_
来自 GTC 演讲,NIXL 的维护者表示他们乐意接受 RIXL 补丁进入上游,就像他们已经接受 Trainium Neuron 支持补丁和 XPU 补丁进入上游一样。乐意在我们的 slack 中进一步交流,并将你介绍给合适的 NIXL 人员,这样你就不需要维护你的二等分支了 @KranenKyle。也许那些接受其他芯片厂商补丁进入上游的 NIXL 人员也可以把你介绍给 flashinfer 的人。

Anush Elangovan: @qubitium We tried. Happy to try again.

开源/仓库部署/工程
4月7日
17:26
蚂蚁 inclusionAI:GitHub 新仓库
54
inclusionAI/TC-AE

研究团队发布了TC-AE,一种用于深度压缩自动编码器的新方法,旨在突破现有模型的令牌容量限制。该方法通过创新的架构设计,显著提升了模型在压缩表示中保留信息的能力,实现了更高的压缩效率与重建质量。具体指标显示,TC-AE在多个基准测试中,相较于传统深度压缩自动编码器,将有效令牌容量提升了约30%,同时保持了较低的计算开销。这项工作为高密度数据压缩与表示学习提供了新的技术路径。

开源/仓库数据/训练论文/研究部署/工程
4月6日
22:30
Tibo@thsottiaux
OpenClaw 针对 GPT-5.4 完成重大优化,Peter 团队这波输出拉满。用户表示上次对发布这么兴奋还是当年追《权游》更新时。

Sujeeth: the last time I was this hyped for a release, it was GoT

智能体OpenAI开源/仓库编码
08:00
HuggingFace Daily Papers(社区热门论文)
SuperLocalMemory V3.3:"活脑"--生物启发式遗忘与认知量化的Zero-LLM智能体记忆系统

SuperLocalMemory V3.3("活脑")作为本地优先的Zero-LLM智能体记忆系统发布,实现完整认知记忆分类。核心创新包括:Fisher-Rao量化感知距离(FRQAD)以100%精度识别高保真嵌入;艾宾浩斯自适应遗忘曲线实现6.7倍区分力;7通道认知检索(语义、关键词、实体图、时间、扩散激活、巩固、Hopfield联想)在LoCoMo基准零LLM模式下达70.4%,多跳任务提升23.8个百分点。支持长时内隐记忆参数化与自动认知管道,纯CPU运行,月下载超5000次。

智能体arXivHugging Face开源/仓库
4月4日
01:29
François Chollet@fchollet
Keras 发布 Kinetic:一键部署云端 TPU/GPU 任务

Keras 社区发布 Kinetic 库,开发者通过装饰器即可将函数部署至云端 TPU/GPU 运行,定位类似 Modal 但新增 TPU 支持。该工具自动完成代码打包、Cloud Build 容器构建(支持缓存)、GKE 集群调度及结果返回,实现日志实时流式传输,使远程执行体验如同本地运行。

Google开源/仓库数据/训练部署/工程
00:37
François Chollet@fchollet
Keras 团队将于今天上午10点 PT 进行一场社区会议。还有25分钟开始。会议对所有人开放--欢迎加入了解最新功能和未来规划,并提出你的问题!
开源/仓库开源生态
4月3日
23:06
Deedy@deedydas
通过将 speculative decode 卸载至两片 2GB SRAM/chip 的 Corsairs 芯片,在标准 GPU 运行 gpt-oss-120b 时实现 10 倍延迟降低与超 1400 tokens/秒 的吞吐,额外硬件成本极低,性价比惊人。
开源/仓库部署/工程
16:39
karminski-牙医@karminski3
精选72
Gemma4有8个模型, 选哪个? 一文看懂!

Google发布的Gemma4系列开放权重模型包含多个版本,选型需结合场景。带“-it”后缀为指令微调版,开箱即用;不带后缀为基座模型,供自行微调。其中,A4B指激活参数量为4B,E4B则采用逐层嵌入技术,以内存换取计算量,优化移动端性能。选型建议:综合性能与速度选26B-A4B;追求最佳代码或任务效果选31B;开发本地全模态应用选E4B;资源受限设备体验可选E2B,但输出质量有限。

Google开源/仓库教程/实践端侧

推荐理由:Gemma 4 一口气出了 8 个变体,本地部署的人最怕选错模型白折腾,这篇把选型逻辑拆得明明白白,从龙虾助手到树莓派都有对应方案,抄作业就行。
4月2日
15:05
蚂蚁 inclusionAI:GitHub 新仓库
40
inclusionAI/cuLA:基于CuTe DSL与CUTLASS C++的线性注意力变体CUDA内核

inclusionAI发布了cuLA项目,这是一套为线性注意力变体编写的CUDA内核。该内核完全采用NVIDIA的CuTe DSL和CUTLASS C++库进行开发,旨在高效实现Transformer模型中的线性注意力机制。此举专注于底层计算优化,通过利用先进的CUDA编程抽象和高效模板库,有望提升大语言模型在推理和训练过程中的计算性能与效率。

开源/仓库数据/训练部署/工程
07:16
Tibo@thsottiaux
Codex 核心代码仓库 11 个月前就已公开却刚被发现。OpenAI 称决定开源是为促进早期生态发展并互相学习,差点忘了这茬。

Tibo: Whaaaa. Only realized now and apparently our repo was public since 11 months ago and noone told us?!

OpenAI开源/仓库开源生态编码
4月1日
23:03
Jim Fan@DrJimFan
精选
CaP-X开源发布:大模型智能体进入物理世界

CaP-X开源具身智能系统,让大模型智能体通过机械臂与人形机器人进入物理世界。系统整合SAM3、Molmo等感知API与IK求解器、抓取规划等控制接口,可自动合成技能库。研究发布CaP-Gym基准(187项操作任务)与CaP-Bench(评测12个前沿模型),提出零样本框架CaP-Agent0及强化学习方案CaP-RL,后者仅用50次迭代即将7B模型成功率从20%提升至72%。该技术由曾开发Minecraft智能体Voyager的团队推出。

智能体具身智能开源/仓库

推荐理由:NVIDIA Jim Fan 开源 CaP-X,让 Vibe Agent 真正进入物理世界操作机器人
3月31日
17:34
公众号:通义实验室(千问)
36
CoPaw 1.0 发布:定制小模型、安全机制与多智能体全面进化
产品更新开源/仓库端侧
‹ 上一页
1…1920212223…25
下一页 ›