harness框架通过AI Agent实现游戏内容全自动生成与验证。该系统基于SCP数据库扩展关卡,自动生成物品与任务道具,并集成AI绘图与TTS配音管线。核心创新在于内置沙盒环境(无头游戏模式),允许AI在命令行中自动验证关卡可玩性,根据约束条件修正数值。开发者强调,框架目前解决的是工程层面的"可玩性",而创意层面的"好玩性"仍需人工把控。项目后续将开源。
harness框架通过AI Agent实现游戏内容全自动生成与验证。该系统基于SCP数据库扩展关卡,自动生成物品与任务道具,并集成AI绘图与TTS配音管线。核心创新在于内置沙盒环境(无头游戏模式),允许AI在命令行中自动验证关卡可玩性,根据约束条件修正数值。开发者强调,框架目前解决的是工程层面的"可玩性",而创意层面的"好玩性"仍需人工把控。项目后续将开源。
Unsloth团队发布Qwen3.6-35B-A3B 2bit动态量化版本,模型体积仅12.3GB且激活内存仅需1GB,可在32GB Mac上流畅运行。测试显示该版本支持30余次工具调用,相较之下前代Qwen3.5-35B-A3B的8bit版本仅能完成4-5次调用即出现性能衰减。这一突破意味着大模型在端侧设备上的实用性和多步骤任务处理能力获得显著提升。
FlashInfer开源近1400个TRT-LLM-Gen高性能GPU内核,针对LLM推理优化。以W4A16量化GEMM为例,采用INT4权重与BF16激活,通过3级流水线及Warp专精化(加载、反量化、MMA、Epilogue)提升并行效率。因INT4反量化需CUDA核心处理寄存器,MMA被迫使用TS模式而非TMEM,导致SMEM带宽瓶颈。方案借鉴Cursor设计,通过流水线隐藏CUDA与Tensor Core计算差距,缓解吞吐量损失。
Trtllmgen kernels are now open. Fastest prefill and decode kernels for our target workloads. We wrote these to win Infer...
Hyperframes推出全新开源视频渲染框架,支持AI智能体通过编写HTML直接生成MP4视频。该框架无需学习新语言,仅在标准网页代码中添加data-*属性,即可让Claude Code、Cursor、Gemini CLI、Codex等编程智能体创建、预览并本地渲染视频合成内容。智能体负责编写HTML构图,Hyperframes提供浏览器预览和MP4渲染能力,实现从代码到视频的无缝转换。
http://x.com/i/article/2044724546637619200
HeyGen开源AI视频渲染框架HyperFrames,支持AI代理将HTML/CSS/JS代码转为MP4等格式。该工具摒弃传统时间线,利用数据属性控制动画时序与图层,兼容GSAP、Lottie、Three.js等Web动画库。HeyGen团队已使用Claude Code配合该框架完成官方视频制作。开发者可通过npx命令安装,实现代码到视频的自动化生成。
We built our launch video in Claude Code using HyperFrames. Now it's yours. Open source, agent-native framework. HTML to...
DavidAU团队基于Qwen3.5-27B Dense魔改出官方不存在的40B Dense模型。首先通过"Heretic"消融实现Uncensored,并用私有Deckard数据集赋予模型性格;随后截取并复制中间50%参数实现"扩增";最后用Unsloth配合Claude Opus推理数据集微调,稳定参数并优化可变长度推理。测试显示该模型在哲学思辨与创意写作上表现惊艳,但代码生成存在变量作用域问题,上下文能力受损。
BlockNote是基于React的开源富文本编辑器,采用Notion风格Block模式,基于ProseMirror和Tiptap构建。通过高层封装显著降低集成门槛,几行代码即可部署完整UI。核心亮点是原生AI支持,可接入OpenAI等模型实现写作辅助。协议分层需注意:核心功能采用MPL-2.0允许商业自由使用,但AI集成等xl-系列高级包基于GPL-3.0,闭源项目需购买商业许可。适合追求快速落地的CMS、知识库等场景。
OpenClaw 2026.4.14 🦞 More reliability updates: ✨ Smarter GPT-5.4 routing and recovery 🌐 Chrome/CDP improvements 🧵 Sub...
Strix 是开源自主渗透测试框架,以 AI 作为确定性安全工具之上的自适应操作员。其核心机制围绕动态测试、POC 验证、自动修复 Pull Request 和 CI/CD 钩子构建,可在代码合并前阻断不安全代码。不同于传统扫描器仅抛出猜测,Strix 采用攻击者风格测试,通过浏览器操作、流量检查等方式验证漏洞可利用性,使安全发现附带证明和修复方案直接融入开发流程。
http://x.com/i/article/2043500390885494784
OpenBMB发布开源TTS模型VoxCPM 2,仅2B参数支持30种语言,无需语言标签即可生成语音。Apache-2.0许可,8GB显存可运行。支持文本描述创建新声音、可控克隆与终极克隆,保留说话人细节。输出48kHz音质,RTX 4090实时推理达0.3 RTF。兼容PyTorch、LoRA微调及Nano-VLLM部署,适用于影视、游戏、有声书等专业场景。
Linux内核项目本周正式确立政策,允许开发者使用AI辅助编写代码,但须遵守严格的信息披露要求。Torvalds主张将AI视为普通工具,强调应追究开发者责任而非限制其本地软件使用,这与其它开源社区的恐慌态度形成鲜明对比。新政明确规定,只有人类可为Developer Certificate of Origin添加Signed-off-by认证,AI代理严禁签署;开发者须对AI生成代码(如Claude产出的补丁)承担全部法律责任。此举旨在应对当前开源社区"AI slop"泛滥的乱象。
@dotey 前几天,傅盛公司的人来我们公司讲他的小龙虾 PPT 是怎么做的。那时候给我们看他的 Skill,我还以为他们是公开的呢,结果只有这个没有公开。但是对他的那个手写的画风印象特别深刻,想要研究一下。这下宝玉老师出了这个 Skill...
Agentshire推出基于Three.js的3D AI Agent可视化插件,支持天气系统、昼夜循环及NPC自主社交功能。相比2D方案Star-Office-UI,该插件为多Agent协作任务提供更生动的三维演示场景。项目目前处于初期阶段,GitHub star数较少,建议谨慎评估后使用。
@qubitium We tried. Happy to try again.
the last time I was this hyped for a release, it was GoT
Keras 社区发布 Kinetic 库,开发者通过装饰器即可将函数部署至云端 TPU/GPU 运行,定位类似 Modal 但新增 TPU 支持。该工具自动完成代码打包、Cloud Build 容器构建(支持缓存)、GKE 集群调度及结果返回,实现日志实时流式传输,使远程执行体验如同本地运行。
Google发布的Gemma4系列开放权重模型包含多个版本,选型需结合场景。带“-it”后缀为指令微调版,开箱即用;不带后缀为基座模型,供自行微调。其中,A4B指激活参数量为4B,E4B则采用逐层嵌入技术,以内存换取计算量,优化移动端性能。选型建议:综合性能与速度选26B-A4B;追求最佳代码或任务效果选31B;开发本地全模态应用选E4B;资源受限设备体验可选E2B,但输出质量有限。
Whaaaa. Only realized now and apparently our repo was public since 11 months ago and noone told us?!
CaP-X开源具身智能系统,让大模型智能体通过机械臂与人形机器人进入物理世界。系统整合SAM3、Molmo等感知API与IK求解器、抓取规划等控制接口,可自动合成技能库。研究发布CaP-Gym基准(187项操作任务)与CaP-Bench(评测12个前沿模型),提出零样本框架CaP-Agent0及强化学习方案CaP-RL,后者仅用50次迭代即将7B模型成功率从20%提升至72%。该技术由曾开发Minecraft智能体Voyager的团队推出。
😅嗯,bb-browser,badboy browser,坏孩子浏览器来了,真的很丧良心,但真的很好用。 现在你可以用 bb-browser site 的方式直接拉到任何网站的信息,目前支持 Reddit、Twitter、GitHub、H...
A breakthrough in real-time video generation. As a research preview developed with @NVIDIA and shared at @NVIDIAGTC this...
Project Solaris提出世界建模的本质在于全局共享状态而非局部像素渲染,推出基于Minecraft的多人在线视频世界模型。该系统突破单智能体视角局限,支持任意数量智能体随时介入交互,实现持久化世界状态演化。核心包含三大组件:Solaris Engine多人数据收集系统、基于DiT架构的Solaris Model(采用新型内存高效自强制设计,训练于1260万帧协调游戏数据)、以及使用VLM评判的Solaris Eval评估体系。这一范式转变为构建神经MMORPG服务器奠定基础。
📢Current world models aren't really modeling the world; they're modeling one agent's view of it. Partial observations ≠...
The famed Stanford Smallville is officially open-source! 25 AI agents inhabit a digital Westworld, unaware that they are...
研究探讨了基于强化学习的LLM游戏后训练能否泛化到其他任务。在相同任务族内(如6×6推箱子泛化至8×8版本),训练带来了高达56%的性能提升。但在跨领域任务中,效果有限或不稳定:Blocksworld有小幅提升,WebShop有约6%但不稳定,GSM8K则无改善。研究团队为此提出了GRL框架,这是一个以智能体为中心的多轮强化学习框架,旨在高度定制LLM与环境的交互,以系统研究泛化能力。
The tech preview of LLMD is out: - Easy Setup - Just mount your model and run - Cross-Platform GPU Support - Single cont...
The code and instruction-tuning data for MetaQuery are now open-sourced! Code: https://github.com/facebookresearch/metaq...
Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinit...
Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinit...
We are open-sourcing all the models in Web-SSL, from ViT-L to ViT-7B! It was super fun to train and play with these mass...
DeepSeek发布开源并行文件系统3FS(Fire-Flyer File System),专为现代SSD和RDMA网络优化。180节点集群可实现6.6 TiB/s聚合读取吞吐量,25节点GraySort测试达3.66 TiB/min,单节点KVCache查找峰值超40 GiB/s。采用分离式架构与强一致性语义,支持训练数据预处理、检查点存取及V3/R1推理的KVCache查找。同步开源Smallpond数据处理框架。