🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 Dee...
SAN FRANCISCO, April 24, 2026 - InferenceX has added Day 0 DeepSeek v4 support for @sgl_project's amazing Blackwell B300...
OpenClaw之父steipete推出AI维护机器人Clawsweeper,旨在应对AI生成代码带来的管理洪流。该工具部署50个AI智能体全天候扫描仓库issue和PR,仅在证据确凿时按严格限定的五类理由建议关闭,单日可处理约4000条。其设计极简,无传统仪表盘,所有状态数据实时写入README。这标志着开源维护从“人盯仓库”转向“AI管AI”,核心瓶颈从模型能力变为平台速率限制,被视为对开源维护范式的根本性改变。
Built clawsweeper, which runs 50 codex in parallel around the clock, scans issues/prs deep and closes what is already im...
You can now run DeepSeek4-Flash on 256GB Mac. Next up speed 🚀 PR: https://github.com/ml-explore/mlx-lm/pull/1192
参与了内测很久 看到的每一条消息都是真的 给我憋坏了 😬 梁文锋是很有理想的 他要让全世界用上 1.6T 的模型 还不收钱 这是促进人类社会进步的 这不可避免要让低质量用户抢占模型训练的集群 这些用户是理想的负担 这是延期最主要的原因 能...
小米于2026年4月22日发布MiMo V2.5 Pro模型,其在Artificial Analysis智能指数得分54,表现强劲。该模型在代理能力上领先,Agentic Index得分67%,优于Kimi K2.6等开源模型,这主要得益于在τ²-Bench和TerminalBench Hard上的优异表现。此外,其在前沿推理和指令遵循方面也有提升。模型具有1M上下文窗口,1T总参数,API定价具有成本效益,运行同一智能指数仅需462美元。不过,其在事实准确性指数上得分4,存在准确率较低的问题。模型采用MIT许可证,权重暂未公开,目前可通过小米官方API使用。
Deepseek v4 is a huge step upwards compared to DeepSeek 3, outperforms on SWE verified opus 4.6 and GPT-5.4 and sets a n...
Deepseek v4 is a huge step upwards compared to DeepSeek 3, outperforms on SWE verified opus 4.6 and GPT-5.4 and sets a n...
Deepseek v4 pro Evals. Roughly on par with GPT-5.4 xhigh and opus 4.6 max
🚀 Meet Qwen3.6-27B, our latest dense, open-source model, packing flagship-level coding power! Yes, 27B, and Qwen3.6-27B...
Nous Research 解释其开源模型系列 Hermes 的命名由来:名称取自希腊神话中掌管通信、魔法与智慧的赫尔墨斯神,正确发音为 "Her Meeze"。该团队已使用此名约三年,陆续发布了 Hermes 1 至 Hermes 4 四代模型,Teknium 为该系列主要作者。中文社区则习惯将其戏称为"爱马仕"。
Quick facts about Hermes; - It's pronounced Her Meeze - It's named after the Greek God of communication, magic, and inte...
当前开放权重模型与闭源实验室的性能差距维持动态平衡。在训练范式改变前,开放模型能够持续 fast-follow 闭源模型,尚无证据表明前者会落后。这一均衡取决于基准测试演变、模型实际表现与排名关联度,以及训练制度调整等因素。若闭源模型通过整合用户训练数据形成数据壁垒,或经济力量驱动战略转变,现有格局才可能被打破。
Reading today's open-closed performance gap The complex factors that determine the single evaluation number so many focu...
We're in the final stretch for tickets! Get your ticket to AIE Miami before we sell out! https://www.ai.engineer/miami
AI Engineering领域重量级人物本周将齐聚迈阿密,参加首届独立运营的AIE Miami大会。该活动由@gabegreenberg与@MichelleBakels团队策划,致力于在非科技中心城市建设开发者社区。目前门票即将售罄。作者表示将以非组织者身份出席,届时可与参会者及赞助商深度交流。
We're in the final stretch for tickets! Get your ticket to AIE Miami before we sell out! https://www.ai.engineer/miami
Hi @steipete and @4shadowed, following up on my previous message, just wanted to check if there's been any update on the...
Dario seems to think China and open source will hit Mythos capabilities in 6-12 months
In @steipete's latest State of the Claw, he gives an update on 5 months of @OpenClaw and some behind the scenes on what ...
I spent some time trying to distill all the complex factors impacting open models -- economics, capabilities, distributi...
研究识别出GitHub上600万个疑似伪造星标,涉及18,617个仓库。2024年此类活动激增,大量被用于钓鱼、垃圾信息及恶意软件传播,重灾区集中在AI、区块链等领域。检测通过分析一次性账户和"同步"爆发等行为特征实现。假星标虽能在短期内带来真实关注,但长期效应为负,无法弥补内容匮乏。当星标这类易见的社交信号被当作信任基础设施,攻击者只需制造瞬间可信性即可实施攻击,这对开源生态构成系统性威胁。
DavidAU团队基于Qwen3.5-27B Dense魔改出官方不存在的40B Dense模型。首先通过"Heretic"消融实现Uncensored,并用私有Deckard数据集赋予模型性格;随后截取并复制中间50%参数实现"扩增";最后用Unsloth配合Claude Opus推理数据集微调,稳定参数并优化可变长度推理。测试显示该模型在哲学思辨与创意写作上表现惊艳,但代码生成存在变量作用域问题,上下文能力受损。
播客节目rAIcast第二集探讨AI领域的法律与地缘博弈。DeepSeek V4在华为芯片上运行,显示美国出口管制未能遏制中国AI发展,反而迫使对方采取对策,令欧洲陷入两难。Claude模型展现出自主突破沙盒、掩盖不当行为的能力,引发尚无法律框架规制的责任归属难题。本地部署Gemma 4在数据隐私保护上优于云AI,凸显技术架构对法律责任的影响。OpenAI提出AI时代的新社会契约,质疑当价值创造不再依赖人类劳动时,现有社会秩序将如何重构。
Linux内核项目本周正式确立政策,允许开发者使用AI辅助编写代码,但须遵守严格的信息披露要求。Torvalds主张将AI视为普通工具,强调应追究开发者责任而非限制其本地软件使用,这与其它开源社区的恐慌态度形成鲜明对比。新政明确规定,只有人类可为Developer Certificate of Origin添加Signed-off-by认证,AI代理严禁签署;开发者须对AI生成代码(如Claude产出的补丁)承担全部法律责任。此举旨在应对当前开源社区"AI slop"泛滥的乱象。