http://x.com/i/article/2069570049816530944
http://x.com/i/article/2069570049816530944
谷歌开发者关系工程师 Justin Poehnelt 今年 3 月初用 Rust 创建了 Google Workspace CLI,支持命令行操作 Gmail、Drive、Calendar 等服务并内置 MCP 服务器。项目发布后登顶 Hacker News,GitHub 获两万多星。谷歌内部反应两极:高管主动请教,法务质疑品牌色。4 月 22–24 日 Google Cloud Next 大会官方宣布即将推出官方 CLI,两天后 Justin 被开除。他怀疑管理层害怕被 AI agent 颠覆。项目仍在 Google GitHub 组织下正常维护(26000+ 星)。
Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...
Run Cline on Local AI models with Atomic Chat! @cline is a coding agent trusted by 8M+ developers. Write, refactor, ship...
一个4.6万星标、8千次分叉的MIT协议开源项目,提供免费AI投研系统。输入股票代码后,18位分别模仿巴菲特、芒格、木头姐、格雷厄姆等流派的智能体会自动抓取实时财报、新闻,依据各自投资哲学独立分析,风控模块排查仓位风险,最终由组合经理输出买卖持有结论,推理链完全透明。内置回测引擎、可视化网页界面,支持云模型或通过Ollama完全本地运行,核心基础数据永久免费,无需API密钥。
http://x.com/i/article/2069024565901119488
today, we release the open weights of Krea 2. welcome Krea 2 Raw and Krea 2 Turbo, an undistilled model from mid-trainin...
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)腾讯低调发布EdgeOne Makers平台,无发布会,仅一条推文和一个GitHub仓库。核心理念:让AI Agent一句话部署应用——通过CLI自动完成Git推送、CI/CD触发、边缘函数部署及预览链接生成,无需打开浏览器。底层标准化Skill系统支持边缘函数、云函数、KV存储等能力模块,Claude Code、Cursor等Agent可直接调用。GitHub已开源,支持Node.js、Go、Python云函数和V8边缘运行时,集成LangGraph、Claude SDK、OpenAI Agents等主流框架。这标志着云平台从为人设计转向为Agent设计。
Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...
EverOS 1.0.0是一款开源、本地优先的记忆操作系统,专为AI Agent提供跨会话持久记忆。其核心是将记忆存储为可直接cat、git、编辑的Markdown文件(唯一可信来源),配合SQLite管理状态、LanceDB处理向量/BM25索引及标量过滤,无需Docker或向量数据库集群。官方基准:LoCoMo 93.05%、LongMemEval‑S 83.00%、HaluMem约90%+。支持多模态摄取(PDF/图片/网页URL),任务可自我演化成可复用Skill,计划加入Knowledge Wiki和Reflection。用户通过CLI(everos init/server start)约30分钟上手。
Also, other multi-trillion-parameter open-source models are landing soon, from what I hear. It's going to be awesome for...
独立开发者用四款开源工具做出有记忆性格的数字分身,未依赖商业API。通过人格蒸馏将几百条笔记压缩成性格,搭配长期记忆和实时语音框架,延迟从8-20秒降至1秒内。换网红峰哥人格体验更佳,认为人格独特性而非万能温柔才是AI陪伴核心。
Exciting news: GLM-5.2 (Max) ranks #2 in Code Arena: Frontend, with +29pt over Claude Opus 4.7 (Thinking) and only behin...
Cline团队用自家仓库真实bug测试GLM-5.2和Claude Opus 4.8。Opus速度快3倍(1.6分钟vs 4.7分钟)、token少一半(660K vs 1.1M)、价格贵一倍($0.81 vs $0.41),修好bug但生产构建崩溃,留下类型错误。GLM多花67% token、多2.3倍工具调用(28次vs 12次)、价格便宜一半,不仅修好bug还主动清理死代码,构建干净通过。根本差异在于训练目标:GLM被强化学习训练出验证文化,多花token跑构建、查类型、防回归;Opus追求高效却忽略隐患。排行榜只测修bug能力,测不出是否破坏生产环境。开源模型GLM在长周期代码智能体上找到差异化优势。
We've kept hearing how GLM-5.2 beats Opus 4.8, and are skeptical of benchmarks - so we tested them on a real bug from th...
GLM-5.2(max)在真实世界智能体工作基准 GDPval-AA 上获 1524 Elo,排名第三,仅次于 Claude Fable 5(1783)和 Claude Opus 4.8(1615),与 GPT-5.5(xhigh,1509)持平。该模型以约 31 轮次任务平均完成零售主管任务清单、紧急停止电路图等交付物,领先开源权重模型(下一名 MiniMax-M3 仅 1408),并超过 Google Gemini 3.5 Flash(1357)、Qwen 3.7 Max(1289)等闭源模型。GLM-5.2 同时在 Artificial Analysis Intelligence Index、Agentic Index 和 AA-Briefcase 上领跑开源榜单。
GLM-5.2 leads open weights models and sits at #3 overall on GDPval-AA, a real-world agentic work benchmark GLM-5.2 from ...
Introducing GLM 5.2 for autoresearch GLM 5.2 is the first open weights model we've tried on our autoresearch pipeline th...
智谱 AI 的 GLM-5.2 在真实世界智能体工作基准 GDPval-AA 上获得 1524 Elo,排名第三,仅次于 Claude Fable 5 和 Claude Opus 4.8,与 GPT-5.5 持平。它是开源权重模型中领先的,超越 Gemini 3.5 Flash、Qwen 3.7 Max 等专有模型。任务为智能体型,平均每任务约 31 轮。此外,GLM-5.2 在 Artificial Analysis Intelligence Index 上也领先开源权重,并在 Agentic Index 和 AA-Briefcase 上均排名第三。
SpaceX has signed a $6.3 billion dollar compute deal with Reflection. Reflection will gain immediate access to GB300s to...
SpaceX完成857亿美元IPO后,与开源AI初创Reflection签署GPU计算租赁协议。Reflection自2026年7月起每月支付1.5亿美元,使用SpaceX Colossus数据中心的Nvidia GB300集群,若延续至2029年总支付约63亿美元,协议可于3个月后提前90天取消。Reflection采用B2B/B2G开放权重模式,构建前沿模型并向政府、国家实验室和企业出售定制化部署。该集群用于训练基础模型并适配科学和国家安全场景。Anthropic切断Fable和Mythos服务后,Reflection强调关键AI客户不应依赖可被撤销或受限的闭源供应商。
SpaceX just announced its first investment-grade bond sale after its record $85.7B IPO last week. The company is issuing...
商汤SenseTime在推文中感谢@xCreate对SenseNova U1的深入解读,该模型具备强大的文本-图像交织推理与信息图生成能力。推文附有YouTube视频演示,并提供了SenseNova Studio在线试用链接、HuggingFace模型集合、GitHub本地运行指南及Discord社区入口,方便用户试用和部署。
GLM-5.2 is the step change for open agents A capability threshold I've been carefully monitoring. https://www.interconne...
TMax 是面向终端任务的开源 RL 配方,基于 Qwen 3.5 较小密集模型,在默认设置和 65k token 预算下超越此前开源工作。训练需 8 节点 H100(2 训练+6 推理)运行 2-3 天,配方经约 100 次训练才稳定。发布模型权重、数据及训练 rollouts。配方工作强调从零获得初始基线成本高昂(1 万至百万美元),需要明确决策阶梯和稳定性改进。
Trained some terminal agents with friends! Introducing Tmax, open RL terminal agent models. Under default settings and s...
智谱年初上市,股价从约131.50 HKD涨至约2,094 HKD,YTD涨幅约1,492%。背后由GLM-5.2与Fable 5测评对比驱动:同一任务下GLM-5.2效果达Fable 5九成,但价格不到$0.10(Fable 5约$5),价差五十倍。该对比改变了设计探索默认选项——当开源模型做到“够好且便宜到可以随便用”,用户优先选择低成本方案。GLM-5.2此次正好踩上这条线。
难怪今天智谱股票突突突疯长26%, 刚刷到一个GLM-5.2和Fable 5的测评, 同一个任务,同一句 prompt,同一张参考图, Fable 5 确实更精致,间距、质感、整体完成度, 一眼就能看出差距, 但 GLM-5.2 做出来的东...
The other open source models are clawing market share back from DeepSeek
Hermes Bible 将 Hermes Agent 169 页官方文档整合一体,提炼出 24 个可直接抄的真实工作流(如 Jira 到 PR 自动过渡),支持 ⌘K 即时搜索定位章节,社区可分享工作流并展示个人资料页。解决官方文档分散、优质工作流沉没在 X 和 Discord 的问题。
http://x.com/i/article/2042547855865585664
linus was the original vibe coder before it was cool. dude just posts an angry email on the mailing list describing what...
GLM 5.2 is now on DeepSWE as the top open-source model on our leaderboard. With a pass@1 score of 44% at max effort, GLM...
Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.
Greg 列出当下最有价值的六项技能:搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛,纯写提示词或代码贬值,真正拉开差距的是打通 builder 与 distributor 全链路。具体解读:本地部署保留应急控制权;内容策展是稀缺筛选力;管理 agent 需监控重试。建议三件事:迁核心工作流到本地并搭观测面板;精准分发产品给 20 个潜在用户;线下聊天获真实反馈。
The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...
同一任务、同一 prompt、同一参考图下,GLM-5.2(价格 <$0.10)效果接近 Fable 5(约 $5)的九成,价格仅为后者五十分之一。作为最强开源模型,GLM-5.2 体积从 1.5TB 压缩 84% 至 238GB,可在 256GB Mac 本地运行,保留 82% 能力。当开源模型跨过“够好且便宜到随便用”的线,设计探索第一步的默认选项可能从 Fable 转向 GLM-5.2。
把 1.5TB 的模型剁掉 84% 的体积,塞进本地跑,还剩 82% 的功力, 这就是GLM-5.2,最强开源模型, 现在缩骨到了 238GB,256GB 的 Mac 或者同档 RAM/VRAM 的机器就能带起来了 技术博客:http://...
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。
Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...