埃隆·马斯克阐述其创立OpenAI的动机源于与拉里·佩奇在人工智能安全风险上的分歧。佩奇对AI潜在危险不够重视,甚至称更关注人类利益的马斯克为“物种主义者”。这促使马斯克决心建立一股制衡Google的力量,其核心形式是一个开源、非营利的组织,这也是“Open”一词的初衷。马斯克投入个人资金、招募团队、传授知识并促成微软合作,但拒绝接受任何股份或财务回报,坚信非营利组织不应成为个人致富的工具。
小米正式开源MiMo-V2.5系列模型,采用MIT许可证,允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口:MiMo-V2.5-Pro专为复杂Agent和编码任务设计,在开源模型的GDPVal-AA和ClawEval基准测试中排名第一;MiMo-V2.5是原生多模态模型,具备强大的Agent能力。小米强调,模型的价值不应仅由排行榜衡量,而应取决于其解决实际问题的能力。
一个完全本地的 Agent,就生活在你的浏览器里。 由 Gemma 4 E2B 和 WebGPU 驱动,它使用原生工具调用来实现: 🔍 搜索浏览历史 📄 阅读并总结页面内容 🔗 管理标签页 100% 本地运行!无需任何服务器!
OpenAI与微软重新谈判合作协议,核心变化在于解除了对Azure云的独家依赖。根据新协议,微软仍是OpenAI的主要云合作伙伴,产品优先在Azure上线,但若微软无法支持特定能力,OpenAI可将服务部署到任何云平台。IP授权延续至2032年,但由独家转为非独家,OpenAI可向其他公司授权技术。财务安排上,微软不再向OpenAI支付分成,而OpenAI向微软的分成持续至2030年并设有上限。此举为OpenAI的IPO铺平道路,企业客户未来可通过AWS或Google Cloud等平台使用其服务,微软则以股东身份继续受益。
关联讨论 3 条Simon Willison 博客OpenAI:官网动态(RSS · 排除企业/客户案例)Hacker News 热门(buzzing.cc 中文翻译)Intel的EMIB封装技术被外部客户如Google的TPU采用,但Intel自身产品正转向UCIe技术。Diamond Rapids预计使用UCIe over substrate实现长距离die-to-die互连。在ISSCC上,Intel展示了UCIe-S D2D链接,在22nm工艺下达到48 Gb/s/lane,距离达30mm,数据率和带宽密度优于3nm设计。substrate配置为5-2-5,而EMIB为11-2-11。由于substrate短缺,Intel的“最佳”封装技术对除Intel外的客户更具优势。
作者以国防工业为镜,揭示西方因长期“优化”导致关键能力流失的深层危机。雷神公司重启“毒刺”导弹生产线需召回70多岁老工程师,依赖卡特时代的图纸,新订单交付需4年。欧盟承诺的百万发炮弹交付严重延期,暴露出整个国防工业供应链存在大量单点故障,且缺乏大规模生产与应急能力。这种模式源于冷战后的“和平红利”政策,导致企业合并、劳动力锐减。类似地,核材料Fogbank的制造工艺也曾因人员流失而几乎失传。作者指出,软件行业正重蹈覆辙:过度依赖AI编程工具可能导致初级工程师培养断层和“理解力危机”。重建能力需要数年甚至数十年,核心限制并非资金,而是知识与经验传承的断裂。当前市场已极度缺乏兼具技术能力与独立判断力的人才。
最新研究发现,企业为提升精确性而微调RAG嵌入模型,可能导致检索质量下降高达40%。其核心矛盾在于,单个密集嵌入向量被同时要求承担广泛主题召回和精确语义判别的双重任务。当强制模型区分细微结构差异(如否定、语序颠倒)时,会损害其跨领域聚合相关材料的能力。解决方案是采用两阶段检索:先用嵌入模型快速召回,再通过能感知结构的词元级比对来验证候选结果。这揭示了“几乎相同的句子”与“相同含义”本质不同,在合同、合规等高精度领域混淆二者将导致系统关键失效。
GitHub Copilot 将于6月1日起改用基于AI积分的用量计费模型,以支持更多Agent和高级工作流。各档订阅价格不变,每月赠送等额积分,代码补全等基础功能不消耗积分。新规则按Token消耗计费,积分用尽后无降级选项,代码审查会额外消耗Actions时长。企业用户有三个月过渡期及积分池福利。5月初将上线账单预览功能,年付和轻度用户受影响小,但重度用户需关注成本变化。
关联讨论 1 条Hacker News 热门(buzzing.cc 中文翻译)AI应提升人类思维,而非取代。当前LLMs默认不支持此功能,需用户构建agent harness(包括检索、验证、记忆等架构)来增强辅助能力。agent harness至关重要,即使简单技能也能显著提升LLMs的"human-centered augmenting"能力。持续学习前景广阔但尚处早期,上下文学习更为有效。用户需主动优化工作流程以引导LLMs,而自我改进代理因激励不足效果有限。最佳实践是重用LLM输出,让AI持续为用户服务,并通过每次交互提升双方能力。最终,用户需亲自构建定制化AI工具,而非等待他人开发。
用户对Cursor 3的反馈显示,核心诉求已超越“AI辅助编码”,转向构建一个可靠、可控的AI开发工作流。主要需求包括:Agent功能需与IDE无缝融合,保留完整的开发工具链;支持多Agent协作与可视化进度管理;深度集成并产品化Git、Worktree和PR工作流;解决信息架构与导航痛点,升级为任务记忆系统;确保键盘优先操作与高度自定义;提升基础稳定性和性能以建立信任;增加模型选择与成本透明度;加强扩展、MCP及外部工具集成,成为开发自动化中枢;提供移动端以远程监管Agent;以及强化前端与设计工作流的集成能力。用户期望Cursor 3能演变为管理AI工程团队的稳定主界面。
OpenAI据传正探索开发一款以AI代理为核心操作模式的智能手机,旨在取代传统应用模型。公司计划与联发科、高通及立讯精密合作设计定制移动芯片,以优化能效与云端协同,并已吸纳Jony Ive的设计团队。该设备计划于2026年下半年发布,其核心逻辑是通过软硬件垂直整合,让AI代理跨消息、位置、日历等多维度上下文直接执行任务,突破苹果与谷歌对应用权限的限制。技术架构预计采用本地轻量模型实现低延迟响应,结合云端模型处理复杂推理,以打造能深度感知与推断的个人智能助手。
OpenAI修订与微软的合作协议,结束独家云合作关系,未来可将其服务部署于亚马逊云等平台。微软保留至2032年的非独家模型许可以及至2030年的有上限收入分成。此举削弱了微软的稀缺性优势,引发其股价下跌,但有助于微软释放资本投入Copilot并缓解反垄断压力。亚马逊成为明确赢家,其AWS从备用基础设施转为OpenAI的前线平台;谷歌云也获得了竞争OpenAI工作负载的机会。OpenAI创始人确认微软仍是其主要云合作伙伴,但产品将扩展至所有云平台。
关联讨论 3 条Simon Willison 博客OpenAI:官网动态(RSS · 排除企业/客户案例)Hacker News 热门(buzzing.cc 中文翻译)