Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。
现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。
根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。
当前,各类AI产品正不断涌现,致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台,能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流,实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员,据用户反馈每周可节省超过20小时,而成本仅为雇佣真人团队的十分之一。
Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。
关联讨论 2 条X:阿易 AI Notes (@AYi_AInotes)Anthropic:Newsroom(网页)Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。
Even Realities推出的G2智能眼镜具备“终端模式”,可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景(如散步、通勤)中通过语音与AI交互,实时获取代码、设计规范等内容,实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本,将碎片时间转化为生产力,被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧,但这代表了程序员工作流的革命性变革,被形容为“巅峰性能”和“新物种”的诞生。
企业AI编排平台Workflows发布公开预览版,旨在解决企业团队将AI模型可靠投入生产环境的难题。该平台专注于为AI赋能的业务流程提供生产环境所需的持久性、可观测性和容错能力,帮助其从原型阶段过渡到实际生产。包括ASML、ABANCA、CMA-CGM在内的多家领先机构已使用Workflows来自动化其关键流程。
ColaOS产品负责人决定在ColaOS中免费提供DeepSeek V4模型,而非仅提供官方2.5折优惠。面对内部对高昂模型成本的担忧,负责人给出了一个“无法拒绝的理由”,最终团队达成妥协,将免费使用期限设定为五一假期结束前。推文同时提供了下载地址(目前仅支持Mac)和一个用户邀请码。
当前图像生成产品主要分为追求单次生成效果极致与打通完整视觉工作流两大方向。Flowith属于后者,其推出的Image Agent不仅能够生成高质量图像,更核心的价值在于构建了稳定的视觉工作流体系。该平台底层集成多个模型(如Image2等),且上层工作流架构设计稳健,不受底层模型更换的影响。它能将单一文本提示转化为完整的营销活动工作流,提供可放大的细节、有效的文字渲染、具备搜索感知的创意智能,并能通过Seedance 2.0技术将图像转化为视频,从而成功融合了“单点极致”与“工作流闭环”两种路径,为用户提供了显著的综合价值。
OpenAI 开源了Codex编排规范Symphony,其核心是将Linear等任务追踪系统转变为AI agent的自动化控制平面。该规范让每个未解决的任务自动分配一个独立的agent工作区,持续执行直至完成,实现了工作流与具体会话和PR的解耦。这显著降低了代码变更与试错的成本,并允许产品经理等非技术人员直接通过看板发起工作。OpenAI强调,其目标是展示如何将团队隐式工作流程文档化,让agent遵循人类约定,并将失败案例转化为系统防护栏与技能,推动开发瓶颈从“写代码”转向“管理agent化的工作”。
关联讨论 2 条X:Vista (@vista8)OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI开源代理编排器Symphony,将Linear、GitHub Issues等任务跟踪器转化为始终在线的Codex Agent调度系统。它突破了人类同时有效监督仅3-5个编码Agent的瓶颈,允许管理几十个Agent,实现自动编码、测试、交叉审查,并提交包含CI全绿和安全审查的证据包。所有验证通过后,任务才进入Human Review队列,使人类角色从微观监督转变为结果审查与指导。OpenAI内部已实践此模式,三名工程师五个月生成一百万行代码且零人工编写。未来核心竞争力在于设计让Agent可靠自主工作的环境,而非模型本身。Symphony是一个17k token的SPEC,可喂给任何编码Agent生成定制版本。
关联讨论 2 条X:Vista (@vista8)OpenAI:官网动态(RSS · 排除企业/客户案例)受传统教育影响,个人不信算命。 但身边不少朋友对这方面有专研,听过好多离奇的故事。 三年前在飞书工作时认识一个朋友叫西元Levy。 他做了个App叫 @Fa…
小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T …