甲骨文(Oracle)在最近12个月内裁员13%,员工数从16.2万降至14.1万,并在年度SEC 10-K文件中将AI部署列为部分原因。同期重组费用从3.74亿美元飙升至18亿美元,资本支出增长162%至557亿美元,自由现金流转为负237亿美元。
甲骨文(Oracle)在最近12个月内裁员13%,员工数从16.2万降至14.1万,并在年度SEC 10-K文件中将AI部署列为部分原因。同期重组费用从3.74亿美元飙升至18亿美元,资本支出增长162%至557亿美元,自由现金流转为负237亿美元。
Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...
Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...
Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...
腾讯低调发布EdgeOne Makers平台,无发布会,仅一条推文和一个GitHub仓库。核心理念:让AI Agent一句话部署应用——通过CLI自动完成Git推送、CI/CD触发、边缘函数部署及预览链接生成,无需打开浏览器。底层标准化Skill系统支持边缘函数、云函数、KV存储等能力模块,Claude Code、Cursor等Agent可直接调用。GitHub已开源,支持Node.js、Go、Python云函数和V8边缘运行时,集成LangGraph、Claude SDK、OpenAI Agents等主流框架。这标志着云平台从为人设计转向为Agent设计。
KroWork 新发布,解决 AI 智能体每次运行后会话即失效的痛点。用户用自然语言描述任务,AI 自动构建工作流并保存为可重用的桌面应用,无需编程背景。应用完全本地运行,数据不出设备。相比一次性回答,它生成持久、可复用的软件——例如一句指令即可生成免费市场监控应用,替代分散的付费工具。KroWork 将“氛围编码(vibe-coding)”转变为“结果编码(outcome-coding)”。
EverOS 1.0.0是一款开源、本地优先的记忆操作系统,专为AI Agent提供跨会话持久记忆。其核心是将记忆存储为可直接cat、git、编辑的Markdown文件(唯一可信来源),配合SQLite管理状态、LanceDB处理向量/BM25索引及标量过滤,无需Docker或向量数据库集群。官方基准:LoCoMo 93.05%、LongMemEval‑S 83.00%、HaluMem约90%+。支持多模态摄取(PDF/图片/网页URL),任务可自我演化成可复用Skill,计划加入Knowledge Wiki和Reflection。用户通过CLI(everos init/server start)约30分钟上手。
日本团队 Sakana AI 推出 Fugu(Fugu Ultra),一个仅 0.6B 参数的多智能体编排系统,通过统一 API 调用。它不是单体大模型,而是 AI“项目经理”:简单任务自处理,复杂任务自动拆分,从全球模型池选择模型分配思考、执行、验证角色,多轮协作输出答案。编排策略由训练生成,而非手工 prompt。Fugu Ultra 在多个基准上超过 Claude 和 GPT,性能匹敌 Fable 和 Mythos,绕开 scaling law 军备竞赛。缺点包括黑箱性、复杂任务延迟高、简单任务成本更高。此举标志着多智能体编排从实验室走向可用生产力工具,开启编排层赛道。
Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...
火山引擎在FORCE大会上展示YoooClaw C-ONE,一款卡片大小的「AI记忆卡」。它能录音转文字,也能抓取手机通知实时喂入,两路数据汇入火山引擎的ArkClaw做抽取和推理,形成个人知识大脑。出口端打通飞书,例如老板开完会后一句话即可将任务分别推送给对应同事。推文作者称这是除seedance2.5外今次最心动的产品。
SpaceX has signed a $6.3 billion dollar compute deal with Reflection. Reflection will gain immediate access to GB300s to...
Samsung rolls out ChatGPT Enterprise and Codex to all staff in Korea and DX division staff globally; OpenAI says it's on...
OpenAI Daybreak 计划更新,推出 Codex 安全插件和专属 GPT-5.5-Cyber 模型,实现从漏洞发现到补丁生成的自动闭环,将以往数周乃至数月的修复时间压缩至数小时。该模型已为 Linux 内核、FreeBSD、cURL、Go、Python、Sigstore、pyca/cryptography 等关键项目发现并生成补丁。GPT-5.5-Cyber 仅限经验证的防御者进行授权渗透测试。此举大幅压缩零日漏洞攻击窗口,但 AI 补丁可能引入新问题,未来或需更高阶 AI 监督修复进程。
We're accelerating patching, in addition to vuln finding, with new tools and models in OpenAI Daybreak. Our models are n...
SemiAnalysis发布CUDA MOAT警报:在不到70天内,通过纯软件优化,Kimi架构(与xAI的Cursor Composer 2.5相同模型架构)在GB200 NVL72上的服务成本降低2.5倍。关键优化是使用CuTe-DSL重写NVFP4 MoE kernel,作为现有宽专家并行优化的补充。该优化利用了NVL72的铜背板,带宽是标准RoCEv2/InfiniBand的18倍。此项工作由Xin Li、Jun Yang及NVIDIA团队完成。
Delos发布Workers,将AI智能体转化为拥有专属邮箱、电话、Slack、Teams、电脑、记忆及公司训练的“数字员工”。每个Worker针对单一企业训练,学习其常规、工具、词汇、权限和交接模式。核心是持久身份与长期记忆,使同事可像联络人类同事一样找到它,并信任其记住过往决策与客户上下文。引用推文透露上线数天内已实现100万美元ARR,指出大多数知识工作本不该存在——大量工作仅为流程(回复邮件、跟进、更新CRM等),而Workers能像人类队友一样跨组织执行任务,软件与劳动力界限消失。
Introducing Workers: unlimited AI employees that run your company... And we've just made $1M ARR in a couple of days. Mo...
Micron与Anthropic签署多年期HBM、DRAM和SSD合作协议,双方将围绕Claude工作负载共同设计内存和存储架构。Micron既是Anthropic的投资者(参与Series H融资)、客户(内部部署Claude)和供应商,又是合作伙伴。这一深度绑定将AI基础设施的垂直整合从计算层延伸至内存存储层,预示硬件巨头与前沿实验室的生态闭环趋势。
SpaceX完成857亿美元IPO后,与开源AI初创Reflection签署GPU计算租赁协议。Reflection自2026年7月起每月支付1.5亿美元,使用SpaceX Colossus数据中心的Nvidia GB300集群,若延续至2029年总支付约63亿美元,协议可于3个月后提前90天取消。Reflection采用B2B/B2G开放权重模式,构建前沿模型并向政府、国家实验室和企业出售定制化部署。该集群用于训练基础模型并适配科学和国家安全场景。Anthropic切断Fable和Mythos服务后,Reflection强调关键AI客户不应依赖可被撤销或受限的闭源供应商。
SpaceX just announced its first investment-grade bond sale after its record $85.7B IPO last week. The company is issuing...
SpaceX与AI初创公司Reflection签订AI算力交易,每月1.5亿美元,至2029年合约总价值约63亿美元。Reflection将获得SpaceX的Colossus AI数据中心提供的算力,并使用英伟达最新GB300 AI芯片。付款自2026年7月1日起,双方在首三个月后均可提前90天通知终止协议。AI基础设施正成为SpaceX的重要新业务。
教程演示如何将免费或低成本模型接入沉浸式翻译。步骤:设置→翻译服务→添加自定义翻译服务→选择“自定义AI”→填入API Key和接口地址(以小米MiMo为例,Base URL: https://api.xiaomimimo.com/v1/chat/completions)→选择对应模型(可勾选“输入自定义模型名称”)→点击测试服务,通过即完成配置。后续可在服务选项中切换使用自定义模型。全程视频演示。
http://x.com/i/article/2068948931959255040
蚂蚁百灵在OpenRouter上架Ling & Ring 2.6系列模型。Ring-2.6-1T和Ling-2.6-1T定价:输入$0.075/1M tokens,输出$0.625/1M tokens,缓存读取$0.015/1M tokens。Ling-2.6-flash版价格更低:输入$0.01/1M tokens,输出$0.03/1M tokens,缓存读取$0.002/1M tokens。该系列面向真实智能体工作流与复杂任务,主打高效智能,提供最高90%限时折扣,优惠持续至7月31日。
Netflix 工程师开源 Headroom,在 Codex、Cursor 等 AI 编码工具外包围本地 Agent,自动压缩日志、JSON 和代码,保留逻辑准确性,减少 95% token 消耗。数据本地化,无需改代码,已获 35k GitHub 星标。核心将降本从改提示词、换模型转向输入前置处理。
摩根士丹利开始向数据中心开发商推销杠杆贷款市场。继投资级债券、项目融资、私人信贷、高收益债之后,通常用于LBO的杠杆贷款也涌入AI基建。摩根士丹利预计2026年AI相关债务发行或超5700亿美元,截至5月底已达约2360亿美元,是去年同期的4倍。NYU教授Damodaran对比互联网泡沫指出,AI资本支出规模史无前例,且大量由债务而非股权融资,一旦调整,违约将蔓延至社会,风险远超股价暴跌。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Cognite CTO Geir Engdahl接受专访指出,工业AI失败的根源并非模型层,而是工厂现场运营。许多惊艳的AI试点无法在实际运营中存活,因为缺乏真正上下文——当错误可能带来危险时尤为关键。他探讨了工业智能体应在何时推荐、自动化或保持不介入,强调工作演示与可信系统之间存在巨大鸿沟。他预测,到2028年未采用AI驱动流程优化的工业企业将面临严峻挑战。这是一场务实、少谈噱头的对话。
推荐10个免费开源GitHub仓库:Recordly(免费屏幕录制,AGPL-3.0)、Stirling-PDF(PDF工具集,50+功能,MIT)、PhotoGIMP(GIMP转Photoshop界面)、Open Notebook(自托管NotebookLM,支持PDF/URL/YouTube,18+数据源,MIT)、Odysseus(PewDiePie开发的AI工作空间,本地优先,MIT)、FreeDomain(免费域名指向Cloudflare,AGPL-3.0)、Hyperframes(HeyGen的HTML/CSS转MP4引擎,Apache-2.0)、Web-to-App(网站转Android应用,支持Node/PHP/Python运行时)、ReClip(基于yt-dlp的多平台视频/音频下载)、Excalidraw(无限画布手绘图表,端到端加密,12万+好评)。
10 GITHUB REPOS THAT SHOULD BE ILLEGAL TO HAVE. all free. all open-source. bookmark this for later. 1️⃣ recordly - the f...
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。
Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...
LandingAI Agentic Document Extraction(ADE)现支持在 Parse 或 Parse Jobs 调用中传入 password 参数,同一请求完成解密、解析及结构化输出。该功能要求启用 Zero Data Retention(ZDR)模式,文档仅在内存处理,不持久化,适用于 HIPAA/PHI/PII 合规场景。支持 PDF、DOC、DOCX、ODT、PPT、PPTX、XLSX 格式。集成成本低:单一可选参数,非加密文件不受影响;缺密码返回 422 错误。密码经 HTTPS 传输,ZDR 下服务端不持久化,建议配合最小权限 API Key 与审计日志。REST API 及 Python/TypeScript 库均可用。
Parse password-protected documents! Agentic Document Extraction (ADE) accepts a password parameter directly in the Parse...
Codex 推出 Handoff 功能,支持用自然语言指令将正在进行的任务连同完整 Git 状态(未提交代码、当前分支)从笔记本迁移到远程服务器继续运行,之后可再拉回本地。前提:本地需在 Settings > Connections > SSH 配置远程主机;远程也需安装 Codex 并开启“允许其他设备连接”,双方登录同一 ChatGPT 账号;远程需有同一 Git 仓库的克隆并保存为项目,子目录路径需匹配。该功能解决了 AI 编程中途离开时任务进度的托管问题。
Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...
http://x.com/i/article/2067506549107691520
投资者常将AI网络视为铜缆与光缆的二元选择,但SemiAnalysis认为二者互补。GPU集群规模扩大,高效连接驱动各类网络需求增长。铜缆在满足距离、功耗、成本与可靠性时仍是首选,光缆则在带宽和距离超出铜缆极限时必需。Nvidia策略一致:能用铜缆用铜缆,必须用光缆才用。因此光学增长不取代铜缆,铜缆持久也不意味着光学不增长。随着AI系统规模与复杂度提升,两者都将受益于GPU、交换机、机架与集群间数据传输需求的增加。
API prices of key AI models: US vs China
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
DeepAdapt 发布 ACI(自适应持续智能)运行时学习层,通过将重复工作负载从 GPU 转移至标准 CPU,实现运营成本降低 82%、推理速度提升 33 倍(中位延迟 159 ms)。ACI 在推理时实时学习模型决策、人工修正与反馈,已知请求直接本地 CPU 处理,仅不确定或复杂请求回传底层 LLM。基准测试:token 消耗降 90%、生产级成本降 5.7 倍、准确率 96%(对比无 ACI 的 85%)、每千次决策能耗降 85.7%、规则违规减 4.8 倍。无需微调或重训,即插即用,GPU 依赖随系统成熟递减。该架构先用于云端 LLM 智能体,未来对个人设备同样重要。