We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with ...
2026年6月24日,Mistral AI 发布 Connectors 多项新能力:Enriched admin controls(GA)支持按工作空间设置连接器访问权限并单独开关工具;API keys with connector scopes(GA)防止自动化 AI 工作负载中身份冒充;Multi-account connectors(GA)允许单个连接器绑定多个账户;Connectors Debugger(公开预览)对 MCP 连接器进行端到端根因分析;Connectors in Vibe Code(GA)和 Connectors in Workflows(公开预览)分别允许在开发者界面复用连接器及支持长时间运行任务不中断。
华为今日宣布鸿蒙“龙虾”小艺 Claw 全机型开放,HarmonyOS 5.0 及以上设备可用,小艺 App 需升级至 11.6.4.300 版本。套餐更新:49 元体验包上线 Auto-Model 模式;199 元标准包支持自主选择 openPangu-2.0-Pro、DeepSeek V4-Flash、DeepSeek V4-Pro、MiniMax M3 四种基础大模型。小艺 Skills 市场已支持 500+ 精选 Skills,覆盖消息、办公、知识检索、创意、生活、金融、开发等领域。小艺 Claw 获信通院首个终端厂商权威安全认证,具备开箱即用、一键唤醒、自我学习、深度记忆、多端协同、端云协同等功能。
OpenAI与Broadcom合作推出首款自研AI芯片Jalapeño(ASIC),专为ChatGPT、Codex、API及未来AI智能体产品的LLM工作负载设计。在已知工作负载下,Jalapeño比NVIDIA GPU更便宜、更快,通过减少数据移动、均衡计算/内存/网络资源实现更接近理论峰值的实际利用率,能效更优。该芯片从设计到流片仅用9个月,OpenAI自己的模型加速了部分设计工作。这标志着OpenAI从购买算力转向构建完整堆栈(模型、软件、服务器、网络、芯片)的战略转变。
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
OpenAI与博通合作,九个月内完成首款自研AI芯片Jalapeño的设计到流片。该芯片专为大语言模型推理场景打造,用于ChatGPT、Codex、API及未来智能体产品,每瓦性能优于当前最先进水平。推理成本可降低30%–50%,为日常持续消耗大头。传统芯片设计周期2–3年,Jalapeño通过AI辅助设计跑通“AI造AI硬件”自循环。OpenAI意图走全栈路线,摆脱对英伟达依赖,掌握底层算力定价权。
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
OpenAI 推出与 Broadcom 合作打造的首款定制芯片 Jalapeño,这是一款专用于 AI 推理的 ASIC,用于处理 ChatGPT 请求。据称其性能与 Nvidia Blackwell 和 Google TPU 相当,每瓦性能显著优于当前 SOTA。Jalapeño 是 OpenAI 多代计算平台的首步,预计 2026 年底部署。
OpenAI 周三公布其首款自研推理处理器 Jalapeño,由 Broadcom 设计制造,专为推理系统优化,OpenAI 自身 AI 模型参与了芯片开发。早期测试显示能效比显著优于当前顶尖替代方案。该芯片旨在降低实时编码模型的运行成本,但预训练等高性能任务仍将依赖 Nvidia GPU。OpenAI 称此举使其能全栈优化芯片架构、内核、内存系统、调度等基础设施,以提升模型速度、可靠性和经济性。
OpenAI 推出首款自研 AI 芯片 Jalapeño,专为 LLM 推理从零设计。从初始设计到流片仅用 9 个月,ChatGPT 参与了芯片设计,堪称高性能先进半导体领域最快的 ASIC 开发周期。该芯片由 Broadcom 和 Celestica 代工,针对 ChatGPT、Codex、API 及未来 Agent 产品的实际负载优化。早期样片已在实验室达到目标频率和功耗,成功运行 GPT-5.3-Codex-Spark 等 ML 负载;性能功耗比显著优于当前 SOTA,详细基准后续公布。部署计划于 2026 年底启动,战略上旨在减少对外部 GPU 依赖,加强对算力经济的控制。
OpenAI just unveiled Jalapeño, its first custom AI chip designed from scratch for LLM inference- It is OpenAI moving dee...
OpenAI 正紧急修复 Codex CLI 日志过量写入缺陷。开发者 Rui Fan 报告称,其机器运行约 21 天后主 SSD 写入约 37TB SQLite 日志,推算每年约 640TB;对于 1TB、额定 600TBW 的消费级 SSD,不到一年可能耗尽质保写入耐久度。另一开发者引用 Codex 自估,该缺陷在 3 月至 6 月可能造成全体用户低位数百万美元 SSD 写入耐久度损失。问题源于 2026 年 2 月将服务器 SQLite 日志输出级别改为 TRACE,且本地诊断日志默认开启。OpenAI 确认工程师正在修复,部分修复已实装,但用户仍持续报告。
360 集团在 ISC.AI 2026 上发布两大 AI 安全能力:漏洞自动化挖掘智能体“图龙锋”和网络安全自动化防御系统“仪天阵”。图龙锋已累计挖掘漏洞 3432 个,其中监管确认 105 个,多个被定为高危漏洞,覆盖开源代码、操作系统等场景。仪天阵可自主规划任务、研判告警、联动处置。周鸿祎指出,Mythos 使漏洞发现速度提升百倍、成本下降千倍,中国必须拥有自己的 Mythos 以应对“第二次单向透明”。
字节跳动推出 SeedMusic 1.0 Preview AI 音乐模型,用户只需一句话提示词即可生成完整歌曲,生成速度约 2-3 分钟。示例提示词为“来一首古风歌曲,但是有着现代流行音乐的节奏感,能让人朗朗上口,关于爱情的歌曲”,效果不错。该模型属于字节跳动在 AI 领域的布局之一。
OpenAI与Broadcom联合发布首款定制芯片"Jalapeño",专为大语言模型推理而设计,从零打造而非修改通用芯片。OpenAI称其性能功耗比“显著优于”当前最先进硬件,但为自报数据,尚未独立验证。芯片开发耗时9个月,OpenAI自身模型辅助加速设计。工程样片已运行包括GPT-5.3-Codex-Spark在内的ML工作负载。计划于2026年底进行大规模部署,微软预计将购买其中40%的芯片。
OpenAI 首次对外展示与博通联合设计的定制 AI 推理芯片 Jalapeño,性能号称可媲美英伟达 Blackwell 和谷歌 TPU。该芯片专为大语言模型优化,计划今年年底前部署,不对外销售,仅供内部使用。样品搭配 GPT-5.3-Codex-Spark 测试达标,设计用时约 9 个月,由台积电制造,AI 辅助部分开发。博通 CEO 称定制 AI 芯片利润率受 HBM 内存成本影响。
OpenAI 联合 Broadcom 与 Celestica 从零设计首款自研推理芯片 Jalapeño,9 个月完成流片,专为 LLM 推理优化,能效优于当前 SOTA。计划 2026 年底起以吉瓦级规模部署,用于 ChatGPT、Codex、API 及未来智能体产品。OpenAI 称这是“全栈优势”关键环节,通过自研芯片构建飞轮:更好基础设施→更高算力效率→更好训练与推理→更强模型→更好产品→更多使用与收入→再投入。推理芯片直接改善成本、速度与可靠性,是 AI 触达用户的环节。
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
Google 新款 Home Speaker 售价 99 美元,体积小巧但音质饱满,低音优于同尺寸的 UE Wonderboom,清晰度和响度均超过 Amazon Echo Dot Max。配备三个麦克风,唤醒词识别灵敏,即便在淋浴中也能响应“Hey, Google”。外观呈彩色毛线球状,无可见按键;音量可通过点击左右侧调节,但触控区域小且方向不直观,顶部播放/暂停触控正常。灯光环隐藏于底部,反馈不够明显。不支持标准蓝牙,可通过 Google Cast 串流或与 Google TV Streamer 配对。内置 Gemini 智能助手,可用于控制家居、规划日程和查询信息。
OpenAI 推出其首款自研 AI 芯片 Jalapeño,与 Broadcom 和 Celestica 合作构建,针对 ChatGPT、Codex、API 及未来智能体产品的工作负载优化。早期样品已在实验室以目标频率和功耗运行 ML 工作负载,包括 GPT-5.3-Codex-Spark。OpenAI 称每瓦性能显著优于当前最先进水平,详细基准稍后公布。部署计划于 2026 年底启动。此举旨在减少对外部 GPU 的依赖,增强对计算经济的控制,并强化模型、产品、收入与基础设施之间的飞轮效应。
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后,Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/,自动映射为斜杠命令(如/plan、/axolotl)。技能采用三级加载(Level 0返回名称与描述约3k tokens,Level 1加载全文,Level 2加载特定文件),避免大技能库撑满上下文窗口。除/learn外,还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用,仪表板额外提供“Learn a skill”按钮。
OpenAI 与 Broadcom 发布首款自研推理加速器 Jalapeño,专为当前及未来 LLM 从头设计。早期测试显示,其性能功耗比大幅优于现有 SOTA。工程样片已在实验室以目标频率和功耗运行 GPT‑5.3‑Codex‑Spark 等负载。芯片从设计到流片仅用 9 个月,并利用 OpenAI 模型加速部分流程。OpenAI 计划从 2026 年起与 Microsoft 等合作伙伴部署千兆瓦级数据中心,推出多代计算平台。
OpenRouter推出统一图像API,整合Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft、xAI等30+模型。新API提供标准化请求格式,通过/api/v1/images/models端点返回每个模型的分辨率、宽高比、输出数量、输入参考图数量、种子等能力描述;通过/api/v1/images/models/{id}/endpoints端点获取具体服务商的定价与参数支持(如Seedream 4.5每张$0.04、FLUX.2 Pro每百万像素$0.03、GPT-5.4 Image 2按token计费)。OpenAI的GPT 5系列图像模型支持SSE流式预览,启用"stream": true即可边生成边返回预览。新图像模型将仅添加至专用API,建议现有用户切换。
Today, we're launching Vida. A proactive agent that understands context, remembers what matters, anticipates intent, and...
火山引擎在FORCE大会推出面向企业智能应用的Agent Ready基础设施,构建AI云与Agent三层架构。AgentKit升级提供Identity、Runtime、Sandbox、Evaluation等模块,实现Agent可靠、可控、可衡量。Identity已接入数千家身份体系,Runtime支持长程任务和分钟级12万沙箱并发。ArkClaw企业版集成Agent广场、技能中心与企业知识库,支持IDP/SSO/OAuth及飞书、钉钉等IM入口统一管控。实践案例:海底捞门店经营Agent将小时级工作压缩到分钟级,人工跟进时长缩减70%,巡检满意度提升50%;创维酷开借助ArkClaw终端版打造AIOS,Token消耗节省50%,支撑百万级终端。
Anthropic 面向 Enterprise 和 Team 用户发布 Claude Tag 功能 beta 版。用户可在 Slack 共享频道中通过 @Claude 直接调用 AI 模型,将其引入活跃群组线程。频道内任何成员均可委派任务或审查内容,打破了传统独立聊天框的交互模式。
Anthropic 推出 Claude Tag,允许团队在 Slack 任意频道中通过 @Claude 标记并分配任务。该公司表示,其内部产品团队已有 65% 的代码由该工具生成。
火山引擎在FORCE大会上提出企业Agent落地“1+N+X”体系:“1”是AgentSphere数字员工派遣站,“N”是开箱即用应用,“X”是基于TRAE、扣子、HiAgent持续进化的业务应用。TRAE企业版上线TRAE Work,实现一个账号切换IDE与办公端、一个后台统一管理,内部开发94%代码由AI贡献。亚信科技应用后单人日均节省约1.8小时,代码贡献率提升42%,千行代码缺陷率降低35%。扣子升级3.0,强化多端协同与行业知识沉淀。HiAgent 3.0构建开发-运行-管理闭环,引入Learning Loop实现Agent持续进化。某车企经AgentSphere统一纳管后,活动筹备周期从4周压缩至5个工作日,效率提升约3.5倍。
一位 AI 培训老师希望带学生体验 GPT image 2 的能力,询问 ListenHub 新用户免费 100 张的福利是否还在。作者回应已结束,目前仅赠送约 10 张。老师表示完整体验模型约需 50 张。作者随后将 ListenHub 新用户注册福利增加至 50 张,并将使用地址(http://ListenHub.ai)分享给有需要的人。
Anthropic 于当地时间 6 月 23 日推出 AI 虚拟团队成员 Claude Tag,是 Claude Code 的演进版本,更主动且适合团队协作。Claude Tag 率先在 Slack 上推出,用户可在频道中 @Claude 委派任务。工具支持多人协作、自主学习、异步运行,并能主动追踪信息与任务。Anthropic 产品团队 65% 的代码由 Claude Tag 内部版本生成,应用场景已从工程扩展到数据追踪、客户服务。
阿里云数据安全中心(DSC)采用AI基础模型+专家模型+正则表达式的融合架构,取代传统规则驱动的数据分类。新方案支持800+种数据类型自动识别,具备上下文感知的准确率与召回率,实现毫秒级合规响应,并支持无缝云原生集成。
映泰推出 EdgeComp MS-NAT5000 边缘 AI 计算系统,搭载 NVIDIA Jetson Thor T5000 模组,FP4 AI 算力达 2070 TFLOPS。配备 14 核 Arm Neoverse-V3AE CPU、128GB LPDDR5X 共享内存,内置 M.2 SSD 盘位,支持 M.2 无线网卡与蜂窝模组,可选 2 个 SATA III 热插拔扩展。外部接口包括 1 个 100G QSFP28、2 个 5GbE RJ45、4 个 USB-A、1 个 USB-C 10Gbps、HDMI、DisplayPort、2 个 RS232/422/485 及 4 个 CAN FD。
荣耀产品线总裁方飞在MWC26上海宣布,荣耀将于今年7月发布以人为中心的下一代终端操作系统AgenticOS。该系统具备意图驱动(以意图为中心而非应用)、自然交互(声音、手势、眼神等)、主动智能(Agent内核,主动规划/服务/执行)及天生跨端(一脑调度万端,多设备多Agent协同)四大特性。此外,年初发布的“机器人手机”Robot Phone预计今年下半年上市,搭载行业最小的4DoF云台系统,体积比主流方案缩小70%。
百度千帆发布企业级AI生产力订阅服务Token Plan企业版,采用“席位制+企业共享积分包”模式,支持按需采购席位、统一额度池共享调度,并提供成员管理、用量统计、告警等运营能力。模型方面聚合DeepSeek-V4系列、GLM-5系列、Kimi-K2.6等,已率先接入智谱GLM-5.2,开箱即用。提供轻享版、标准版、高级版等多档位,承诺不使用用户数据训练,支持企业级SLA。