Meta前首席AI科学家杨立昆受访时称,马斯克创办的xAI“某种程度上已经失败”:难以招到顶尖AI人才,除马斯克外所有联合创始人已离职。xAI近日将数据中心出租给Anthropic等对手,杨立昆认为此举反映其弱势处境,需出租才能收回成本。他不看好xAI前景,认为其无法参与最前沿竞争。同时他称赞SpaceX“做得非常出色”,并表示自己拥有一辆特斯拉,FSD并非真正完全自动驾驶,但确实有用。
Meta前首席AI科学家杨立昆受访时称,马斯克创办的xAI“某种程度上已经失败”:难以招到顶尖AI人才,除马斯克外所有联合创始人已离职。xAI近日将数据中心出租给Anthropic等对手,杨立昆认为此举反映其弱势处境,需出租才能收回成本。他不看好xAI前景,认为其无法参与最前沿竞争。同时他称赞SpaceX“做得非常出色”,并表示自己拥有一辆特斯拉,FSD并非真正完全自动驾驶,但确实有用。
Agent Builder 正式上市(GA)。基于 Elasticsearch 的持久化内存层将记忆分为情景、语义、程序三类,分别存入独立索引,各设不同写速率与过期规则。召回采用 BM25 与 Jina v5 稠密向量的 RRF 融合,再经交叉编码器重排序。在 168 道 QA 题评估中,R@10 平均 0.89,零跨租户泄漏。该层可通过支持 MCP 协议的客户端访问,不绑定特定运行时,已开源至 GitHub。
美国政府短暂关闭了Mythos类中的Fable模型,标志着AI模型已越过危险门槛。作者预测最多两三代模型后,超级智能将像核武器一样被管控,大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月,且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止,但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务(如React客户端),AI将彻底改变编程和知识工作,但多数人只能使用当前等级模型。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》蔡崇信昨日在 VivaTech 2026 上表示,AI 的总潜在市场规模达 50 万亿美元,对标人类生产力,阿里巴巴正全面投入 AI。其全栈 AI 优势包括:中国高效低成本的能源供给,提前布局的云计算和芯片,全球最受欢迎的开源模型千问(Qwen),以及覆盖电商、即时零售等丰富应用场景。他同时指出,当前全球 AI 开源的主要推动力量来自中国企业,阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。
本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。从HuggingFace加载CodeGen模型(支持350M、2B、codegen2-1B、codegen25-7b等版本),通过自然语言提示生成Python函数,随后进行函数提取、语法检查、静态安全检查、单元测试验证、best-of-N候选重排序、多步程序合成、提示词实验、基准可视化及导出。展示了CodeGen作为结构化代码生成流水线的能力,不仅完成代码补全,还能评估、筛选和组织生成结果。
用户发布多组详细提示词,要求保留原图主体及背景,仅对宠物、人物、表情包、企鹅等对象添加真实风格的绿色粽叶头套或指套。指令强调粽叶需具备叶脉、折痕、色差、翘边和自然阴影,用红白细绳或草绳固定并在下巴处松松打结,整体效果类似手机随手拍的真实照片,避免卡通感、头盔感和过度规整。每段提示词均独立指定保留原图和比例,不改变原表情或姿势。
作者曾在多台 Mac 上用 GNU Stow 管理 dotfiles,但符号链接导致仓库脏工作树和引导新机时的文件冲突。后改用 Chezmoi:以 ~/.local/share/chezmoi 为源目录,chezmoi add 按 home 目录结构命名(dot_ 前缀代替前导点),chezmoi apply 写入真实文件而非符号链接,避免自动回写。支持 private_ 权限控制、.tmpl Go 模板以及 .chezmoiscripts 下的 macOS 初始化脚本。目前跟踪 zsh、git、shellcheck、ghostty、GitHub CLI 的配置,以及 Claude Code 的 settings.json、Codex 的 config.toml 和 dot_agents/skills 下的 agent skill 文件,并用三个 gitconfig 按目录分离工作/个人身份。
一个 OpenRouter API 密钥即可在 SillyTavern 的下拉菜单中解锁 300 多个模型,其中许多免费。指南包含五步连接流程、推荐尝试的角色扮演模型以及常见错误的修复方法。
OpenClaw 已内置 OpenRouter 支持,一条命令即可为 AI 智能体配置统一密钥、统一账单,并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。
一位最初对生成式AI持中立态度的用户,因科技行业集体狂热、公司强制植入AI且拒绝退出、无视用户同意使用公开数据进行训练、侵犯版权、抢占硬件产能、并公开攻击创意行业,最终彻底转变为AI反对者。他认为,当前AI发展缺乏用户授权、践踏隐私与职业伦理,需要完全重来。
DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。
hermes claw migrate 命令可将 OpenClaw(及遗留的 Clawdbot/Moldbot)配置导入 Hermes,包括角色(SOUL.md)、工作区指令(AGENTS.md)、长期记忆、用户画像、技能(来自 4 个来源)、默认模型、自定义提供商及 API 密钥等。迁移前会展示完整预览并确认。支持 --dry-run 预览、--preset full 全量迁移(API 密钥需额外指定 --migrate-secrets)、--overwrite 覆盖冲突、--no-backup 跳过备份等选项。默认读取 ~/.openclaw/,旧版目录自动检测。技能冲突可设为跳过、覆盖或重命名。迁移前自动创建 ~/.hermes/backups/ 备份,可用 hermes import 恢复。
约会应用巨头Match Group对1000名18-39岁美国单身人士的调查显示,47%对AI用于浪漫关系持负面看法。约40%表示拒绝与使用AI伴侣应用的人约会,该比例在18-24岁女性中升至51%。仅12%的18-24岁受访者在过去三个月内使用过伴侣应用,其中约三分之一寻求与聊天机器人建立真实连接。尽管对“与AI约会”几乎一致反对,64%受访者认为AI可帮助改善约会体验。Match旗下Tinder、Hinge、OkCupid及竞品Bumble均在探索AI功能(如润色资料、推荐照片、维持对话),但用户希望AI只辅助“困难部分”,不干涉人类情感连接。
Cloudflare 分享了其多阶段漏洞发现工具的技术架构,包含自动化分类循环。该系统通过管理状态控制、引入对抗性审查来压制误报,并围绕 LLM 上下文窗口限制设计路由策略。
Google 庆祝Agent-to-Agent(A2A)协议发布一周年。A2A专为生成式AI设计,相比传统REST API提供安全边界、零上下文污染、动态自主性和工作负载分布四大架构优势。应用实例FoldRun是一个独立的智能体接口,可在Gemini Enterprise或Gemini CLI等A2A兼容环境中部署,自动管理蛋白质结构预测任务,动态选择AlphaFold 2、OpenFold 3或Boltz-2等模型,无需自定义胶水代码。
埃森哲去年九月高调宣称AI将改变其业务,但本季度财报令人失望,股价下跌约18%,本周跌幅近23%,较52周高点已跌超50%。生成式AI并未带来预期的大幅收益,MIT、麦肯锡、贝恩等多份研究均显示类似结论。Claude Code(特殊神经符号系统,非通用聊天机器人)或能提升程序员生产力,但企业整体AI投资回报未达预期,tokenmaxxing热潮正在消退。
Claude Code 提供七种自定义指令方式:CLAUDE.md(根目录始终加载,子目录按需加载)、规则(无范围或路径范围)、技能(按需调用,共享 token 预算)、子智能体(隔离上下文运行并返回最终消息)、钩子(生命周期事件触发,绕过压缩)、输出样式(注入系统提示,永不压缩)和附加系统提示(CLI 标志,仅单次有效)。每种方式在加载时机、压缩行为、上下文成本和适用场景上各有不同,例如 CLAUDE.md 适合存放构建命令与编码规范,路径范围规则避免无关上下文消耗,子智能体用于并行隔离任务,钩子用于确定性自动化(如运行 linter 或备份聊天记录)。
iPod 之父 Tony Fadell 在纽约地铁看到 iPod Shuffle “零屏幕时间”广告时感到震惊。Back Market CMO Joy Howard 提出“slowtech”概念,指出人们对“快科技”过度刺激感到疲劳,年轻一代开始寻求有线耳机、数码相机等不霸占注意力的设备。前 JAMDAT 创始人 Austin Murray 正开发屏幕时间减少应用 MOQA,对抗自己曾帮助创造的现象。约 53% 的美国成人希望减少屏幕时间。Light Phone 联合创始人 Kaiwei Tang 表示,改用简约手机的客户(尤其 20-35 岁)感到更自由。
计算机视觉自动跟踪货架正帮助零售商应对利润侵蚀。行业低效消耗6.4%总销售额,2026年损失将达1964亿美元(同比增21%),远超3%的销售增速。九成零售商面临管理困难,全面部署商店智能平台的企业占60%(同比升18个百分点);年收入超50亿美元的公司中73%已规模化部署,低于10亿美元的仅42%。BJ's Wholesale Club部署Simbe机器人监测库存与价格,生成数字孪生后在线拣货效率年提升40%。Albertsons计划通过AI优化定价与品类管理,三个财年内实现15亿美元生产力提升。但部署顺序失衡:仅33%投资货架数字化硬件,2026年错误定价率将达13%(较2024年升4个百分点)。
参数高效微调(PEFT)技术中,LoRA 占据绝对主导:Hugging Face Hub 上 20,834 张提及单一 PEFT 技术的模型卡中 20,509 张指向 LoRA(98.4%);外部站点 10,000 个检查点中 95.0% 是 LoRA;GitHub 搜索 from peft import 代码片段的 71.3% 结果为 LoRA。但研究者宣称其他技术超越 LoRA 的论文结果具备偏向性——调整学习率即可让 LoRA 匹配更优技术。Hugging Face 的 PEFT 库提供统一 API 实现 40 余种 PEFT 技术,并开始建立基准测试:在数学数据集上对 LLM 进行思维链推理微调,以帮助用户做出更优选择。
开发者使用Claude Code控制并调试MAME的Power Macintosh仿真。Claude通过生成Lua脚本和修改日志,发现了6522 VIA仿真故障、PowerPC DRC缓存值未覆盖实际状态的反模式、PowerPC 601的两处Bug,以及原子加载/存储指令模拟错误。修复后,Pippin播放启动音并显示Logo、鼠标可移动;PowerMac 7200显示启动磁盘搜索画面;PowerMac 6100成功启动System 7.5.3和7.5.5。此外,GPT 5.5 Pro(经Codex)在固件逆向中能快速给出内存映射和子程序猜测。
杨立昆接受 CNBC 采访时指出,当前 AI 模型和服务价格持续上涨,运营公司仍在亏损,低价依赖投资人补贴,尚未建立可持续商业模式。他称 OpenAI 和 Anthropic 要么提高价格要么降低运营成本,否则巨大泡沫可能破裂。他还评价马斯克的 xAI 是“某种意义的失败案例”,创始团队多人出走,难以吸引新鲜血液,无法与 OpenAI、Anthropic 正面竞争。杨立昆主张发展世界模型概念,而非依赖海量语料库的大语言模型(LLM)路线。
盖洛普今年2月对超2.3万名美国劳动者的调查显示,经常使用AI的员工被裁员风险更低。在美国科技行业,每月至少使用一次AI的员工预计被裁概率约6%,使用较少的达18%。科技行业外也存在类似趋势但差距较小。排除年龄、学历等因素后关联仍然存在。AI正形成新的职业分水岭,企业招聘已考察AI熟练程度。仅约1%被裁员工认为AI是直接原因,更多人归因于组织重组,但研究人员认为AI可能间接影响。
AMI Labs 创始人 Yann LeCun 告诉 CNBC,如果 OpenAI、Anthropic 等 AI 实验室不降低成本或提高价格,将面临“大泡沫爆炸”。他指出 AI 服务价格持续攀升,但运营成本下降不够快,所有公司都在亏损,投资者实际上在补贴使用。OpenAI CEO Sam Altman 近期也称企业 AI 成本是“巨大问题”。LeCun 还称 Elon Musk 的 xAI 是“一种失败”,创始团队已离职,Musk 几乎无法招募顶尖人才,预计 xAI 无法与 OpenAI 或 Anthropic 竞争。LeCun 本人正推动“世界模型”,其公司 AMI Labs 已在三月为此融资 10 亿美元。
Hugging Face 发布面向 AI 智能体使用场景的基准测试框架,以 transformers 库为案例评估库的智能体友好度。框架使用 pi coding agent 与开源模型驱动,通过 Hugging Face Jobs 分散任务确保硬件一致。评估关注 agent 完成任务的成本、延迟、token 使用量和失败率,而非仅最终结果。此前 hf CLI 经优化后 agent token 使用量减少 1.3-1.8 倍(最高 6 倍),该框架旨在验证类似优化对 transformers 的效果。
Google DeepMind发布AI Control Roadmap,这是一套针对内部先进AI智能体的系统级安全框架。该框架在传统模型对齐之上增加防线,假设AI智能体可能不对齐,通过威胁建模、沙箱隔离、端点安全、提示注入防御以及基于已验证行为逐步授予权限的机制建立信任。据估算,到2030年仅美国市场AI智能体就能创造2.9万亿美元经济价值。
英伟达 CEO 黄仁勋呼吁社会更积极、广泛地拥抱 AI,称其能加快经济增长并推动科学突破。他回应了 AI 可能造成失业或威胁生存的批评,主张建立新社会规范,让每个人都亲自使用和了解 AI。黄仁勋认为美国需保持开放、参与全球 AI 市场,AI 创造的算力对增加制造业岗位至关重要,同时能帮助人们在不掌握编程技能的情况下完成网站设计、文档分析、高级研究等高级工作,从而弥合技术鸿沟。
皮尤研究中心最新民调显示,63%美国人认为AI发展速度过快。ChatGPT使用率较2023年翻番,44%受访者曾使用。49%偶尔使用聊天机器人,仅16%认为AI会有积极社会影响。青年群体使用率更高但更悲观:18–29岁中66%用过,48%认为有负面影响,仅14%看好。30–49岁中34%每天至少使用一次。约四成用AI处理工作,30%认为提高效率,28%认为帮助获取信息。此外,66%成年人担心AI传播错误信息。
Anthropic 首席执行官达里奥·阿莫迪昨天接受彭博社采访时表示,科技企业必须与政府合作防止权力滥用和治理失衡。他称人工智能是首个主要由私营企业推动的革命技术,并不认为政府应完全接管公司,而应引入公共监督机制。Anthropic 设有名为“长期利益信托”的治理机构,拥有任命或撤换董事会成员、解除 CEO 职务的权力,阿莫迪称该机构“随时可以解除我的 CEO 职务”,意在防止高层形成利益集团。
长上下文大语言模型的KV缓存随序列和批次线性增长,成为内存和延迟瓶颈。Google与NYU的TurboQuant采用数据无关随机旋转与最优标量量化,在3–4 bit位宽实现近乎无损,4×压缩下Needle-in-a-Haystack全精度召回。Together AI的OSCAR使用注意感知旋转校准,INT2(2.28有效比特)下精度不崩溃,集成SGLang,Qwen3-32B上仅差0.02分,GLM-4.7-FP8匹配BF16,解码速度提升约3倍,KV缓存内存减少约8倍。Apple的EpiCache则针对两者均未解决的多轮对话场景。两者在各自目标位宽上各有优劣,具有理论互补潜力。
中国信通院6月18日发布2026智能体十大关键词:智能体基础设施、互联协作、工程化、学习进化、记忆、技能、产品创新、支付协议、可信、全栈评估。基础设施向标准化和云边协同发展;互联协作推动跨系统群体协同;工程化覆盖开发到运维全生命周期;学习进化实现从指令驱动到自我成长;记忆动态管理交互经验;技能封装为可复用单元;产品创新涌现“养虾”“养马”等实践;支付协议支持自主交易和结算;可信从数据、技术、评估三方面保障;全栈评估方面,“方升”基准测试围绕核心能力、通用任务和行业场景持续完善。
Skywork Super Agents 从2024年底推理模型起步,2025年2月转向办公场景,5月发布Word、PowerPoint、Excel、网页、博客五个专项Agent,8月拓展多模态后在BrowseComp榜单进入第一梯队,11月解决Excel表格准确性难题。202
小米超级电机 V8s EVO 最高转速 28000rpm,借助 AI 拓扑优化模拟超 100 万种硅钢片结构,无需碳纤维缠绕即扛住离心力,单电机输出 611PS。自研碳化硅功率模块支持 800A 有效电流,电控峰值功率密度 120kW/L,电机功率提升 5.9%。峰值效率 98.38%,0.15mm 超薄硅钢片使铁损降 18.7%,X-Pin 绕组降铜损 3.6%,为 YU7 GT 带来 6.4km CLTC 续航提升。双电机(V8s EVO + V6s Plus)合计 1003PS,极速 300km/h,0-100km/h 加速 2.92 秒。经济模式前电机脱开可额外增加 20km CLTC 续航。
Anthropic CEO 达里奥·阿莫迪在6月18日采访中称,与OpenAI CEO萨姆·奥尔特曼的竞争已演变为“冷战”,双方愿景不同、互不信任,只能各走各路。他暗示市场与公众将裁决谁正确,并借印度AI峰会上两人未牵手合影的一幕批评峰会混乱。阿莫迪含蓄批评OpenAI在安全标准上的合作诚意,但否认行业“互不信任”,以与谷歌DeepMind CEO哈萨比斯的15年合作为例说明仍有可信参与者。
一位小型软件公司创始人基于自身业务和开源项目分享,本地 Qwen 27B/35-A3B 模型在特定场景下有实际价值,使用 RTX 6000 Pro 显卡运行,显卡成本已在头两三个月内收回。但本地模型量化后容易出现无限循环和模型幻觉,无法无人监督使用,作者认为不应过度吹捧替代云端 Opus,而是把它看作另一种工具。
美团智能创作团队构建了覆盖“生成—编辑—评判”全链路的海报生成技术体系。PosterCraft(ICLR 2026)通过四阶段级联优化实现端到端高美感海报生成,文字渲染准确率接近顶级闭源商业系统;PosterOmni(CVPR 2026)以单一统一模型覆盖扩图、补全、比例调整、风格迁移等六类设计任务;PosterReward(CVPR 2026)是首个专门面向海报质量的奖励模型,在专项评测基准上达86%准确率。三者相互协同,已全部开源至MeiGen-AI仓库,并在美团外卖套餐图生成、品牌IP袋鼠团团等业务中落地。
教程使用 NVIDIA SkillSpector 通过静态分析和 SARIF 报告评估 AI 技能安全风险。构建了包含 safe-formatter、env-harvester、code-exec 和 prompt-injector 四个演示技能的语料库,涵盖良性行为和故意植入的漏洞(环境变量泄露、动态代码执行、提示词注入)。通过 LangGraph 工作流扫描,输出风险评分和 SARIF 格式结果,用 pandas 整理发现。教程还演示了可视化严重性分布、导出 SARIF、扩展自定义分析器以及可选的 LLM 语义分析。
Google Docs中Gemini弹窗可通过点击顶栏“Gemini”并选择“底部栏偏好”关闭底部AI栏。更彻底的方案是进入Gmail设置,在“查看所有设置”中找到“Google Workspace智能功能”,关闭相关开关,即可禁用Gemini弹窗及其他AI建议(如光标处的“help me write”)。
OpenRouter 提供统一 API 键(sk-or- 开头),兼容 OpenAI Chat API,可接入 300+ 模型和 60+ 供应商。用户只需将 base URL 改为 https://openrouter.ai/api/v1,设置 API 键,并指定模型 slug(如 openai/gpt-4o 或 anthropic/claude-sonnet-4)即可。同一键可直接用于 Claude Code、Codex CLI、Cursor、Cline 等编码代理与工具。其路由机制在供应商故障时自动切换,代理无需感知失败即可继续多步骤任务。OpenRouter 也提供 Python 和 TypeScript 原生 SDK。
设置三个环境变量即可将Claude Code连至OpenRouter,无需本地代理或Docker。OpenRouter提供供应商故障转移、预算控制与用量监控,支持Anthropic Skin原生协议,保留Thinking、工具调用、流式输出。可为Opus(架构推理)、Sonnet(日常编码)、Haiku(快速转换)分别指定模型。Fast Mode最高2.5倍速度,仅限Claude Opus 4.6/4.7/4.8,需Claude Code v2.1.96+。团队场景:一个OpenRouter密钥统一计费、设置每密钥限额,活动仪表板查看会话成本。