MCP 相较于 skills/CLI 的关键优势在于,它能将认证流程隔离在 Agent 的上下文窗口之外,甚至完全脱离 Agent 框架。其理想形态可能仅仅是作为 API 的认证网关——即便如此也是一项胜利。
MCP 相较于 skills/CLI 的关键优势在于,它能将认证流程隔离在 Agent 的上下文窗口之外,甚至完全脱离 Agent 框架。其理想形态可能仅仅是作为 API 的认证网关——即便如此也是一项胜利。
最新研究表明,过度依赖AI工具会导致医生和软件工程师技能退化。波兰一项针对内镜医生的研究发现,在使用AI辅助后,无AI支持时腺瘤检出率从28.4%降至22.4%。美国医疗工作者调查显示,70%的护士和77%的医生担忧因依赖AI而丧失技能。Anthropic对52名软件工程师开展了随机对照试验,考察AI对编码能力的影响。研究人员指出,AI驱动的“技能去化”已在医学和计算机科学领域出现,但目前尚无成熟的应对方案。
智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T token之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。
LLM在作为医疗助手时,评估与部署场景下的性能存在显著差距——Bean等人(2025)发现准确率相差61个百分点。这一差距并非源于基准测试设计缺陷,而是因为评估协议中嵌入的隐含假设在部署时不再成立。研究提出将假设分为任务假设和结果假设两类,用以诊断差距成因并明确弥合路径:需将假设显式化、检验哪些假设在部署中成立,并据此更新评估协议。
路透研究所2026年数字新闻报告显示,全球每周用AI聊天机器人获取新闻的比例从7%升至10%,仅1%将其视为主要来源。44%活跃用户信任AI生成的新闻,但仅4%经常点击原始来源。用户主要用途为追问(42%)、获取当前新闻(35%)和摘要(34%)。18-24岁年龄段使用率达17%,自称“新闻爱好者”的用户达18%。报告指出,聊天机器人存在强化已有偏见和分裂公共话语的风险,但也能简化复杂话题、翻译内容并提供多源整合,拓宽用户视角。
6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。
蔡崇信昨日在 VivaTech 2026 上表示,AI 的总潜在市场规模达 50 万亿美元,对标人类生产力,阿里巴巴正全面投入 AI。其全栈 AI 优势包括:中国高效低成本的能源供给,提前布局的云计算和芯片,全球最受欢迎的开源模型千问(Qwen),以及覆盖电商、即时零售等丰富应用场景。他同时指出,当前全球 AI 开源的主要推动力量来自中国企业,阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。
一位最初对生成式AI持中立态度的用户,因科技行业集体狂热、公司强制植入AI且拒绝退出、无视用户同意使用公开数据进行训练、侵犯版权、抢占硬件产能、并公开攻击创意行业,最终彻底转变为AI反对者。他认为,当前AI发展缺乏用户授权、践踏隐私与职业伦理,需要完全重来。
DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。
一个名为 IN THE WEIGHTS 的网站上线,允许用户查询自己的名字是否出现在 GPT-5.5、GPT-5.4 Mini、Opus 4.8、Haiku 4.5、Grok 4.20、Gemini 3.1 Lite、Kimi K2 0905、DeepSeek V4、Llama 3.3 70B、Llama 3.2 1B、GLM 4.7 Flash、Mistral 3.2 24B 和 Qwen3 8B 共13款大语言模型的训练数据中。网站同时公布“今日重量级”排行榜,莫扎特、莎士比亚、泰勒·斯威夫特等20位知名人物均获得996的“强度”评分。
约会应用巨头Match Group对1000名18-39岁美国单身人士的调查显示,47%对AI用于浪漫关系持负面看法。约40%表示拒绝与使用AI伴侣应用的人约会,该比例在18-24岁女性中升至51%。仅12%的18-24岁受访者在过去三个月内使用过伴侣应用,其中约三分之一寻求与聊天机器人建立真实连接。尽管对“与AI约会”几乎一致反对,64%受访者认为AI可帮助改善约会体验。Match旗下Tinder、Hinge、OkCupid及竞品Bumble均在探索AI功能(如润色资料、推荐照片、维持对话),但用户希望AI只辅助“困难部分”,不干涉人类情感连接。
埃森哲去年九月高调宣称AI将改变其业务,但本季度财报令人失望,股价下跌约18%,本周跌幅近23%,较52周高点已跌超50%。生成式AI并未带来预期的大幅收益,MIT、麦肯锡、贝恩等多份研究均显示类似结论。Claude Code(特殊神经符号系统,非通用聊天机器人)或能提升程序员生产力,但企业整体AI投资回报未达预期,tokenmaxxing热潮正在消退。
伯尼·桑德斯提出立法,对年AI销售额超2亿美元的公司征收50%股票税,建立价值约7万亿美元的主权财富基金。基金每年向每位美国公民发放超1000美元股息(5%年股息),并资助医疗、教育、住房。同时成立由总统提名、参议院确认的两党“民主AI独立委员会”,通过投票权阻止公司损害公共利益。法案还要求AI公司剥离非AI业务。该计划面临共和党国会和特朗普政府阻力。
同一事件,精选展示《大型人工智能公司的一半股份应归公众所有》iPod 之父 Tony Fadell 在纽约地铁看到 iPod Shuffle “零屏幕时间”广告时感到震惊。Back Market CMO Joy Howard 提出“slowtech”概念,指出人们对“快科技”过度刺激感到疲劳,年轻一代开始寻求有线耳机、数码相机等不霸占注意力的设备。前 JAMDAT 创始人 Austin Murray 正开发屏幕时间减少应用 MOQA,对抗自己曾帮助创造的现象。约 53% 的美国成人希望减少屏幕时间。Light Phone 联合创始人 Kaiwei Tang 表示,改用简约手机的客户(尤其 20-35 岁)感到更自由。
计算机视觉自动跟踪货架正帮助零售商应对利润侵蚀。行业低效消耗6.4%总销售额,2026年损失将达1964亿美元(同比增21%),远超3%的销售增速。九成零售商面临管理困难,全面部署商店智能平台的企业占60%(同比升18个百分点);年收入超50亿美元的公司中73%已规模化部署,低于10亿美元的仅42%。BJ's Wholesale Club部署Simbe机器人监测库存与价格,生成数字孪生后在线拣货效率年提升40%。Albertsons计划通过AI优化定价与品类管理,三个财年内实现15亿美元生产力提升。但部署顺序失衡:仅33%投资货架数字化硬件,2026年错误定价率将达13%(较2024年升4个百分点)。
盖洛普今年2月对超2.3万名美国劳动者的调查显示,经常使用AI的员工被裁员风险更低。在美国科技行业,每月至少使用一次AI的员工预计被裁概率约6%,使用较少的达18%。科技行业外也存在类似趋势但差距较小。排除年龄、学历等因素后关联仍然存在。AI正形成新的职业分水岭,企业招聘已考察AI熟练程度。仅约1%被裁员工认为AI是直接原因,更多人归因于组织重组,但研究人员认为AI可能间接影响。
皮尤研究中心最新民调显示,63%美国人认为AI发展速度过快。ChatGPT使用率较2023年翻番,44%受访者曾使用。49%偶尔使用聊天机器人,仅16%认为AI会有积极社会影响。青年群体使用率更高但更悲观:18–29岁中66%用过,48%认为有负面影响,仅14%看好。30–49岁中34%每天至少使用一次。约四成用AI处理工作,30%认为提高效率,28%认为帮助获取信息。此外,66%成年人担心AI传播错误信息。
负责Meta AI重组核心项目的高管埃米莉·道尔顿·史密斯即将离职。她于2015年加入Meta,曾任Threads产品负责人,两个月前刚被指派改进内部AI工具。Meta正推进全公司重组,计划开发能替代人类员工的AI智能体,引发内部强烈反弹。重组涉及裁撤10%员工、调岗及部署鼠标追踪软件。道尔顿·史密斯领导“智能体转型加速计划”(ATA)小组,负责企业级AI助手Metamate集成多种AI技能。Meta CTO博斯沃思坦言老员工士气跌至近乎历史最低点。
中国信通院6月18日发布2026智能体十大关键词:智能体基础设施、互联协作、工程化、学习进化、记忆、技能、产品创新、支付协议、可信、全栈评估。基础设施向标准化和云边协同发展;互联协作推动跨系统群体协同;工程化覆盖开发到运维全生命周期;学习进化实现从指令驱动到自我成长;记忆动态管理交互经验;技能封装为可复用单元;产品创新涌现“养虾”“养马”等实践;支付协议支持自主交易和结算;可信从数据、技术、评估三方面保障;全栈评估方面,“方升”基准测试围绕核心能力、通用任务和行业场景持续完善。
一位小型软件公司创始人基于自身业务和开源项目分享,本地 Qwen 27B/35-A3B 模型在特定场景下有实际价值,使用 RTX 6000 Pro 显卡运行,显卡成本已在头两三个月内收回。但本地模型量化后容易出现无限循环和模型幻觉,无法无人监督使用,作者认为不应过度吹捧替代云端 Opus,而是把它看作另一种工具。
推荐9本非直接AI但有助于底层能力的书籍:《失控》解释涌现系统;《人有人的用处》强调反馈是人机协作核心;《系统之美》分析存量与流量,警惕AI消耗独立判断力;《事实》用数据思维避免情绪化决策;《理解媒介》指出AI是新媒介,应思考“什么不可能变可能”;《反脆弱》用杠铃策略应对AI快速迭代;《一生的旅程》将个人变成AI的管理者;《千面英雄》讲解讲故事能力;《第一哲学沉思集》贴近当下。
苹果CEO库克确认,AI热潮导致存储芯片严重短缺和价格暴涨,苹果产品涨价已“不可避免”。库克未透露涨价具体细节。华尔街日报指出,全球AI巨头大幅增加资本开支,高带宽内存需求激增,挤压消费电子芯片供应。自2024年以来内存和存储芯片价格已翻四倍,涨势预计延续至2027年。研究机构估算,下一代iPhone 18 Pro售价或需增加约270美元。苹果已在上月提高Mac Mini起售价。摩根士丹利预测,今年美国智能手机和PC价格将上涨15%。
年初硅谷掀起“tokenmaxxing”热潮,CEO鼓励员工最大化AI使用量,随后账单涌现:Uber数月内耗尽年度AI预算,部分公司削减组织内的Claude许可证,Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率,她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。
Databricks 年化经常性收入(ARR)达 69 亿美元,同比增长 80%;同期 Snowflake ARR 约 53 亿美元,增速 34%。两者差距从 3 月的 4.9 亿美元扩大至 16 亿美元。AI 产品年化收入 17 亿美元,占总 ARR 的 25%,六个月前为 10 亿美元。Salesforce 以 36 亿美元收购 Fin,其 AI 智能体年收入 1 亿美元,同样占比约 25%,同比增长 350%。Databricks 私人估值 1340 亿美元,80% 的增长率远超 CrowdStrike(26%)和 Shopify(34%)等同行。
微软与约克大学研究员Adrian de Wynter在《帝国时代II》地图编辑器中用山羊搭建神经网络:山羊在草地代表0,在桥上代表1,构建XNOR门和AND门,学习逻辑与函数。附录证明该游戏理论上可模拟任意计算机。他批评AI研究拟人化倾向,分析2024年中至2026年中315篇论文,发现57%前提假设大语言模型具有人类特质,36%结论支持拟人化。Anthropic公开承认训练Claude使用“我相信”等措辞。他提出“观察而非归因”方法,并公开代码。
皮尤研究中心调查显示,仅16%美国人认为AI未来20年有积极影响,约40%持负面看法。67%不相信美国政府能有效监管AI,59%不信任公司安全开发。30岁以下群体最悲观,仅14%认为有积极作用。近三分之二受访者认为AI发展过快。约四分之一美国人每天使用AI聊天机器人,其中ChatGPT使用率达44%(2023年以来翻倍),其次为Gemini(24%)、Copilot(17%)、Meta AI(14%)、Grok(8%)、Claude(6%)和Character.ai(3%)。男性使用更频繁(27% vs. 20%)。六成受访者定期阅读AI生成网页摘要。约半数美国人表示日常生活中不使用AI,其中65岁以上者近75%从未使用过聊天机器人。
Threads、Instagram和TikTok正推出工具,允许用户通过LLM个性化算法定制信息流。Threads于2026年7月16日上线“Your Algo”功能,可私下设置偏好并选择持续1、3或7天,取代需公开发帖的“Dear Algo”。Instagram于6月初将“Your Algorithm”工具从Reels扩展至全部信息流、探索和Reels,用户可查看并调整推荐主题。TikTok的“Manage Topics”工具(2024年推出)通过滑块调节各主题权重,并于2025年增加AI驱动的Smart Keyword Filters,自动过滤同义词关键词。Instagram负责人表示,LLM使推荐系统更透明。
皮尤研究中心最新民调显示,49%的美国人至少偶尔使用聊天机器人,但63%认为该技术发展太快。自2024年以来,AI聊天机器人使用率从33%增至49%,其中ChatGPT使用量自2023年翻倍,44%受访者使用过。仅16%认为AI对社会有积极影响。年轻群体使用率更高且更悲观:18-29岁中66%使用,48%认为有负面影响。30-49岁使用频率最高,34%每天使用一次以上。约四成美国人用AI处理工作,30%认为提升了生产力,28%认为帮助更了解信息。皮尤2024年研究中,66%担忧AI传播不准确信息。
皮尤研究中心最新调查显示,仅16%美国人认为AI未来20年对社会有积极影响,约40%认为负面。67%受访者不信任政府有效监管AI,59%不信任企业安全开发。30岁以下仅14%持积极看法。近三分之二美国人认为AI发展过快。约四分之一每天使用AI聊天机器人,其中ChatGPT最受欢迎(44%),其次是Gemini(24%)、Copilot(17%)、MetaAI(14%)、Grok(8%)、Claude(6%)和Character.ai(3%)。男性日常使用率(27%)高于女性(20%)。六成受访者经常阅读AI生成摘要。约一半美国人表示日常不使用AI,65岁以上近75%从未使用AI聊天机器人。
三位软件工程师来信询问AI是否会全面接管编程。作者回答最早今年底、最迟后年。以珍妮纺织机为喻,学会用新工具只是缓刑;美团宣布30%–50%裁员印证趋势。作者提出“终端思维”:意图即实现(PRD is Code),中间步骤注定消失。最终问题:当执行被机器接管,人类站在哪里?
一项调查显示,74%消费者认为互联网比10年前更不人性化,平均40分钟出现“bot fatigue”。61%的消费者说不出一个在品牌宣传中善用AI的公司,60%表示看到“AI”一词会反感,16%认为没有品牌用好AI。企业团队每周平均花16.6小时改善AI可见性,但该领域尚无公认领导者。报告建议品牌在AI时代注重“人性化”体验,并为AI引擎提供结构化内容。目前AI引用监测工具仍处早期,定价从免费到六位数不等,且无统一仪表盘。
Epoch AI基于SEC文件分析显示,微软、亚马逊、Alphabet、Meta、Oracle五大超大规模云服务商的AI基础设施支出年增长约70%,经营现金流仅增长约23%。若趋势持续,支出将在2026年第三季度超过现金流。目前Alphabet已通过股权融资850亿美元,亚马逊和英伟达发行债券补充资金。除Oracle外其余公司仍盈利且持有大量现金,但自由现金流可能归零或转负。Epoch AI指出这仅为简单外推,未计入AI投资能否产生足够收入来弥补缺口这一关键因素。
6月17日,西安网警通报破获一起利用AI技术造谣小米公司的刑事案件。3家MCN机构和14名涉案人员落网,其中4人被刑事拘留,查实涉案资金34余万元,查扣电脑29台、手机26部,涉案账号全部注销。警方发现,这些MCN机构利用AI工具生成虚假视频贴文,不加甄别地批量发布至不同网络平台账号。
Anthropic 6月16日发布博文,分析2025年10月至2026年4月约23.5万用户的40万次Claude Code会话。用户平均每周使用20小时,其中代码修改占26%,代码编写占25%,合计超半数。典型会话中人类负责约70%规划决策,Claude完成约80%执行决策。新手(1级)每次提示产生约5个操作和600个单词输出,专家(5级)产生2倍操作和5倍输出(约3200个单词)。
韩国年轻人开始光顾“多巴胺网站”,通过模拟点餐、购物等日常琐事缓解焦虑。有人使用虚假外卖平台,模拟翻看菜单、添加购物车、点击“下单”获得满足感。推特用户@malheeelife今年五月借助ChatGPT搭建了同类韩语模拟网站,配有星级评分和购物车。同期英文应用FakeEats上线,设有等级奖励和AI生成的宣传资料。还有网站让人假装和别人一起抽烟休息,无需真抽和线下见面。Jungwon大学教授金宪植分析,这一趋势迎合了互联网一代对持续感官刺激的需求,模拟行为无需实际成本即可带来心理慰藉。
Hacker News 讨论揭示:Qwen 3.6 35B-A3B 模型提及率 33% 领先,27B 变体以 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 位列前四。Agent 工具中 Pi (49%) 与 OpenCode (45%) 占主导。用户对比称,Claude Opus 可带来 15 倍加速,而本地离线 Qwen 提供 5 倍加速,且完全免费、保护隐私。SWE-bench Verified 基准测试显示,Qwen 3.6 27B 得分 77.2%,35B-A3B 得分 73.4%,接近 Claude Sonnet 4.6 的 79.6%。MoE 架构使大模型在消费级硬件上高效运行。
Adobe 6月16日发布报告,覆盖8国超1.6万名创作者。75%将创意AI视为核心工具,87%称AI加速业务增长和粉丝积累,58%认为增强与大团队竞争能力。但57%表示AI生成内容需大量编辑方可分享。创作者兴趣转向智能体AI,节省时间用于学新技能(22%)或更高层次构思(21%)。48%对职业未来更有安全感,53%因内容总量过大认为更难脱颖而出。
WordPress VIP 报告显示,60% 的美国消费者反感品牌在营销中使用“人工智能”一词;86% 无法完全信任 AI 生成内容,会主动查阅原始信源。42% 认为无来源标注的 AI 回答可信度低于航空附加费、隐私政策与医疗账单。近四分之三受访者觉得互联网比十年前更少人文温度。33% 将点击跳转查看原始内容作为判断可信的首要依据;80% 主张网络信息应保持公开可查阅。调研于今年 4 月开展,回收 2000 份有效问卷(含 800 名企业决策层与 CMO、1200 名普通民众)。
2026年Q1美国成人非虚构书籍销量同比下降9%,自助类下跌26.3%,仅手工艺/爱好/古董/游戏和宗教两个子类别增长。一位出版了多本《纽约时报》畅销书的作者透露,其五本书的印刷版年销量从2022年基准连续下滑:2023年-5%,2024年-13%,2025年-46%,2026年年化跌幅达-57% vs 2025年;若持续,2026年销量将比2022年减少约80%。所有格式在2025年下半年环比上半年下降约45%。作者认为,Claude、ChatGPT等大语言模型能提供更快、更便宜、更个性化的建议,正在系统性取代自助类书籍的“指令传递”价值。头部自助类品牌同期销量也下滑约40–60%,唯一显著变化是AI加速普及。作者判断整个指令传递型内容(包括YouTube教程、播客、在线课程、newsletter)都将面临替代。
6月16日,一篇标题为“Why is Meta destroying its engineering organization?”的博客文章出现在 Hacker News,获得110个点赞。文章指出 Meta 正在解散其工程组织,引发业界广泛讨论。具体原因和后续影响尚未明确。
同一事件,精选展示《Meta万人重组:裁员与AI转型并举》