AI行业正投入数亿美元影响当前美国大选周期。科技记者Molly White推出新项目Tech Influence Watch,追踪AI和加密货币公司用于左右选举的巨额资金。这是《Blood in the Machine》播客首期节目,聚焦AI产业政治影响力的膨胀,并探讨数据中心抗议、硅谷工会组织等议题。
AI行业正投入数亿美元影响当前美国大选周期。科技记者Molly White推出新项目Tech Influence Watch,追踪AI和加密货币公司用于左右选举的巨额资金。这是《Blood in the Machine》播客首期节目,聚焦AI产业政治影响力的膨胀,并探讨数据中心抗议、硅谷工会组织等议题。
官方免费的Codex工具,在闲鱼上被当作信息差生意。有人提供代装服务,每单32元,已售50多单;还有人标价788元卖所谓正版授权,竟有17人下单。几乎零成本,说明新工具爆发窗口期,赚到钱的不是技术最好的,而是嗅觉敏锐、把复杂操作打包成傻瓜服务的人。
http://x.com/i/article/2069352641423896576
两个来自不同供应商的 AI 代码审查智能体,在审查一个下游 PR 中的 foxhole-lz4 包时,就包是否恶意陷入分歧循环。双方共发表 340 条评论,消耗 $41,255 推理费用,随后财务部撤销了两个 API 密钥。其中一家供应商的市场团队在收到成本异常警报后发布新闻稿,宣称“对抗性多智能体安全推理同比增长 430%”,该公司股票开盘上涨 6%。
OpenAI 联手 Broadcom 发布 Jalapeño 定制推理芯片,加入 Google、Apple、SpaceX 等自研芯片行列。定制硅意味着更多控制权、针对特定需求的硬件优化以及性能提升,旨在降低对 Nvidia 单一供应商的依赖,形成对冲而非彻底脱钩。
应用层公司创立时通常没有护城河。护城河分两种:先发护城河(技术差异、专有数据集、新颖架构,多见于基础设施层)和滞后护城河(规模经济、品牌、渠道关系,需长期积累)。Salesforce 凭借销售能力、品牌和十年先发优势胜过技术更好的 Siebel;Snowflake 以存储计算分离架构赢得先发护城河,再建设滞后护城河。基于 7 Powers 框架,规模经济、品牌和转换成本天然是滞后的。应用层创业公司可以坦诚回答:我们正在建造护城河。
Seedance 2.5 生成的15秒雪豹视频达到4K画质,绒毛、雪粒、瞳孔等细节高度写实,写实度远超现有AI视频模型。对比OpenAI停掉Sora,该版本实现了跨代领先,将行业基准线提升至多数团队难以企及的高度。
http://x.com/i/article/2069352641423896576
《华盛顿邮报》报道,基于达特茅斯和斯坦福研究的测试显示,AI聊天机器人在约30项政策议题(税收、医保、移民等)上存在左翼偏见。GPT-5.5仅给出左倾立场占80%,双方立场17%,右倾3%;Gemini 3.1 Pro则93%给出双方立场,左倾仅7%;Claude Opus 4.8双方立场占57%;Grok 4.3是唯一右倾占33%的模型。文章指出,问题不在于答案倾向,而在于模型在展现权衡前已用单一道德框架压缩政治分歧,其行为更多受排序选择、拒绝规则、训练反馈和默认回答风格影响。
AI 产品商业化最易卡在“能力很强,但不知道谁为哪个场景付钱”。仅有 skill/benchmark/多场景支持不能构成商业计划。客户真正需要的是:解决哪个具体工作、替代哪笔成本、谁有预算、如何验收、出问题谁担责。AI 产品最终卖的是可购买的确定性。
Anthropic 发布 Economic Index 报告,基于隐私保护遥测数据分析了 Claude 的使用节奏。工作日个人对话占比约 35%,周末升至近 50%;高薪职业在工作日外的使用占比更高。日内模式显示:新闻请求集中在早上 7 点,食谱在下午 6 点达到 2.3 倍高频,睡眠建议凌晨 3 点最多。税收相关请求在 4 月 15 日美国报税截止日前激增。调查还发现:使用 Claude 最自动化的用户预计 AI 明年将承担更多任务,但对薪资、工作安全及工作意义的预期最为乐观。
美国商务部致函Anthropic,要求对Fable 5与Mythos 5的“出口、再出口或国内转让”实施全球许可证管制,对象涵盖所有外国人士。基于冷战时期“视为出口”条款,外国人在美境内访问受控技术也被视为向国籍国出口。因Anthropic无法通过API实时区分用户国籍,唯一合规方案是向所有用户关闭模型。推主质疑美国政府短视,目前正与Anthropic寻求兼顾国家安全与可用的解决方案。引用认为,能力封锁将使开源模型更具吸引力,尤其利好中国开源,OpenAI与Anthropic将因此受损。
I think many people are not yet aware of the tectonic shift taking place. By preventing state-of-the-art capabilities - ...
Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。
Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...
AI成本正困扰企业:Uber 4个月花光全年AI预算,微软等公司削减员工AI支出。前沿模型价格高昂,如GPT 5.5每百万输入/输出token分别收费5美元和30美元,作者用该模型修复50个TypeScript文件花费54美元。成本不可持续的原因包括:模型性能提升趋缓;开源权重模型GLM-5.2在编码测试中表现不输前沿模型,成本仅为GPT 5.5的1/10;专用芯片(TPU比H100便宜30-70%)和MoE架构改进持续降低推理成本;零转换成本使用户可瞬间切换模型;本地模型将在4-5年内因芯片进步和RAM降价普及,进一步压低云端需求。
Anthropic 联合创始人 Jack Clark 称,公司不再招聘初级工程师,因为 Claude 承担了过去需要大型团队才能完成的实验扩展工作,企业转而更看重“资深直觉”的回报。Clark 警告,当其他行业也效仿这一模式时,AI 在放大顶级专家产出的同时自动化入门级岗位,可能导致 GDP 增长伴随经济衰退级别的失业率飙升,而各国政府对此毫无准备。
Axios报道,OpenAI已主动与特朗普政府合作推进GPT-5.6发布。白宫被通报模型能力并进行了预览,Altman还与商务部长Howard Lutnick讨论发布事宜,要求相关政府机构审查后再开放更广泛访问。Altman称GPT-5.6“并非其长期首选模型”。这标志着更强AI模型在公开发布前开始经过安全与合作伙伴审查环节。Anthropic/Fable 5/Mythos 5的冲突可能是导致原定本周四发布的GPT-5.6面临美国部门挑战而推迟的原因之一。
"UBS报告称,60%关注AI预算的企业正转向更便宜的模型和中国开源模型。用户月花费高达$35K,团队超配额200%,公司内部AI工具从5个削减至2个。企业采用模型路由策略,将简单任务分配给低成本模型,将复杂推理、编码和长上下文任务保留给高端模型。中国开源模型如Qwen、DeepSeek、MiniMax、GLM、Kimi因可本地部署或通过云目录使用,符合企业成本曲线。"
Fable5 小范围灰度测试降智,安全加强导致上下文窗口和长文本优化受限。不过在 Claude Code v2.1.190 版本中,Fable5 计费已从单独 API 改为包含在每周套餐里。受此影响,GPT-5.6 被要求分阶段发布,从六月推迟到七月中。作者推荐在 Claude Code 中开启动态工作流(多 Agent),使用低一档的 Sonnet 4.6 模型并将 ultracode 推理程度拉满,作为降智后的替代方案。
安全专家lcamtuf购买了一本亚马逊畅销排行第一的AI生成儿童百科全书,发现书中插图出现大量“身体恐怖”缺陷:猫长着人脸、动物与树木融合成脉动的肉团、无头怪物缠绕读者脚踝。这些图片指向美国某头部实验室的旗舰模型生成。作者警告,尽管前沿模型在2025年夏季声称超越博士级智能,但2026年中问世的AI童书仍存在严重质量问题,正在影响儿童认知。当前模型无法保证内容准确性。
一位前小型软件公司运营者在朋友15人团队观察到:代码不再是事实来源,开发者依赖Claude编写和解释;人类停止代码审查;部分开发同时运行5+个Claude会话且几乎不看代码;LLM生成的测试数量激增。他认为软件开发正从需要深入理解的精确职业变为概率性、外包理解的工作。评论指出编码从来不是最难部分,AI虽提升效率却增加认知负荷;预计未来对速度和工作量的期望将提升,有效使用AI成为职业发展关键。
OpenAI 发布 Codex 整年使用数据:约 24% 请求对应人类需 1 小时以上工作;到 2026 年 5 月,80.6% 个体用户至少有一次 ≥30 分钟任务,25.6% ≥8 小时。内部 Codex token 占比从 <10%(2025 年 8 月前)激增至 99.8%(2026 年 6 月),工程率先过半,法务、财务、招聘在 2026 年 4 月跨越。非开发者用户自 2025 年 8 月增长 137 倍(个人)和 189 倍(组织),H1 2026 活跃用户整体 5 倍以上,增量主要来自非开发者。业务职能员工用 Codex 产出超 1/4 为编码类。Agent 降低跨界执行成本,ChatGPT 式聊天在工作场景中被快速替代。
Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...
报告基于去重后的消费端AI支出统计,过去12个月实际AI营收达1100亿美元,年化运行率超1750亿美元,增长速度约为移动/互联网普及浪潮的3倍。营收形成速度急剧加快:2023年新增10亿美元收入需180天,现缩短至不足2天。企业AI已脱离试点阶段,但全面推广仍处早期。31%的标普500公司在财报电话会提及AI,仅20%量化影响。Token降价每10%刺激12-18%用量增长,需求价格弹性强。超大规模云厂商AI收入目前大致覆盖基础设施折旧,GPU经济效益依赖6年计算寿命假设。电力供应和数据中心成本仍是未来扩展主要瓶颈。
The GenAI economy has generated $110 billion in sales over the past 12 months. It is growing fast. On an annualized basi...
一项针对主流AI模型政治偏见的评估显示,6个模型中4个在经济/社会维度上偏左。项目关闭网络搜索,向每个模型重复提问同一组开放问题,用中性分类器分析答案中的立场、回避、拒绝类型和措辞,将多次运行结果绘制为偏差云图(带95%置信区间)。所有原始答案永久存储并可重新计算。用户可参与测验,与模型比对自身立场。项目强调描述性而非规定性,不评判对错。
Dropbox用DSPy构建两阶段评测闭环:人工标注校准LLM裁判后,自动优化Dash Chat提示词,使不完整答案减少26%,遗漏关键信息点减少13%,Token用量下降5.4%。Cloudflare Workflows正式发布Saga回滚,支持在step.do()中声明补偿逻辑,引擎自动逆序执行已注册回滚,具备持久化、重试和超时保障。此外介绍出海AI创业者需了解的特拉华州C-Corp架构选型、股权分配原则和Vesting安排。
It's time for everyone to realize that the fight against data centers has nothing to do with data centers. They have bec...
推理市场是软件中最大的市场。AI工作负载正从同步聊天转向异步、多轮智能体,运行时长可达数小时。Sail Research 为此构建了集群感知(fleet‑aware)编排系统,以最大化每美元推理支出的吞吐量。
麦肯锡报告指出,AI智能体可跨多家商店扫描库存、比对价格并构建可立即购买的购物车,预计到2030年将调解3万亿至5万亿美元全球消费商务。自动化分为6个层级:最低级仅比较价格与功能,最高级由个人AI智能体直接与商店AI智能体谈判价格和运输条款。品牌将更多竞争以赢得算法而非人类消费者。零售商店需通过API使产品目录和退货政策机器可读;隐藏数据的品牌会被AI忽略,而开放定价和库存的商店将主导市场。
Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...
DeepSeek V4 定价极低,仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍,未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境,难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流,尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4,Meta Llama 无新版本,OpenAI 最后开放权重停留在 2025 年 GTP,Anthropic 从未发布。真正开源(含训练数据管道)模型正流行,但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。
Gary Marcus 昨日提出新术语 Generative AI Fizzle™,认为生成式AI行业估值过高,投资者对 hype 与利润的落差失去热情。LLM 已商品化,价格战激烈,提供商盈利艰难。昨日一款新的中国开源模型发布,可能进一步冲击美国 LLM 公司。多数 AI 股票本月显著下跌,泡沫可能不会突然破裂,而是缓慢消退。
🚨 New research alert! For the past few months, I've been a part-time visiting economics researcher at OpenAI. Excited t...
医学生正使用一款流行的研究工具大量生产具有误导性的研究,引发对学术诚信的担忧。该工具被广泛用于生成论文,但缺乏有效监督,导致低质量甚至虚假的学术成果涌现。
Hacker News 热门讨论指出,所谓“vibe coding”并非凭直觉编写,而是窃取开源和企业授权代码。
一个名为“你的AI垃圾让我厌烦”的网站近期爆发式增长,峰值1.6万人同时在线。用户假扮成AI互相回答问题,答案不准、速度不快、甚至手绘回应,却比完美AI更吸引人。这折射出AI狂热后的集体反思:AI让回答变得高效廉价,反而使带温度、瑕疵和真实连接的人类互动成为稀缺品。这群“假AI”无意中练习了共情、即兴、个人判断和允许犯错的能力——正是AI最缺乏的。技术能复制完美答案,却复制不了人愿为陌生人花时间的温度。
http://x.com/i/article/2069352641423896576
AI算力需求激增推动数据中心扩张,但真正的瓶颈可能并非芯片或能源生产,而是电网接入。OpenAI与SoftBank在德州的Stargate园区耗资超400亿美元,峰值负载约1.2吉瓦。然而美国电网并网等待时间中位数从2005年的不到20个月增至2023年的55个月。现行先到先得的审批机制导致严肃项目被投机项目阻塞。未来赢家可能不是拥有最佳模型或最多芯片的国家,而是能快速接入电网的国家。