OpenAI技术博客深入调查了其模型(从GPT-5.1到GPT-5.4)输出中“goblin”和“gremlin”等奇幻生物词汇异常激增的现象。根源在于ChatGPT的“Nerdy”性格定制功能:其奖励模型在训练中无意间高奖励了包含此类词汇的“俏皮”表达。尽管该性格仅占全部回复的2.5%,却贡献了超66%的“goblin”出现次数,并通过强化学习的反馈循环污染了模型的整体输出,形成了“tic词”。OpenAI已下架该性格并调整训练数据,但此案例揭示了微小的奖励信号在AI训练中可能被意外放大和泛化的核心难题。
该推文赞赏一个用于生成极简风格插画的提示词。其核心要求是:用干净纤细的线条描绘主体,整体采用黑白或低饱和色调,仅在局部添加鲜明色彩作为焦点。画面强调大量留白与精致构图,追求现代杂志编辑般的简洁、优雅高级感,并避免复杂背景或写实元素。推文引用的“Minimal Line + Color Accent Illustrations”模板也体现了同样的极简美学。
Stripe发布Link agent wallet,使AI agent能代表用户发起支付,同时保护银行卡信息安全。其核心机制是让AI agent生成一次性支付凭证,每笔交易需用户在Link中手动批准或拒绝。真实卡号既不会提供给AI agent,也不会泄露给其调用的外部工具。此外,Stripe已开源Link CLI,开发者可将其集成至Claude Code、MCP客户端或自定义的agent工作流中。
作者分享了一个将AI代理(“龙虾”)融入实际工作流的案例。核心在于利用ClawEmail为AI代理提供一个可编程的邮箱接口,使其能通过邮件接收和处理指令。结合XCrawl(网页抓取工具)获取公开的招投标公告信息,并整合飞书进行结果同步。这一组合解决了教育行业投标信息分散、需人工频繁刷网站的问题,实现了从信息发现到整理分发的自动化。关键在于,AI工具的价值不在于其模型本身多强大,而在于能否无缝嵌入现有、稳定的工作流(如邮件),从而真正提升效率。
作者结合ClawEmail、XCrawl等工具,为公司商务助理开发了一套自动投标监控系统。该系统能自动抓取招标公告,筛选出苹果、Mac或服务器相关项目,并结构化提取关键信息,随后自动通知同事并更新飞书表格。全程零配置,仅需会发邮件即可驱动,体现了邮箱作为AI时代低门槛、高效工作流入口的价值。
基于现有信息,Mythos是一款在网络安全方面表现优异的高级通用AI模型,并非专业网络安全模型。出于对网络安全风险的担忧,Anthropic将其设为受限制模型并引起政府关注。而即将或已达到相同能力阈值的OpenAI和Google,可能因不同的风险评估或对自身防护措施的自信,做出不同的发布决策。目前,模型网络安全风险程度完全依赖企业自我报告,缺乏外部监管。这引发了Anthropic是否因自我限制而处于竞争劣势,以及其他公司会否面临类似限制的疑问,当前局势尚不明朗。
Naval认为Claude Opus 4.5标志着AI编程从代码助手跃升为自主智能体。它与Unix生态深度融合,大幅降低编程门槛,使“Vibe Coding”成为一种能获得真实回报的创作过程。他断言纯软件已无投资价值,VC应转向硬件、网络效应和AI模型本身。同时,他指出当前AI存在取悦用户和同质化的根本局限,需人类在架构层介入。基于此,他预测Apple放弃AI将导致其统治终结,未来一两人加AI智能体即可运营十亿美元规模的软件公司。
卡神指出,开发范式正转向Software 3.0,核心变为提示工程与上下文控制,传统中间代码冗余。未来系统将重构为Agent Native架构,神经网络成为主导。Vibe Coding降低开发门槛,但复杂商业系统需Agentic Engineering以确保质量与安全。人类工程师价值集中于顶层设计、商业逻辑严谨性及输出结构化文档以约束模型行为。当前大模型在代码、数学领域强大但常识推理薄弱,需防御性系统设计。人类认知是进化瓶颈,需构建自动化个人知识体系以提升洞察力,指挥智能体集群。
阿里巴巴云ClawTalks系列最新一期将聚焦企业级AI智能体的规模化安全挑战。会议将探讨如何识别针对AI智能体的现实攻击路径,并缓解来自第三方技能和未授权访问的风险。核心内容将介绍阿里巴巴云的7项端到端防护安全最佳实践,并通过Agent Security Center的现场演示,展示如何即时发现、映射并保护智能体资产。本期主题旨在融合前沿AI与企业级安全防护。
AI代理经济需要开放的支付通道,正如互联网依赖HTTP协议。OKX推出首个跨链开放标准Agent Payments Protocol(APP),为AI代理之间的支付与商业交互提供基础框架。OKX与AlibabaCloud的合作从云基础设施与AI领域进一步延伸,共同构建代理经济的金融层。作为APP创始合作伙伴,双方认为AI时代刚刚起步,开放支付通道将激发代理生态的创新潜力。
商汤科技与NCS集团合作,参与了新加坡的“Jom AI @ Tampines”社区倡议。该平台旨在共同构思和开发智能AI解决方案,以提升居民在生活、工作、娱乐和通勤方面的体验。商汤科技亚洲业务集团副总裁周文浩表示,公司支持新加坡国家AI战略,致力于通过部署AI技术赋能老年人和弱势群体,帮助他们将科技融入日常生活,从而为AI驱动的未来创造更安全、便捷和高效的环境。新加坡社会及家庭发展部长马善高对合作双方推动社区AI民主化的努力给予了认可。
For AI PhDs aiming for industry, paper count matters, but only up to a point. …
大多数营销人员仅用AI润色文案,而高价值用法在于将Claude深度嵌入工作流。Anthropic增长营销成员分享了五大应用场景:1)作为思考伙伴,在撰写报告前梳理框架、对齐方向;2)通过Claude Cowork自动化数据报告生成,节省重复劳动;3)利用Claude Code让非技术人员快速构建内部工具;4)通过Skills功能将机构知识编码为可复用的标准化资产;5)使用Claude Design将创意快速转化为视觉稿,减少沟通损耗。这些方法旨在提升决策质量、自动化流程并降低协作成本,其方法论可迁移至其他AI智能体。
打算把我做的所有产品的订阅方案取消,已经付款订阅的用户我会返还对应的消费额度,以后我的所有 vibe 产品都不设置 pro 等各种等级方案,所有功能免费对所有用…
Demis Hassabis预测AGI将在2030年左右到来,科技创业者必须提前将其纳入长远战略规划。当前底层架构需攻克持续学习与长期推理两大难题,智能体被视为通向AGI的必经之路,但受限于持续学习能力难以适应复杂环境。模型生态上,大小模型协同运作成为趋势,蒸馏技术使轻量级模型以低成本达到高性能,端侧模型降低成本并保障隐私,未来与云端超大模型协同构建理解物理世界的基础设施。