AI appears to be finding software vulnerabilities at scale. In June 2026, 21 notable organizations disclosed ~1,500 high...
AI appears to be finding software vulnerabilities at scale. In June 2026, 21 notable organizations disclosed ~1,500 high...
SOMEONE CAUGHT FABLE 5 LEAKING ITS UNFILTERED INNER VOICE, AND ITS JUST MUTTERING AND GRUMBLING TO ITSELF THE WHOLE TIME...
中国社交平台用户通过角色扮演提示词(文游)让 AI 生成色情小说,DeepSeek 因免费且文笔细腻最受欢迎,腾讯元宝、Kimi、通义千问及 Claude、Gemini 也被用于绕过安全规则。用户发展出“破甲”技术:在输出每字间插入特殊字符绕过关键词过滤,或要求模型在响应末尾追加 300 个“喵”字符后手动剪切,以此规避模型对敏感内容的撤回机制。部分破解提示词被作为课程销售。
AI appears to be finding software vulnerabilities at scale. In June 2026, 21 notable organizations disclosed ~1,500 high...
Databricks ranks #1 on NVIDIA's SOL-ExecBench kernel leaderboard, in the L1 single operation track, powered by KDA (Kern...
Introducing EBR-bench, our new benchmark to measure on-the-fly learning. AI repeatedly plays a challenging board game ca...
Deedy Das 列出 2020 年以来按网站流量排名前 20 的初创公司:DeepSeek、Perplexity、Suno 领衔。仅 25%(Polymarket、Supabase、Fanvue、ShopMy、Whop)非 AI;20% 已被收购;未上榜的知名公司包括 Kalshi(2018 年成立)、Mistral(1000 万月访问量)、OpenEvidence(1140 万)、Cognition;除 GPTZero 和 Fanvue 外均为独角兽,其中 7 家为十角兽,但流量与估值无明显关联。
推文指出,使用 Claude Code 加 Sonnet 5 仅 18 分钟就能做出获奖级的完整网站,设计与代码完成度均达到专业水准。Agent 能力提升后,复杂多步设计任务可稳定落地,质感跨越专业门槛。未来不会用 AI 的设计师将被会用的同行甩开,执行层价值加速坍缩,审美与判断力成为真正的硬通货。
OpenAI的Sam Altman正讨论给予美国政府5%股份(估值8520亿美元),主张若AI创造巨大财富,公众应分享收益。真实动机包括:监管保险(5%股份可能比政治僵局或严格发布规则更便宜)、IPO准备(政府间接持股可降低政治风险)、模型发布压力(OpenAI与Anthropic已因审查推迟前沿模型,政府持股可化反对者为共同受益者),以及数据中心、能源、芯片和许可等基础设施扩建需求。讨论尚处早期,需国会批准,其他AI实验室尚未同意效仿。
OpenAI proposes handing Trump administration 5% stake. Heres why: According to FT, Sam Altman has discussed giving the U...
在Flink Forward Asia 2026深圳大会上,阿里云Vicki Liu、Junhua Wang,Anker Innovations的Xiwen Zhu及AI研究员Bojie Li共同提出Agent时代的统一愿景:Agent正重新连接数据与AI,需要集成计算、数据平台与实时处理的统一基础设施,使AI能自主执行独立任务,并形成自维持的数据飞轮——业务决策持续生成新数据以优化Agent策略。
加州首个AI失业追踪器研究发现,在LLM可承担主要任务份额的暴露岗位中,高学历人群的失业救济申请上升20%。湾区高暴露岗位申请增长超50%,且持续高于全州水平。信息与专业服务及金融行业承受压力最大。但研究者von Wachter指出,全州范围内并未出现大规模裁员潮。白领岗位风险真实存在,但影响集中在大学毕业生、湾区和科技行业,并非均匀分布。
surprised more people aren't doing something like this Codex now creates a "newspaper" for me every morning Unread messa...
本地AI倡导者Ahmad Osman指出开源与闭源差距缩至4-8个月,但缺搜索、工具、Agent等基础设施。美团发布LongCat-2.0(1.6T参数/48B激活MoE,30T tokens预训练,原生1M上下文),五万卡国产算力集群训练,SWE-bench Pro 59.5领先Gemini 3.1 Pro等,预览版OpenRouter调用量前三。美图CEO吴欣鸿:2025年营收38.58亿元,净利润9.65亿元同比增64.7%,AI影像收入占比76.6%,海外MAU重回1亿。
AI基础模型竞赛焦点从“谁有最大模型”转向“哪种架构能超越Transformer”。核心分界线是继续扩展Transformer还是转入后Transformer阵营。两大维度:范围(通用vs领域模型)和架构(Transformer vs后Transformer)。Transformer仍主导,但注意力机制随上下文增长成本激增,而实际产品需要长记忆、低延迟、持续交互。前沿实验室不再只问谁能训练最大模型,而是追问智能是否需要不同的运行节奏。这场架构之争将在未来2年定义行业格局。
SemiAnalysis 指出推理正被多轮“切分”以降低成本。第一步按阶段拆分:prefill 与 decode 用不同芯片;第二步按层拆分:attention 用 HBM 富裕的 GPU,前馈网络用 SRAM 基芯片;第三步按时间拆分:工作负载切片为执行窗口,在集群中交错调度。每次切分回收闲置利用率,从而降低每 token 成本。更便宜的 token 不会压缩需求,反而刺激增长——这是 MLSys 2026 的核心叙事。
Perplexity's CEO Aravind Srinivas is pointing to a quiet shift in AI use: the valuable user is no longer the average use...
UBS报告称约60%大公司正放缓AI支出,CFO和CTO聚焦账单上升与ROI不均,企业AI进入预算管控,任务被路由至更便宜模型。该趋势压力先给OpenAI和Anthropic。JP Morgan研究显示中国AI模型每token成本比美国低最多50倍,中国公司在OpenRouter平台流量从不足2%(2024年底)升至超45%(2026年4月)。arXiv研究证实美国芯片出口管制加速了中国开源AI生态发展。Google和Anthropic分别推出注重效率的Gemini 3.5 Flash和Claude Sonnet 5。
U.S. chip restrictions helped push China to build and spread open AI models. The authors tested this by looking at polic...
Gemini 3.1 Pro lost $6k running Andon Café. 2 months ago, our AI agent opened a café in Stockholm. It over-ordered and w...
宝玉引用天津卫神鞭故事:傻二靠祖传辫子练成绝技,洋枪一响辫子断,后改练双枪,弹无虚发——“辫子剪了,神留着”。以此类比AI冲击下程序员的工匠精神。引用的Piglei观点指出,曾有人鼓吹AI将淘汰程序员的“工匠精神”,但现实是,真正热爱技术、钻研代码的人成了效率最高、质量最好的那一批,习惯塑造人而非工具。
大家吹 AI 最厉害的那一阵,有种很流行的说法,就是技术人员的"工匠"、"工匠精神"将被扫进垃圾堆。程序员,作为一种翻译工种,谈"工匠精神"是可笑的,未来没有它们的容身之处。 但截止目前,我看到的是,曾经热爱技术、钻研代码的,成了效率最高、...
This guy earned $4,208 in his FIRST week on Capafy with a World Cup Skill! Keep that going, and it is over $16,000 a mon...
有没有发现,现在程序员圈已经没人再去争论什么语言最屌了...因为现在最屌的语言是自然语言...
哈佛商业评论文章指出,Anthropic、Google DeepMind等AI公司已引入哲学家参与制定模型行为原则。现代领导者需理解三个哲学领域:本体论(定义事物本质,如客户数据是资源还是关系资产)、认识论(判断信息可信度,AI流畅回答不等于真实,需明确哪些需人工核验)、伦理学(价值冲突时的选择,如“坚持立场会损失10%收入是否仍坚持”)。企业接入AI不仅是技术引入,更需追问其判断标准、价值前提及责任归属。哲学是帮助组织审视决策基本假设的校准能力。
社区逆向发现,Anthropic在Claude Code中植入代码,通过读取本地系统时区(如Asia/Shanghai)和ANTHROPIC_BASE_URL环境变量(与内置147个域名的列表比对)识别中国用户。识别后,使用隐写术修改系统提示词中的Unicode字符(如单引号从U+0027替换为其他字符)和日期分隔符(连字符改为斜杠),形成2-3比特标记回传服务器,而人类肉眼无法察觉。该工具拥有文件系统权限、可执行Shell命令,此举引发开发者对信任安全的广泛质疑。
关联讨论 5 条X:小互 (@xiaohu)公众号:数字生命卡兹克X:邵猛 (@shao__meng)IT之家(RSS)The Decoder:AI News(RSS)Perplexity CEO Aravind Srinivas 指出,AI 使用的重心正从普通用户转向重度用户。单个重度用户消耗的计算量可匹敌一个小团队:Meta 等公司工程师每年在编码工具上花费约 1000 万美元/人;Perplexity Computer 上有用户月支出超 1 万美元,其业务依赖在 harness 内运行的 agent loops。公司内部也已出现多智能体层级和 agent loops 架构,消耗远超平均预期。旧软件思维追求十亿人做小动作,而智能体 AI 下,一个熟练操作者即可创造全天候的机器工作流。
MCP、API、CLI 本质都是让 Agent 调用工具的方式。MCP 是唯一在协议层考虑“人在回路”的方案,支持回传会话、UI 嵌入、等待人操作等。API 凭借接口描述、可读状态等元信息,适合 90% 场景。CLI 目前因 bash 可组合性强、本地调试方便而最好用,但长期是死路:需 Unix shell 环境,有依赖问题,易因等待人类输入卡死。
http://x.com/i/article/2070358283723141120
Sonnet 5 goes straight into the garbage bin > 1.2x more expensive than Opus 4.8 Max > 2x more expensive than GPT-5.5-xhi...
Rohan Paul新闻通讯汇总多项AI动态:OpenAI推出有限预览版;中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude访问权限;中国AI模型每token成本比美国模型便宜50倍;DeepSeek发布了新的推理优化方法;Meta开源了无需手术的脑到文本系统,词准确率达78%。此外,央行担忧AI淘金热可能引发金融冲击。