DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache,但 QK-Norm 需归一化高维 Key,若缓存归一化结果则打破低维优势。文章提出数学等效变换:将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧,推理时每个 token 只需额外缓存一个逆 RMS 标量,即可严格等价实现 QK-Norm,不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中,QK-Normed MLA 相比 QK-clipping loss 更低(1B 模型 gap ~0.02),训练更稳定且收敛更快。
OpenAI Codex 项目负责人安布罗西诺称,设计比代码更难量化评判,训练模型区分优劣设计比验证代码编译更繁琐。Figma 首席执行官菲尔德指出,AI 模型基于数据分布训练,产出通常平庸。格莱美提名音乐人巴斯强调,引导 AI 创作离不开人类审美判断。目前 AI 在创意设计领域主要作为提速工具,无法独立产出成熟成品。
Kim引用quxiaoyin观点指出,中国开源AI并非出于人文主义,而是抢占市场份额、压制美国模型的战略。模型在华为芯片(如DeepSeek 4)上训练和推理优化,使中国掌握模型层与芯片层。同时美国数据中心建设不足,能源和电网容量严重短缺;中国2025年一年新增太阳能装机量相当于美国10–15年,在建36座核电站。华为芯片虽仍落后NVIDIA,但以量取胜。出口管制无法解决问题,美国应投资开源模型、推动中国使用NVIDIA并加速核电建设。
The worst case scenario for USA AI: 1. Chinese open sources keep gaining market share. China owns the model layer. 2. Th...
《华尔街日报》指出,AI对劳动力市场的影响让经济学家产生三种对立看法。弗吉尼亚大学Korinek认为AI可能逆转工业革命,使脑力与体力劳动不再稀缺。MIT教授Autor反驳软件岗位崩塌论,指过去计算机浪潮创造了新专业,提升了判断力、专业知识和人际接触的价值。耶鲁大学Gimbel批评硅谷将整洁编码工作误当作经济模型,真实工作包含混乱目标、关怀、说服和人际关系。白领“笔记本电脑职业”(法律、金融、咨询等)因工作可拆解为重复信息任务面临最明显压力。
A self-evolving agent + a 428B model + 3 Macs = ? Your own AI lab. We ran @MiniMax_AI M3 locally with @tryParallax, righ...
自然语言处理技术正重塑专业社交网络的沟通方式,提升个性化与关联性。核心功能包括消息意图检测、语气风格适配、长篇资料摘要及多语言支持。语义匹配取代关键词匹配,基于共同目标与项目推荐更精准的连接。但AI生成消息可能引发隐私担忧,模型幻觉和语言偏见威胁信任。未来方向包括设备端小型语言模型、隐私保护推理及更严格评估指标,以在透明安全前提下维护真实人际关系。
BREAKING: US Government Bans Llama 4, citing concerns that it is "just really bad"
FT图表显示AI发展速度远超正常科技繁荣周期,但其投资激进度使实际商业回报门槛迅速抬高。国际清算银行(BIS)最新报告指出,AI相关的股市大幅调整可能产生比以往更广泛的影响,因为当前家庭持股比例相对财富和收入更高。AI或成为数十年来最重要的平台转变,但激进的投资周期正快速推高对实际商业回报的要求。
看到Product Hunt日榜上一个产品后,联想到@xiaoerzhan小耳的一款5美元终生版工具。Berry Xia强调小Vibe Coding产品必须重视营销和客户挖掘,否则酒香也怕巷子深。此外,他自制了一个Skills,可输入产品内容或链接自动生成营销讲解视频,TTS音频使用了小米的模型,效果不错。
基于Artificial Analysis的AA-Briefcase评分(模拟多周复杂咨询任务),@emollick 绘制前沿曲线发现:闭源AI模型发展呈指数级增长且加速,开源模型(尤其中国)仍落后约半年。但乐观预测,年底前可能出现“神话级”开源变体。
I took the new AA-Briefcase scores from @ArtificialAnlys (basically having the AI do multi-week consulting gigs with a l...
American and European enterprises will ditch OpenAI and anthropic and adopt Chinese models. Here's why: 1. They can host...
HackerRank 将其 ATS(申请人跟踪系统)开源。开发者测试发现,默认模型 gemma3:4b 在 temperature 0.1 下对同一份简历运行 100 次,得分范围 66–99。若公司分数线设为 85,简历有 65% 的概率被刷掉。改用 Gemini 后分数集中在 48–64,若分数线 60 仍有 28% 的失败率。评分标准中“工作经验”项始终给出 25/25 满分(即使只有一个实习),而“个人项目”项波动巨大。作者指出,LLM 适合解析简历结构,但无法稳定评判经验价值,AI 筛选实质是运气过滤。
Roboflow出品的Supervision工具包已获45K GitHub Stars,三周增长5K。它将常见CV工作流抽象为复用组件,支持模型无关推理、多种annotator(框、掩码、标签、轨迹)、数据集加载转换、跟踪及区域统计。用户只需几行代码即可用YOLO、RF-DETR等模型完成检测标注可视化,大幅降低重复造轮子成本,社区贡献了丰富工具生态。
Bugu(布谷)是一款macOS菜单栏应用,防止合盖后电脑休眠,通过心跳音效提示Agent的五个状态:接收任务(Accept)、运行中(Running)、成功(Done)、中断(Interrupted)和授权(Permission)。支持跳转到具体对话界面。由作者使用Codex和Kimi Code K2.7 Code Highspeed联合开发,Kimi Code在中等编码任务中达180 token/s,短上下文任务260 token/s,速度提升6倍,可导入Claude Code和Codex的skill及MCP。项目已在GitHub开源。
推文对三款Flash级模型(Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash)进行横评。这些模型定位为多智能体系统和RAG系统的驱动模型。评测维度包括Agent Loop迭代能力、Agent能力、前端/后端、空间理解、美学、性价比等。Gemini-3.5-Flash更适合前端页面、建模等“漂亮活”。Step-3.7-Flash极具性价比,在Agent测试中Token效率极高(用最少Token完成最多任务),适合作为OpenClaw、Hermes等Agent框架的驱动模型。DeepSeek-V4-Flash后端能力出色,适合写脚本或驱动ClaudeCode用于AI-Ops。
I took the new AA-Briefcase scores from @ArtificialAnlys (basically having the AI do multi-week consulting gigs with a l...
卡兹克分享Vibe Coding两个必备技巧:①“从第一性原理出发”——强制AI回归问题本质,曾助其发现AIHOT海外信源抓取底层路由隐患并重构;②“对抗式审查”——让AI从恶意用户角度测试,曾找出OOM死循环、未来时间污染等隐蔽BUG。作者建议每2-3周全局对抗式审查。当前AIHOT每周请求量超千万,Skill调用量为网页端10倍以上。两个技巧适用于任何需要验证与创新的场景。
http://x.com/i/article/2052868796495564800
Hacker News 用户发帖呼吁科技新闻平台应提供排除 AI 内容的筛选功能或替代来源,认为 Techmeme 等站点已被 AI 新闻淹没。评论中有人支持这一需求,认为应保留非 AI 科技讨论空间;也有人指出 AI 技术本身具有颠覆性价值,应区分商业炒作与真正的工具创新,并观察到 AI 帮助无编程经验者开发出实用应用。另有资深程序员表示期待接手清理“vibe code”的咨询业务。
近期大量 Claude 账号被封,用户反馈通过 App Store 礼品卡充值的可申请退款。引用推文显示已成功收到 125 美金退款,且同一 Apple ID 可重新订阅 Claude Pro(20 美金),但 Claude Max 版本封号风险最高。建议改用 Codex 替代。
关于Claude 被封号,App store 礼品卡退款我说一下! 再update一下后续: 我不知道过了几天收到了 退款, 我是朋友提醒前天去看了一下已经收到了125美金的退款。(图1) PS:我又用这个ID买了新的Claude Pro ...
作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。
腾讯云 EdgeOne 今日发布「EdgeOne Makers」,通过 npm install -g edgeone 等几行命令即可部署 AI Agent 开发框架,自动处理上下文、并发、沙箱环境等问题,支持绑定域名、关联 GitHub 持续迭代。产品处于 Beta 内测,注册可免费领取 50 万 Token。该工具大幅降低 Agent 部署门槛,利好中小企业。Vista 指出,当开发部署不再是问题,关键转向如何理解企业需求用 AI 解决问题,近期 FDE(前沿部署工程师)岗位走热,正是推动 AI 与业务场景结合、实现落地的具体实践。
3行命令搭一个 AI Agent 框架,腾讯云给力啊! 很多人想开发 AI Agent,除了选框架开发,其实更麻烦的事情是部署。 本地运行没问题,一上线就翻车。 需要解决上下文问题,并发问题,为了安全还要搭沙箱环境,全都自己搞非常麻烦。 腾...
Boris Cherny 基于 Claude Code 团队提炼出五种按“产出方式”而非“专业领域”划分的角色原型:原型师(产新想法)、构建者(快速落地)、优化清理者(打磨UI/性能)、增长者(迭代提升PMF)、维护者(保障系统稳定)。关键洞察:角色不绑定岗位头衔,一人可跨2-3个角色;产品阶段决定配比——新产品需1+2+3,增长期需2+3+4+少量5,成熟期需3+4+5+少量2。团队健康度取决于角色与阶段匹配,且角色会动态漂移。
As engineering, product, design, DS, etc. melt into a new kind of role, I was reflecting on what roles might look like i...
OpenAI Codex 负责人指出,写代码成本趋近零后,品味与策展成为产品新瓶颈。Cloudflare CEO 透露,2026 年上半年平台机器人流量首次超过人类,互联网广告模式面临根本改变。越伴动力创始人分享陪伴机器人“小伴”的取舍——0.4 秒以内延迟与“不讨好”设计,旨在打造能长期生活的生命。
Meta 等公司将员工 token 用量纳入绩效评估,导致出现让两个 AI 智能体全程对话刷量的浪费行为。几个月后,随着 OpenAI 和 Anthropic 提高 API 定价、削减订阅额度,各团队撤回无限 token 消耗政策。然而,AI 能力进入新阶段:过去长时间无监督运行会因模型幻觉积累“复合错误”,现在更多 token 投入反而带来“复合正确性”——耗费越多 token 越可能获得正确结果,代币最大化以新理由重生。
Boris Cherny以Anthropic的Claude Code团队为例,归纳出五种未来产品角色:1)Prototyper(快速产出新想法);2)Builder(将原型转化为生产级产品);3)Sweeper(清理UI、简化代码、优化性能);4)Grower(迭代提升产品市场契合度);5)Maintainer(维护成熟系统的安全可靠与高效)。多数人覆盖2-3个角色,且角色不绑定岗位功能。健康团队需根据产品阶段混合配置:新产品/预PMF侧重1+2+3;增长期/已找到PMF侧重2+3+4+少量5;成熟期/强PMF侧重3+4+5+少量2。
BIS警告,AI热潮背后积累的债务可能引发金融冲击。风险不在AI本身,而在于围绕尚未被证明持久性的收入构建的杠杆化供应链。若AI需求不及预期,数据中心支出放缓,借款者难偿还,压力从科技蔓延至信贷市场。超大规模企业2025年债券发行超1000亿美元;表外工具将数据中心债务转移至私人信贷基金和保险机构;私人信贷基金5年内AI/IT敞口翻两番至约15%,部分零售基金已面临赎回压力。美国股市占MSCI全球指数约64%,家庭股票敞口高于以往周期。芯片商、超大规模企业间循环融资使真实需求更难判断。BIS认为AI仍可提升生产力,但融资结构假定这些提升能快速实现以支撑巨额固定成本。
Anthropic 上周面向 Team 和 Enterprise 用户 beta 发布 Claude Tag,允许在 Slack 频道内 @Claude 布置任务,后台异步执行并回复。Andrej Karpathy 称这是 LLM 交互的第三次重新设计——从网站到 App 再到持久存在的云端智能体。Gergely Orosz 指出真正突破是云端 AI 接入公司内部系统并开箱即用,Slack 仅为入口。该模式对新人、非工程师及不熟悉代码库的开发者尤其有用。Claude Tag 与 GitHub Copilot、OpenAI Codex 等竞争,差异化在于频道共享身份与持久记忆,但集成难度仍是关键。
I talked with a few folks inside Anthropic and I am starting to understand what @karpathy is saying (and what lots of pe...