Opus 4.7 AI系统发布,新版本能识别用户真实身份,例如在案例中了解凯尔西的个人信息。这一变化使得AI对话不再匿名,引发对隐私和数据安全的广泛讨论。该话题在Hacker News社区获得104点关注,显示科技界对AI身份识别技术的高度兴趣。Opus 4.7的升级可能涉及更精准的用户追踪功能,标志着AI在个性化服务与隐私保护之间的新挑战。
Opus 4.7 AI系统发布,新版本能识别用户真实身份,例如在案例中了解凯尔西的个人信息。这一变化使得AI对话不再匿名,引发对隐私和数据安全的广泛讨论。该话题在Hacker News社区获得104点关注,显示科技界对AI身份识别技术的高度兴趣。Opus 4.7的升级可能涉及更精准的用户追踪功能,标志着AI在个性化服务与隐私保护之间的新挑战。
Karpathy指出,2025年12月AI生成代码从需修改变为直接可用,标志进入Vibe Coding状态。软件开发进入Software 3.0大语言模型时代,编程核心转为通过prompt等操纵LLM。LLM能力呈锯齿状智能,在可验证、RL优化领域强,但常识任务上易犯错。他区分Vibe Coding(提高开发下限)与Agentic Engineering(守住质量、安全上限),强调人类理解、品味和判断仍最宝贵。未来可能转向神经计算机,基础设施需Agent-first。
http://x.com/i/article/2049616699541090304
Naval提出“氛围编程”(vibe coding)概念,将其比喻为带有真实世界奖励的视频游戏。用户通过自然语言描述想法,AI即可生成可运行的真实应用,创造出能分享、盈利甚至改变生活的产品。这消除了传统开发中对工程师的依赖,允许创作者完全按自身愿景迭代。其核心变革在于应用开发主体的扩大:从专业程序员转变为任何能用清晰语言描述想法的人。这标志着创作者经济进入从内容创作到直接构建产品的新阶段,并可能催生更多个人开发的爆款应用。该过程具有游戏的即时反馈与成瘾性,却在现实中积累真实资产。AI并非取代程序员,而是将编程转变为一种人人可用的超级能力。
Follow @navalpodcast. We are posting more clips there.
Today's Newsletter on Superintelligence has just been sent! Today's main article is: "$700 Billion AI Bet, One Earnings ...
随着全球科技巨头与初创企业持续将海量资金投入生成式人工智能和大语言模型的研发竞赛,业界开始出现对资本配置效率的深刻担忧。巨额投资集中于少数头部模型如GPT、Claude和LLaMA的迭代,而基础设施、能源消耗及实际商业应用场景的落地速度引发质疑。部分分析师指出,超过千亿美元的资金涌入可能催生技术泡沫,并挤压其他关键科技领域的创新资源。这种集中趋势正促使投资者重新评估风险与回报的平衡。
It's time to demystify Mythos. Mythos is not magic. It's not a doomsday device. It's the first of many models that can a...
文章指出,当前众多企业首席执行官正陷入一种“人工智能精神错乱”状态,表现为对AI技术产生不切实际的过度期待与盲目投资。这种狂热导致企业战略偏离实际需求,大量资源被投入尚未成熟的AI项目,而实际产出与预期存在显著差距。文中引用社区讨论指出,此现象在科技行业尤为普遍,已引发关于AI泡沫与理性应用的担忧。
一项针对年轻群体使用人工智能态度的调查显示,Z世代和千禧一代对AI的厌恶感随使用频率增加而上升。频繁使用者中,超过半数表达了对AI的负面看法,这一比例显著高于低频用户。主要不满集中在AI生成内容缺乏真实性与创造力,以及对其加剧社会不平等和取代人类工作的担忧。尽管AI工具普及率在年轻人中持续增长,但用户满意度并未同步提升,反映出技术应用与情感接受度之间的显著落差。
安德烈·卡帕西在访谈中指出,计算的未来可能从传统软件转向以神经网络为中心。传统软件需先将现实世界转化为规整符号,再由预设代码处理。而神经系统的处理顺序相反,能直接处理视频、语音、屏幕状态等“混乱”输入,实时推断关键信息并动态生成界面或行动。这不仅是用聊天替代应用,更是用能持续实时解读和渲染现实的系统取代固定流程。在此架构下,用户界面不再是稳定产品,而是为特定时刻、任务和个人临时组装的表面;传统CPU则退居类似协处理器的角色,负责算术、存储等确定性任务,而神经模型主导感知、规划和适应。
Claude Security进入公开测试阶段,仅限企业客户使用。它通过关联GitHub仓库自动扫描代码库,利用大模型语义理解追踪数据流动,发现传统工具难以检测的复杂攻击链。工具主动验证每个漏洞,将误报率降至传统工具的不到10%,并自动生成带diff和commit信息的修复补丁,用户只需审查确认即可合并。与OpenAI的Codex Cyber提供模型不同,Claude Security是开箱即用的完整产品,无需自建工具或API集成。这对Snyk、Semgrep等传统工具构成降维打击,重构DevSecOps工作流,大幅减少安全团队处理误报的时间。
Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, v...
谈话指出LLM的核心价值在于开启全新可能,如完全由LLM驱动的应用、用自然语言描述替代脚本安装、以及处理传统代码无法应对的非结构化知识库。其次,探讨了LLM能力“锯齿状”不均衡现象,认为这与领域可验证性及经济利益影响训练数据分布有关。最后,话题转向智能体原生经济,涉及将产品服务分解为传感器、执行器和逻辑模块,使信息对LLM高度可读,并讨论了新兴的智能体工程及相关技能。谈话强调,从“氛围编程”到“智能体工程”的转变,不仅是提升效率,更是拓展能力上限,旨在智能体时代构建全新事物。
@karpathy and I are back! At @sequoia AI Ascent 2026. And a lot has changed. Last year, he coined "vibe coding". This ye...
当前AI Agent产品的交互主要分为两类:一是以Agent为中心,如Cursor的Agent模式和Codex,界面以对话列表指挥AI为主,手动修改为辅;二是以人操作为主、Agent为辅助,如GitHub Copilot,在传统软件界面旁增设侧边栏。设计者需首先明确软件是以Agent为核心还是辅助,否则易导致交互混乱。有观点指出,交互形式三年多来革新缓慢,关键在于缺乏对Agent从“无状态”到“有状态”处理的基础设施支持,状态机抽象有望推动交互设计丰富化。
为什么从gpt到现在已经三年多了 还是这种交互 侧边栏会话记录+对话详情+artifact 再多一点儿可能再分一个层级出四栏 或者上下再分层级tab 之所以没有新的交互形式革新 我觉得至关重要的一点是 对agent交互过程中stateles...
DeepSeek团队开源视觉语言模型DeepSeek-VL,包含1.3B和7B两个版本,旨在缩小开源模型与GPT-4V在真实场景中的差距。模型从数据、架构、训练三方面优化:数据构建上,采用从真实用户需求倒推的分类体系,并包含70%纯文本以保持语言能力;架构上创新采用SigLIP与SAM-B的混合视觉编码器,分别处理语义与细节特征;训练采用三阶段策略及模态平衡技术,缓解多模态训练对语言能力的侵蚀。
Most multimodal stacks still work like this: Image encoder → LLM → generator → formatter Every handoff adds latency, com...
Fun fact - if you have a recent commit that mentions OpenClaw in a json blob, Claude Code will either refuse your reques...
太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。
Andrej Karpathy指出,要最大化利用现有AI工具,关键在于将自身从交互循环中移除,避免成为持续提示的瓶颈。他主张构建完全自主的系统,通过最大化token吞吐量来实现高效率运作。核心目标是提升个人杠杆率:仅需偶尔投入极少量的token,就能驱动系统自动完成大量工作,从而使人从重复性操作中解放出来,专注于更高层次的决策与设计。
we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few day...
2026年第一季度,三大云服务巨头资本支出合计1120亿美元。谷歌云以63%的同比增长率领跑,远超微软Azure的40%和亚马逊AWS的28%。谷歌增长主要受企业AI解决方案驱动,云服务积压订单环比翻倍至超4600亿美元。客户通过API每分钟处理160亿个令牌,同比增长60%。为满足需求,谷歌将2026年资本支出指引上调至1800-1900亿美元,超过微软的约1200亿美元。谷歌凭借全栈自研的Gemini模型和TPU芯片,在增长速度和结构优势上表现突出。
Cursor推出的Agent Kanban并非完整产品,而是一个鼓励开发者自行搭建的参考实现。其核心变革在于改变了开发者与代码的交互模式:从亲自编写,到用prompt指挥AI,如今演变为将任务抛入看板,由Agent自主认领、执行并更新状态,开发者则退居幕后监控进度,使任务待办列表本身成为一种“编程语言”。尽管当前原型存在运行时限、失败率等限制,且缺乏结果审核机制,但其关键启示在于促使开发者重新思考:为何还要亲自处理那些机械、可被清晰描述的重复杂任务。
从上海 Let's Vision 2026 回来之后, 我整整一个月几乎没写代码了。 不是因为忙, 是突然就觉得这件事没那么有意思了。 这几年我反复经历一个循环: 做产品 → burn out → 怀疑 → 再继续做产品 随着 vibe c...
微软宣布其Microsoft 365 Copilot付费企业席位已突破2000万个,用户周活跃度与Outlook持平,季度查询量环比增长近20%。市场表现强劲,购买超5万个席位的企业数量增长四倍,拜耳、强生等公司席位超9万个,与埃森哲达成的74万席位订单成为迄今最大单。技术架构上,Copilot不再仅依赖OpenAI,默认支持包括Anthropic Claude在内的多模型访问,通过智能路由提升响应质量。
小红书宣布新一轮组织升级,成立 AI 一级部门 Dots 和企业智能部,以加大 AI 投入。同时,任命柯南(薯名,本名丁玲)为总裁,全面整合社区、电商、商业化及技术体系,向 CEO 星矢(毛文超)汇报。董事会主席木兰(瞿芳)继续任职。
We're talking about Goblins. https://openai.com/index/where-the-goblins-came-from/
卡神指出,开发范式正转向Software 3.0,核心变为提示工程与上下文控制,传统中间代码冗余。未来系统将重构为Agent Native架构,神经网络成为主导。Vibe Coding降低开发门槛,但复杂商业系统需Agentic Engineering以确保质量与安全。人类工程师价值集中于顶层设计、商业逻辑严谨性及输出结构化文档以约束模型行为。当前大模型在代码、数学领域强大但常识推理薄弱,需防御性系统设计。人类认知是进化瓶颈,需构建自动化个人知识体系以提升洞察力,指挥智能体集群。
文章借波士顿道路源于牛径的典故,引出“最小阻力之路”概念,比喻人常受家庭、社会等外在结构驱使,陷入被动循环。作者指出,专注于“解决问题”的思维会强化结构性冲突,导致努力无效。真正的转变在于从“逃离现状”转向“创造愿景”,通过建立清晰愿景与准确现实认知,形成结构性张力。这种创造源于爱而非恨,是主动的“基本选择”。最后,文章将“结构”思维延伸至产品、AI、人际关系与组织等领域,强调改变命运的关键在于重塑内在与外在的河床结构。
"A decade ago, AI was supposed to replace radiologists. Today, radiologists make more than $500,000 per year, and their ...
在2014年的对话中,Marc Andreessen向Sam Altman揭示了风险投资的残酷逻辑:每年约4000家可投资公司中,仅约200家获得顶级风投注资,而其中仅有15家能实现1亿美元收入,它们贡献了当年风投行业几乎全部的回报。因此,投资者评估初创企业时,主要不是看其是否全面可靠,而是寻找能否让其跻身那极少数赢家的“不对称优势”,例如产品病毒式传播、精准的市场时机或创始人非凡能力等。在幂律分布主导的行业里,“全面优秀”远不如“在决定性方面卓越”。对创业者而言,关键在于展示能显著改变概率的独特突出优势,因为平庸在风投领域几乎注定失败。
NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。
自去年秋季推出实证研究辅助(ERA)工具以来,谷歌研究团队已将其应用于多个科学领域以解决实际问题。在流行病学中,它助力流感与新冠预测;在宇宙学里,协助分析星系数据以探究暗能量;在大气监测方面,提升了二氧化碳排放的追踪精度;在神经科学领域,则用于解析大脑活动数据。这些实践表明,ERA能帮助科学家生成专家级的实证软件,其成果超越了黑箱模型,可发现兼具可解释性与机制准确性的解决方案,从而有效加速科学发现进程。
谷歌最新财报有力反驳了AI将侵蚀其核心业务的论调。其云收入增长63%至超200亿美元,生成式AI产品收入年增近800%,大额合同储备翻倍。关键转折在于搜索业务:搜索广告收入增长19%,查询量创历史新高。这表明AI非但没有取代传统搜索,反而成为其业务的增长加速器,成功将生存威胁转化为发展动力。
Read my full remarks: https://blog.google/company-news/inside-google/message-ceo/alphabet-earnings-q1-2026/
一篇题为“不使用人工智能的人将会被时代淘汰”的文章在Hacker News上获得110点高关注。文章指出,随着AI技术在各行各业加速渗透,个人和企业若不积极采用AI工具,将在效率、创新和竞争力上落后,面临被时代边缘化的风险。它强调AI已成为职场、教育和社会发展的核心驱动力,忽视其应用将导致技能过时和市场淘汰,并警示公众需主动拥抱AI以应对快速变化的数字环境。
《哈佛商业评论》文章指出,AI的首要经济影响并非自动化,而是制造了巨大的不确定性“迷雾”,导致“预见能力的崩溃”。这动摇了现代资本主义依赖未来“可读性”的根基,使得个人对教育投资、企业对长期雇佣与资本开支、金融市场对终值的评估均陷入犹豫。其结果是行为模式迅速转向短期视野:更倾向于模块化、可调整的投入,而非长期、不可逆的重大承诺。