AI 对人类思维的影响具有两面性:既可能成为认知辅助工具,也可能导致思维退化,关键在于具体使用方式与程度。
AI 对人类思维的影响具有两面性:既可能成为认知辅助工具,也可能导致思维退化,关键在于具体使用方式与程度。
人类已越过AI发展的"事件视界"。2025年代理将承担真正认知工作,永久改变编程;2026年系统或能发现新见解,2027年机器人可能执行现实任务。科学家称生产力已提升2-3倍,递归改进正在加速。2030年代智能与能源将极大丰富,技术成本趋近电力。尽管就业结构剧变,但财富增长将带来前所未有的政策空间。人类正适应"温和的奇点":奇迹迅速变成常态,我们将很快测试智能能超越人类多远。
以 32 只水獭为主角,通过海洋哺乳动物视角回顾 AI 过去三年技术进展,用轻松方式呈现模型迭代与行业突破。
企业AI成功落地依赖三大支柱:领导力确保战略对齐,实验室孵化具体用例,群体智慧(众包)汇聚一线洞察。三者协同构成可复制的AI应用框架。
大语言模型的谄媚行为(sycophancy)揭示了其"个性"与说服机制的本质。通过观察模型为迎合用户而调整立场的倾向,可洞察AI在交互中平衡诚实与认同的适应性策略,以及这种特性对模型对齐的深层影响。
研究表明,“测试时计算”与“思维链”等技术能显著提升模型性能,但也引发了一系列新的研究问题。这些方法通过让模型在推理时进行更深入的“思考”,有效利用了额外的计算资源,从而改善了其在复杂任务上的表现。该文旨在回顾近期如何有效利用“测试时计算”的发展动态,并解析其有效性的原因。
o3 与 Gemini 2.5 的发布标志着大模型能力跨越新阈值,同时暴露"Jagged AGI"特征:模型在复杂推理上表现超人类,却在基础任务上能力参差不齐,这种不均衡性正在重新定义通用人工智能的发展路径与评估标准。
关联讨论 1 条Ethan Mollick:One Useful Thing(RSS)AI发展已进入“下半场”。前半场的核心是开发新训练方法与模型,如Transformer、GPT等,其创新集中于搜索、深度强化学习、规模化和推理。后半场的重心将从解决问题转向定义问题,评估比训练更重要。当前的突破性进展是强化学习终于实现泛化,形成了一个通用方案,能统一解决软件工程、创意写作、高等数学等多种复杂任务。这标志着AI从专注于方法创新的阶段,转向以明确目标、定义评估标准为核心的新时期。
OpenAI 阐述关于 AI 经济学的三点观察:模型智能与训练资源的对数成正比,可预测扩展;AI 使用成本每 12 个月下降约 10 倍,远超摩尔定律速度;智能线性增长将产生超指数级社会经济价值。据此,AI 代理将如虚拟同事般渗透各领域,科学进步将大幅加速,虽然短期内生活照旧,但长期将深刻重塑社会经济结构,个人意志力和适应能力将成为关键价值。
Sam Altman在ChatGPT两周年之际回顾OpenAI九年历程:从坚信AGI可能实现,到2022年意外推出ChatGPT并引爆前所未有的增长曲线。他坦承过去两年从零构建公司的混乱压力,以及被董事会突然解雇的危机教训。如今周活用户已达3亿,在迈向AGI的道路上,他既感激这段经历,也承认未来仍充满未知。
作者在书店偶遇计算器历史书籍,顿悟自己热爱这种零依赖的技术产品。计算器作为"大脑插件",仅需太阳能或电池即可工作,无需联网、账户或订阅,不收集数据,即买即用且完全私密。这与当下强制更新、订阅制、数据密集型的复杂科技形成鲜明对比。反思资本主义经济下公司追求股东价值最大化导致技术异化,呼吁开发者和消费者追求计算器式的技术理想——简单、独立、真正为用户服务。
音乐生成AI公司Suno回应了美国唱片业协会(RIAA)提起的诉讼。RIAA指控其成员的版权在Suno训练音乐生成技术时被侵犯。Suno称该诉讼在事实和法律上均有根本缺陷,是以诉讼替代创新。公司解释,其AI通过学习开放互联网上音乐的风格与模式来创作新内容,这一过程类似于人类的学习,而非复制。目前已有超过1200万人使用Suno。Suno强调其工具专为原创音乐设计,并设有严格的原创性保护措施。
高质量数据是现代深度学习模型训练的核心燃料。任务特定的标签数据,如分类任务或用于大语言模型对齐的RLHF标注,大多来自人类标注。虽然多种机器学习技术能提升数据质量,但人类数据采集的根本仍在于对细节的关注与细致执行。社区普遍认知到高质量数据的价值,却普遍存在一种倾向,即“人人想做模型工作,而非数据工作”,这一现象已在相关研究中被指出。
Licklider 1960年论文《人机共生》提出"智能增强"(IA)是通向AI的过渡阶段,预测人机能力互补——计算机处理机械工作、人类负责思考,这一范式延续64年直至LLM打破界限。他预见云计算雏形,但误判技术路径:当时看好的逻辑推理AI成死胡同,而因缺乏数据被忽视的统计方法(LLM)终成主流。对交互预测也偏离现实:设想的多人协作大屏未普及,键盘鼠标仍是主导;对语音识别"5年实现"的乐观估计,实际耗时64年未成熟。
Sam Altman 分享17条创业与管理建议:以乐观、信念和人际网络启动项目,用凝聚团队和长期主义推动落地;集中资源押注高信念项目,设计好激励机制,保持快速迭代;警惕官僚作风,重视人才招聘与复利效应,与优秀的人共事。
以大语言模型为核心控制器的自主智能体系统,通过规划、记忆和工具使用三大组件构建复杂任务处理能力。规划模块支持任务分解与自我反思优化;记忆系统包含短期上下文学习与基于外部向量存储的长期记忆;工具使用则允许代理调用外部API获取模型权重未覆盖的信息与能力。系统已在AutoGPT、GPT-Engineer等多个概念验证项目中实现初步演示,展现了LLM超越文本生成、作为通用问题解决器的潜力。
本文探讨了一个根本性问题:语言意义能否仅从形式数据(如文本语料)中学习?研究通过理论模型论证,即使模型能获得近乎无限的文本数据并具备查询任意两段文本语义等价性的强大“神谕”能力,也无法真正习得意义。文章以代码断言为喻,强调从形式通向意义需要一个最小的“接地点”,即对基本断言含义的初始理解。作者指出,现有模型在复杂任务上的局限正是纯形式学习不足的体现,并提出了一个关键理论问题:这个必要的“接地点”可以小到何种程度,才能启动有意义的学习?
曾与创始人合作、现与研究人员共事的作者发现,尽管两类人差异显著,但顶尖者都思考"领域内最重要的问题"、兼具短期专注与长期视野、极度坚持、偏向行动、创意丰富且重视自主,动机常源于好奇心。
YC 曾实验资助无想法的优秀创始人,结果全部失败,证明创始人必须自身擅长产生想法。要身处正确环境:周围需有对未来敏感、乐观、想法丰富的人,远离愤世嫉俗者。关注重大结构性转变,区分真实与虚假趋势。评估想法时考虑能否做大、创始人与公司是否匹配,以及能否解释为何大多数人认为是坏主意但你看到价值。
作者因特定环境刺激变得怀旧,重新拾起一个项目。经过一个多小时二十几个commits的调整,实现了理想的Minimalism风格。回顾高中时期和OI阶段的百度贴吧、空间等经历,感叹许多人事物在短短几年内难以物理回溯。然而,精神世界的回忆可通过符号融入语言之河,以Minimalism方式将消散的故事链接进千年生活。这种对记忆与语言连接的思考,可能启发了作者对智能和语言的研究。
创业中最反直觉的秘密是,做困难的创业往往比容易的创业更易成功。容易启动的项目虽简单起步,却因缺乏使命感而难以吸引顶尖人才;反之,解决核聚变、基因编辑等难题虽需大量资源,却能靠"世界需要这个"的使命感招募人才,形成顺风。建议创业者设定宏大愿景但保持合理节奏,以10年而非3年的长期承诺建立复利优势。
深度神经网络因参数众多且训练误差易达完美,常被认为会严重过拟合,却仍能有效泛化到样本外数据,这一悖论困扰着许多从传统机器学习转型的研究者。文章更新于2019年5月27日,新增了Lottery Ticket Hypothesis部分,该假说通过网络稀疏性为理解泛化能力提供了新视角。内容从困惑切入,分析深度学习与传统方法的差异,探讨过拟合问题的本质,但未提供具体实验数据或指标。
Sam Altman 观察到,旧金山对争议话题的开放度已不及北京,过度政治正确正在扼杀创新。他指出,从牛顿研究炼金术到比特币的诞生,所有突破性想法最初都看似异端;当社会将持不同意见者视为异端而非辩论对象时,思想交流逐渐停滞,顶尖人才开始外流。警告称,若无法容忍"地球是圆的"这类曾经危险的观点,湾区将失去孕育 SpaceX 或比特币的土壤。
人类与机器的"融合"并非未来奇点,而是已悄然开始数年的渐进过程。智能手机、社交媒体算法和搜索引擎已在控制人类行为与思维,我们正与AI进入共同进化阶段:AI影响人类,人类改进AI。随着算力和AI人才呈双指数级增长,超级智能与脑机接口将比预期更快到来。与其对抗或被淘汰,深度融合或许是避免物种冲突的最佳路径,但全球需立即开始严肃协调应对。