dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
NYU Stern商学院教授Aswath Damodaran对比互联网泡沫与AI泡沫:互联网泡沫几乎无大规模资本支出,且主要由股权融资,崩盘时股东损失60%-90%,损失仅限于股东。而AI泡沫的资本支出规模为历史罕见(类比100年前的汽车行业),且大量由私人债务而非银行资金驱动。一旦市场修正,企业违约将蔓延至全社会,比股价暴跌更痛苦。他以2008年危机为例,警告放贷者过度放贷的连锁风险。
Even before Mythos I was getting asked more and more what Anthropic's deal is, and why tf they're acting the way they're...
1/ We fine-tune a lot of customer models, so we decided to systematically try and figure out some best practices for fin...
智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T token之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。
http://x.com/i/article/2068004233849290752
推文指出,普通人一个月工资足以启动一家跑通商业闭环的互联网公司,每月固定成本约$20,主要来自Claude Pro或OpenAI Codex辅助开发。其余后端数据库、部署、认证、分析、监控、缓存、邮件、支付等全链路基建均有免费起步额度,域名约$1/月。同时,引用指出当前AI范式(视频生成、VLA)仅学习统计相关性,缺乏因果理解;UCSD黄碧薇教授提出四代AI划分(相关性小模型→因果小模型→相关性大模型/LLM→因果大模型),其团队Aether AI今日完成首轮融资。
人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...
I completely believe Chinese labs are "distilling" US models at scale, and I have no problem with it whatsoever and thin...
With RSI around the corner, it's time for an RL speedrun. Introducing Sokoban Speedrun: training Qwen3-4B-Instruct with ...
http://x.com/i/article/2067652729913114624
开发者使用 GLM 5.2 从零开始完成第一个安卓 App 开发,包括安装 Android Studio、编写代码到最终生成 APK。GLM 5.2 在大部分问题上能提供有效指导,但遇到疑难杂症时安卓系统仍难处理。作者指出当前 vibe coding 模式在电脑和 Web 端调试最为方便。
Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...
近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反,美国初创公司正依赖包括中国在内的开源模型提升效率。
这两天大家都在讨论智谱,我说下我的看法。 评价一个东西怎么样,自己去体验。 从年初到现在,一直都在订阅GLM,做了两个完整的项目,1个商用上线了,1个在开发中,我想我有发言权的。 我从年初疯狂安利朋友们买智谱的股票,虽然资本不认可智谱,认为...
6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。
RTK获得60k GitHub星标,宣称能“削减60–90%模型token用量,支付1/10的价格”,但实际API账单并未同比例下降——它仅裁剪Bash原始输出,忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失,且AI智能体无法感知压缩,导致关键信息缺失。RTK从未公布任务成功率(如SWE-bench类基准),其节省量更像营销指标。从架构看,rtk引入脆弱的外部依赖,解析git、cargo、npm、grep等CLI工具的stdout/stderr格式,一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature,而非独立产品,将其放入生产agent关键路径存在高风险。
http://x.com/i/article/2067506549107691520
@elonmusk @teortaxesTex won't take that long
codex desktop app @OpenAI is crazy i have a session with nearly 300 subagents running more than a day thanks to @justsis...
Meta前首席AI科学家杨立昆受访时称,马斯克创办的xAI“某种程度上已经失败”:难以招到顶尖AI人才,除马斯克外所有联合创始人已离职。xAI近日将数据中心出租给Anthropic等对手,杨立昆认为此举反映其弱势处境,需出租才能收回成本。他不看好xAI前景,认为其无法参与最前沿竞争。同时他称赞SpaceX“做得非常出色”,并表示自己拥有一辆特斯拉,FSD并非真正完全自动驾驶,但确实有用。
The best way to think of Record & ReplayTM️ is to imagine it as a new primitive Ask Codex to watch you do something on y...
美国政府短暂关闭了Mythos类中的Fable模型,标志着AI模型已越过危险门槛。作者预测最多两三代模型后,超级智能将像核武器一样被管控,大多数Fortune 500企业无法访问或仅受控使用。开源模型落后前沿约七个月,且面临算力和政府锁定的双重壁垒。人类的“辨别地平线”使许多人感觉模型进步停止,但实际指数增长未停——只是用户缺少足够困难的问题。Fable类已能解决此前Opus 4.8无法完成的复杂任务(如React客户端),AI将彻底改变编程和知识工作,但多数人只能使用当前等级模型。
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》蔡崇信昨日在 VivaTech 2026 上表示,AI 的总潜在市场规模达 50 万亿美元,对标人类生产力,阿里巴巴正全面投入 AI。其全栈 AI 优势包括:中国高效低成本的能源供给,提前布局的云计算和芯片,全球最受欢迎的开源模型千问(Qwen),以及覆盖电商、即时零售等丰富应用场景。他同时指出,当前全球 AI 开源的主要推动力量来自中国企业,阿里巴巴团队在推动前沿模型开源方面做出巨大贡献。
美国副总统JD Vance在《Diary Of A CEO》访谈中批评部分AI公司CEO刻意渲染反乌托邦前景,将恐惧当作病毒式营销,让消费者因害怕而相信产品强大。他认为最悲观的AI预测与制造者存在利益关联。关于AI失业,Vance表示不认为大规模失业是最可能结果,数据无证据支持;更可能是生产力提升、岗位变化或更替,而非全面失业。
Nypost: Anthropic is trying to get Washington to reverse the US block on its most powerful Mythos Anthropic has proposed...
imo it is crazy that openai, years into the heated AGI race, released o1 and described in quite a bit of detail the prin...
my notes from the @midjourney medical launch - @Scobleizer compared this to the original iPhone and Tesla launches (that...
OpenAI探索逆向对齐思路:训练模型做好事是否能像坏事一样泛化?研究人员使用涉及诚实、认知谦逊、可纠正性等特质的对话数据,覆盖健康、教育等领域,通过RL训练。实验发现:训练域内模型更诚实;在44个未见测试中,欺骗、谄媚、有害建议等均下降;面对对抗提示或恶意微调,模型更有韧性,且不损失正常指令能力。表明RL可强化道德底层逻辑。
When we announced @OpenAI o1 some researchers from other labs told me we made a strategic mistake and should have kept i...