If you want to work on pretraining-for-AGI, join OpenAI, Google, Meta or the Anthropic/XAI/Cursor supergroup. The bitter...
If you want to work on pretraining-for-AGI, join OpenAI, Google, Meta or the Anthropic/XAI/Cursor supergroup. The bitter...
Great article here on DeepSeek. Their real story is not cheaper chatbots, but architecture that turns hardware scarcity ...
I hold a different opinion. I think he's right about things like domain driven design, bounded context, ubiquitous vocab...
Anthropic的发布策略看似矛盾:其Mythos模型性能卓越,能发现其他模型无法发现的漏洞,因此一度被官方声称“过于强大而无法发布”;但最新声明又表示将通过通用发布使其可用。这突然的转向被分析可能并非PR炒作,考虑到其核心瓶颈是算力不足且临近IPO,热度并非关键需求。尽管策略存疑,但一旦模型就绪并设立安全护栏,其远超现有水平的性能将为软件工程带来显著提升。推文引用显示,此次宣布可能是认真举措。
Looks like they meant it.
李飞飞重新定义机器人学,强调其核心是“空间智能”——即机器在三维物理空间中感知、理解与行动的能力。这一能力使机器人能执行任务并实现人机协作。3D生成与重建技术正打破人类仅能体验单一物理世界的局限,创造出用于训练、创造、旅行与社交的无限数字多元宇宙。未来,人们将以“多元宇宙”的方式生活,极大拓展人类想象与交互的边界。
For all of history, humanity shared one 3D world. @theworldlabs co-founder @drfeifei says spatial intelligence now lets ...
前Google高管Mo Gawdat对“智能”提出新定义。他认为,智能并非物理属性,因此其实现载体并不重要,无论是碳基(人类)、硅基(当前AI硬件)还是未来的量子计算结构。核心观点在于,当我们停止将自身智能强加给机器时,智能便会在机器内部产生。这一论述挑战了以人类为中心的智能观,强调智能的发展应超越特定的物质基础。
Anthropic 刚花了巨资雇来 Andrej Karpathy。 同时,他免费给了你同样的知识。 无需天价招聘费,独家权限,学费。只有一个链接和 29 分钟。 这位 OpenAI 联合创始人、前特斯拉 AI 负责人,亲手终结了他自己提出...
DeepSeek v4 Pro 虽然并非最强模型,但其核心优势在于采用了几乎零成本的缓存技术。该技术被视为大模型领域的重要突破,若应用于如 Claude Opus 等顶级模型,可使运营成本下降约10倍。文章认为这是所有大模型都需要的关键技术。此外,随着未来 v4.1 版本使用更真实的训练数据,其性能预计会快速提升。
http://x.com/i/article/2058418354415644672
DeepSeek的核心战略并非销售应用服务,而是通过一系列底层技术创新,特别是MLA等注意力机制大幅压缩KV缓存需求,来重塑AI硬件生态。其技术能将1.6T参数模型在1M上下文下的内存占用降至5.48GB HBM,远低于同类模型。这直接降低了推理成本,并催生两大机会:一是将KV缓存转存至SSD,利好长江存储;二是其架构适配LPDDR内存进行权重缓存,利好长鑫存储。DeepSeek通过开源这些高效架构,正在构建一个以中国存储产业链为核心的新生态,最终目标是带动一个10万亿美元的AI硬件产业,并自身实现万亿美元市值。
Lots of people get surprised when I tell them that Codex is open source
ANTHROPIC 🔥: Mythos 1, "claude-mythos-1-preview", is being prepared for a release on Claude Code and Claude Security. T...
Andrej Karpathy 认为,下一代重大软件变革将是大量传统应用的消失。他预言了一种“完全神经化”的计算范式:原始输入直接由神经网络处理,通过扩散模型实时生成专属于当下的界面。当前经典计算以 CPU 为主、智能为辅,而未来神经网络可能成为主导进程,传统 CPU 则退化为处理精确任务的协处理器。这意味着许多现有应用只是过渡产物,未来交互可能不再是静态应用,而是由神经系统根据即时情境生成的动态界面。
个人开发者tw93在全职工作与家庭之余,独立开发了妙言、Pake、Mole等六款深受海外用户欢迎的开源工具。其产品均始于解决自身痛点,如Mole因精准清理程序员电脑缓存,超过70%的用户来自海外。tw93强调产品美学与极致完成度,并将工程实践与AI协作经验沉淀为开源技能库Waza。他的实践展示了如何通过解决真实问题、坚持开源社区协作以及将AI作为协作伙伴,构建具有全球影响力的项目。
Satya Nadella透露微软正借鉴丰田精益生产原则,将“精益知识工作”理念应用于内部AI运营。通过计算AI投资回报并利用其成本削减效应,微软在白领工作中部署AI以优化流程。例如,微软每年在客户支持业务上支出约40亿美元,通过部署AI代理处理前端问题分流及为支持人员提供实时推理协助,在Xbox和Azure等支持领域大幅降低了成本。
🚨🇨🇳 BREAKING - China Unveils Gaming GPU To Challenge NVIDIA
本文肯定了对Transformer当前学习能力及局限性的分析框架,并指出对抗性世界模型是逼近现实本质的关键功能之一。作者认为,单纯增加参数和算力以扩展一个低效范式,将被能主动假设与验证真理的简洁方案所超越,尽管规模化可能因人类智能本身有限而意外通向AGI。引用推文补充了强化学习(RL)作为从干预中学习的范式,比监督学习更强大,而世界建模与RL的结合有望实现对反事实的学习。
Very well written blog. I think of RL as learning from interventions, and it kinda explains why it's more powerful as a ...
For complicated agent work, it's amazing how much GPT5.5 has improved. I found 5.2 to be very far behind Opus. Now using...
中国在浮点运算层面实现算力独立后,其AI开源社区的贡献可能转向一套基于国产方案的技术栈,而美国将难以使用或兼容。这一转变将对美国不利,因为其当前的AI研究与基础设施本身高度封闭。根源在于,美国主流的 Nvidia + CUDA 技术路径受限,催生了国产替代方案;随着基于国产方案的开源模型逐渐主流化,未来开源项目可能不再优先支持 Nvidia + CUDA 生态。
One real issue with Chinese independence of flop-based compute is that their open source contributions will shift to a s...
Jack Clark: - AI will make a Nobel Prize-winning discovery within 12 months (working collaboratively with humans) - Bipe...
媒体指出,SpaceX涉足AI并非简单追逐技术热点,而是源于埃隆·马斯克世界观下的“防御性必要”。其核心逻辑是,若AI未来成为主导全球协调、预测与决策的关键层,那么火星环境也将被其建模与优化。若决策层被其他智能体掌控,马斯克构建的“文明运输层”便是不完整的。结合SpaceX近期以“SPCX”代码申请纳斯达克IPO的动向,其定位已从纯粹的发射服务商,转变为涵盖发射、Starlink卫星网络与AI基础设施的综合平台公司。此次IPO反映出投资者正将其重新估值为拥有运输、通信乃至地外算力潜力的平台级公司,而不仅是传统航天承包商。
SpaceX just filed for a Nasdaq IPO under SPCX that could turn Elon Musk's SpaceX stake into the first $1T personal fortu...
Sometimes people outside the field say things like "The AI situation can't be that bad, there must be experts who are on...
Nvidia CEO Jensen Huang: "There's a belief that the world's GDP is limited at $100 tn. What's likely to happen is AI is ...