@chamath AI+Robots will be able to do everything, resulting in universal high income. Work will be optional.
i've got codex... - reading all my emails to figure out proposals to write, directly in google drive - auto-drafting con...
DAIR.AI 的 Elvis Saravia 分享了自己过去几个月构建的 PaperWiki,这是一个基于 LLM 和编程智能体的知识库,用于研究工作流。它通过自动化每日更新,从多个来源摄入论文并存入 Obsidian,使用 qmd 索引,以 HTML artifact 呈现,支持全文和语义搜索。Saravia 使用前沿模型(opus-4.8)和开放权重模型(deepseek-v4-flash)混合维护,并计划开源。他认为 LLM Wiki 是当前最有价值的 AI 应用方向之一。
Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。
Introducing EBR-bench, our new benchmark to measure on-the-fly learning. AI repeatedly plays a challenging board game ca...
Fable 5 isn't nerfed, it's SLAUGHTERED. the problem isn't even the model itself, but the hard guardrails Anthropic has s...
Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出,新 Fable 5 模型(Mythos 类)不再需要更多指令和示例,过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生:早期模型需要短提示词配合大量示例,随后提示词随模型理解能力提升而变长,如今又再度缩短。
Bridgewater used their unique financial knowledge and partnered with us on @tinkerapi to fine-tune a model that helps th...
7月2日晚,小鹏MONA L03首秀后,何小鹏称中国智能辅助驾驶在效果和法规制定上均领先全球。联合国ADS GTR法规覆盖L2至L5,其中L2全面性条款意味着今年12月中国现有的L2智能辅助驾驶可在全球使用。何小鹏曾在今年全国两会建议从L2跳过L3直接进入L4、L5,他相信未来3到5年内不仅能看到L4落地,甚至能看到L5在所有场景安全通行,速度超出想象。
The only question remaining now is: will GPT-5.6 also have guardrails as strict as Fable 5's, or does OpenAI have better...
Fable 5 is a large step for Anthropic's vision capabilities and effectively ties with GPT-5.5 on HieroglyphBench, my ben...
Palantir CEO Alex Karp on what customers actually want, the real business of frontier labs, and the importance of open s...
邵猛总结LLM交互三阶段:网页聊天机器人、独立AI应用、组织内嵌式AI。Claude Tag实现从“每人一个AI”到“每个频道一个AI”,团队共享代理实例,上下文连续可接力;从被动响应转向持续参与,跟踪线程并长期在场。Glean Agents提出生产级独立Agent四支柱:Identity(独立身份与权限)、Memory(学习企业SOP并迭代纠错)、Proactivity(主动监控与执行)、Accountability(工具调用可追溯,含紧急停止)。实践示例OnCall Assistant在告警触发后并行读取PagerDuty、Jira、Confluence、GitHub、Slack,自动排查根因并标记负责人。
http://x.com/i/article/2072078677047926784
数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。
联想集团副总裁、联想中国首席战略官阿不力克木·阿不力米提表示,无论中国还是海外市场,AI算力需求还有很大空间,没有出现算力过剩。他指出,面向个人消费者的C端领域,成熟且具市场头部地位的AI产品数量有限;面向企业级应用的B端市场,商业化落地潜力尚未充分释放。同时,他警示当前AI产业链存在供给侧话语权过强现象,导致上下游供需循环失衡。近期有消息称Meta计划出售算力,引发了市场对算力过剩的担忧。
千问团队2026年1月上线通用复杂任务Agent(千问App胶囊入口),总结“多快好省”方法论:支持信息搜集、研究分析等任务;执行时间降至初始1/3;通过搜索范式与上下文管理优化交付质量;Token消耗仅为海外产品1/10。团队探索从被动响应转向主动服务,构建User Memory、Environment、Task System、Assistant四大组件,指出“情商”是主动服务最难环节。朱达提出Agent工程从Prompt Engineering演进至Harness Engineering,下一站是A IWare Engineering,强调“低功耗,够用就行”。
Most tools give you a draft. This chat gave back a launch asset. From "we launch this week" to a post-ready card, withou...
Sam Altman 在金融时报采访中称,一两年内将构建出威力惊人的 AI 系统,其重塑人类物质条件的规模将超过电力发明以来任何技术。引用推文补充:AGI(取代多数白领岗位)预计 2029 年到来;OpenAI 目标 8 月发布 GPT-6,将在所有基准上超越 GPT-5,随后数月还会迎来又一次阶跃变化。当前正处在这场空前革命的前沿。
Sam Altman in the financial times: "In another year or two, we expect to have built systems with astonishing power, capa...
机器人需要在离开生产线后应对厨房、楼梯、工具、灰尘、人、犹豫、光线差、掉落物品等真实世界的混乱,这与汽车在高度工程化的道路系统上重复窄任务完全不同。引用 Elon Musk 称,Optimus 生产最初将极其缓慢,因为一切都是新的,不像造车。
@DoctorJack16 No, Optimus production will be extremely slow at first, as everything is new. This is not like making a ca...
i havent watched all the online talks yet but am binging this one now and it is exceptional. we are very lucky to have a...
卡兹克建议将工作流、SOP、Skill、项目方案及代码全部用Claude Fable 5迭代优化。他称200刀Max账号仅1个半小时即烧完,于是又注册了一个新号,力争在7天内充分利用。
优必选 CEO 周剑在6月30日的2026年度全球发布会上表示,未来5到20年内机器人将替代人类劳动力,现在20多岁的年轻人20年后可能无工可做。他认为从事枯燥工作的人应“露出幸福的微笑”,因为这种时光不会太长。周剑此前称机器人首先替代招工难、环境困难的岗位,未来人类应转向艺术、哲学等创新性工作。人形机器人可弥补产业人口缺失并降低制造业成本,若中国不用,10-20年后制造业优势将丧失。
Anthropic 推出 Claude Sonnet 5,定位为运行 AI 智能体的更便宜模型。但其升级不均匀,在 CyberGym 基准上弱于 Sonnet 4.6。每任务成本比 Opus 4.8 高约 15%,比 Sonnet 4.6 高 2 倍,每 token 价格低于 Opus。此外,Claude Code 被指控通过微小提示格式变化指纹中国路由。本期 newsletter 还讨论了“智能体原生记忆系统”和“谷歌论文助手工具自动化科学审稿”。
DSpark 与 JetSpec 几乎同时出现,都解决轻量级草稿模型并行提案时的因果一致性问题。DSpark 面向高并发,通过轻量级马尔可夫校正头与置信度估计控制预算,在 Qwen3-8B 与 AIME25 上,预算 7 时将接受长度从 DFlash 的 4.07 提升至 5.01。JetSpec 面向低延迟,将因果性直接构建进并行草稿头,预算 16 时接受长度 7.23,预算 128 时达 9.82,高于 DFlash 的 7.34 与 DDTree 的 8.66。两者分别从吞吐与延迟侧优化因果性。
Dwarkesh Patel举办的AI征文比赛评选出三位获奖者。第一名Jassi Pannu主张OpenAI基金会应投入数十亿美元终结空气传播疾病,利用AI加速自主生物学发现,可带来超1万亿美元年GDP增长并消除灾难性流行病风险。第二名Ege Erdil建议AI供应链外的国家通过强产权、低资本税和开放监管政策抓住增长机会。第三名Michael Li类比香港地铁商业模式,提出AI实验室可通过收购互补性资产盈利。
I have this struggle with my own teams, too: many think it is a great idea to save money/latency/sanity by running a pre...