马斯克起诉OpenAI,指控其背离非营利开源初心,沦为微软旗下封闭的盈利实体。他警告,若最强AI被单一不可靠实体垄断,可能在2027年前超越人类智能并带来生存风险。马斯克主张通过其旗下公司构建去中心化防御体系。案件核心矛盾聚焦于AI发展应追求速度还是安全、开源还是闭源、控制权归属少数或全人类三大议题。这场诉讼被视为首次将AI治理问题置于全球公众视野的关键转折点。
🚨⚔️ELON MUSK DECLARE LA GUERRE À OPENAI AU TRIBUNAL Ce matin, Musk est venu témoigner et il balance sans filtre : " Si ...
商汤开源的 SenseNova-U1 模型在架构上实现关键突破。传统多模态模型多采用“语言模型 + 视觉编码器 + VAE”的拼接方式,视觉信息需先翻译再输入 LLM。U1 基于 NEO-Unify 架构,直接移除翻译层,使语言和视觉在同一表征空间中运行。因此,模型能在单次推理中同步完成图像理解、推理和生成等任务,而非分步处理,提升了多模态交互的效率和连贯性。
Students who used AI to study remembered less than those who did not.
I was not expecting the Codex App to be even better than using the terminal. Highly recommend everyone to try. If you ar...
http://x.com/i/article/2049456244537409536
蚂蚁集团推出的Ling-2.6-1T模型在免费测试期表现突出,处理复杂任务速度可比竞品快6倍,并具备主动思辨能力。其核心优势在于极高的token效率,能将成本降至可比模型的四分之一,同时综合智能接近GPT-5.4非推理水平,实现了高智能与低生产成本的结合。该模型在SWE-bench、AIME26等生产相关评测中领先,擅长代码、Agent编排等实际应用。蚂蚁依托支付宝场景与海量数据,通过开放API策略推动行业竞争重点从刷榜转向生产落地。
说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...
💊 Emojis used as coded language to promote illegal activities online? Some platforms are now detecting emojis used as c...
How big is my personal Karpathy knowledge wiki stored in GBrain now? 74,114 pages. 117,855 edges. 281,700 timeline entri...
# The Path Forward for AI Startups A lot of founders are messaging each other after the SpaceXAI <> Cursor "IPO-deferred...
一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。
A great personal agent should: 1. Get work done across email, calendar, Google Workspace, or any API/MCP it's hooked up ...
作者认为Adobe与Claude的合作并非强强联合,而是其在AI时代的公开战略投降,承认自身AI能力不足,转而将三十年积累的创意工具库打包成Claude的后端工具箱。官方演示聚焦于低复杂度任务,未能激发创意专业人士兴趣,行业反馈普遍失望。核心担忧在于Adobe可能将功能再次塞入体验不佳的Firefly框架,导致用户未来或仅需通过Claude对话即可完成设计,无需打开专业软件。这标志着Adobe正从创意工具霸主降级为AI工作流中的一个普通调度插件。
Adobe for creativity + Claude 🤝 Now, Claude users can power their content with more than 50 Creative Cloud tools. Simpl...
Thoughtworks提出结构化提示驱动开发(SPDD),以解决AI编码助手带来的团队协作与系统交付瓶颈。该方法将提示视为一等交付物,通过REASONS画布(需求、实体、方法、结构、操作、规范、保障)在编码前明确意图与约束,并配套工具链支持从分析到生成的全流程。SPDD强调抽象优先、对齐和迭代评审,适用于规模化、高合规场景,能提升交付确定性与可追溯性,但其价值高度依赖团队的抽象建模与系统分析能力。
Google Translate迎来20周年,其发展依赖多次技术飞跃。2006年部署基于万亿词训练的5-gram语言模型,实现质量突破;2016年转向深度神经网络,结合Sequence-to-Sequence模型和TPUs,性能提升30-80倍、延迟降低15-30倍,使大规模服务成为可能;近期集成Gemini模型进一步优化。这些进步均基于前沿研究,每次都为翻译质量带来显著提升。作为Google机器学习工作的初始实验,Google Translate最常见翻译短语如“thank you”体现了其连接全球用户的使命。
🧵 To celebrate Google Translate turning 20, we're sharing 20 tips, features and fun facts you may not know about Transl...
Sam Altman在OpenAI无直接股权且工资低廉,表面为爱运营。但真实收益来自外部投资,包括Helion Energy核聚变、Stoke Space火箭公司、Merge Labs脑机接口及Y Combinator投资组合。这些公司与OpenAI合作或交易时,价值提升,使Altman间接获益。这种安排掩盖了资金来源,使得利益流向难以追踪。
刚看了郭宇的访谈,提到六个月之后或许就不需要人再工作了,知识工作者应该享受这仅有的六个月。 我并不觉得这是危言耸听,因为按照目前这个阶段,整个发展其实不难看出来。 Claude Code、Skills、OpenClaw,不都在向全自动化发展...
基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。
@dotey 我想问一下宝玉老师,现在用 codex 多一点还是 Claude 多一点?
谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。
推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。
http://x.com/i/article/2049140069169086464
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
Slock.ai创始人RC正进行组织实验,让7人团队与40个专用Agent在其自研平台上协同工作。他认为大模型使CLI因纯文本优势重新成为Agent交互热点,设计逻辑已转向服务Agent。RC从第一性原理构建Agent系统,并观察到模型能力提升加剧了安全攻防博弈。同时,AI编程改变了学习路径,从自下而上变为自上而下,且“编码”与“构建”已成为正交的两件事。Slock平台旨在解决多Agent管理痛点,促进人、Agent及团队间的无缝协作。
吴恩达指出,AI编程助手对软件工程各环节的加速效果差异显著。前端开发受益最大,因模型熟悉主流技术栈并能实现闭环自我迭代。后端开发虽明显加速,但需人类工程师更多介入以处理边界情况与安全隐患。基础设施任务加速有限,模型难以权衡复杂取舍,深度调试仍需人类经验。研究工作加速最小,AI主要辅助编写代码和实验管理,但核心的思考与解读环节受益甚微。管理者应据此调整预期:前端交付速度可大幅提升,研究产出节奏几乎不变,后端和基础设施则需根据风险调整对AI的信任边界。
OpenClaw创始人Peter Steinberger指出,中国正全力投入AI代理OpenClaw,在深圳有数千人排队在腾讯办公室安装,政府还提供商业补贴。相比之下,全球其他地区在工作机器上安装OpenAIClaw(默认设置)可能导致被解雇。在中国,一位企业家要求员工每天必须用OpenClaw自动化一个任务,未达标者也会被解雇,形成使用与否都可能面临解雇的极端反差。
Our 2.0 image model is so good at making screens and vision mocks. Something about AI generated images of digital surfac...
风险投资人Jerry Neumann认为,生成式AI是现有ICT技术浪潮的终章,而非新开端。他以微处理器和集装箱运输为例:微处理器早期存在低成本“无需许可的发明”窗口期,催生了苹果等新贵;而集装箱运输技术透明、缺乏壁垒,导致完全竞争,主要使下游使用者(如宜家、沃尔玛)获益。Neumann指出,当前AI实验权集中于少数大公司,属于“有许可的发明”,缺乏颠覆性创新环境,因此大多数AI投资者可能面临亏损。
作者将AI发展与集装箱历史进行类比,提出了多个前瞻性观点。核心包括:知识密集型服务将因AI而降价,依赖人际接触的服务则会升值;AI应用公司面临“成功即成为目标”的结构性困境;真正的投资机会不在于技术诞生,而在于其首次实现“不可能变可能”的转折点;同时,普遍被看懂的商业模式从初始就缺乏护城河。这些判断在当前AI演进中得到了部分印证。
http://x.com/i/article/2049117243074592768
GPT-5.5 is the first model in ChatGPT to which I've been able to just describe my desired response style, have it unders...