本文介绍了20项Claude Code的核心使用技巧,旨在优化开发工作流。关键功能包括:通过Esc+Esc或/rewind命令回退到历史检查点,实现“撤销”与选择性总结;利用快捷键直接粘贴截图或打开编辑器编写长提示;通过管道命令传输错误日志,为模型提供丰富上下文。此外,用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量,以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。
OpenAI CEO 萨姆·奥尔特曼向长期对立的埃隆·马斯克发出示好信号,公开欢迎其参加计划于5月5日举行的GPT-5.5庆功宴。奥尔特曼在线发布了报名表,并表示将由Codex帮助挑选参加者。针对作家安德鲁·库兰的调侃,奥尔特曼回应称“他如果想来的话,可以来。世界需要更多的爱”。两人关系始于2015年共同创立OpenAI,但马斯克于2018年因价值观分歧离开,此后多次批评OpenAI的商业化转向,并于2024年3月起诉OpenAI偏离协议。目前案件已进入庭审阶段,现场气氛紧张,法官曾警告双方控制社交媒体言论。
研究提出了一种结合线程约束有向无环图(TC-DAG)与语篇感知旋转位置编码(D-RoPE)的新框架,用于对话方面级情感四元分析。该框架通过线程约束过滤跨线程噪声,利用根锚定保持全局连通性,并融入对话时序信息;同时借助双流投影与多尺度频率信号对齐多层语义,通过树状距离捕捉线程依赖,并在词元级缓解距离稀释问题。在两个基准数据集上的实验表明,该框架实现了最先进的性能。
研究提出新视角,将注意力机制数学重构为具有动态预测参数的多层感知机,从而解释其全局建模能力源于动态参数对全局上下文的隐式压缩表征。基于此,研究探索能否完全通过动态参数化实现Transformer级别的序列全局建模,同时保持线性复杂度以替代显式注意力。通过在视觉模型上进行大量实证研究,证实动态参数化确实可以作为一种高效、线性复杂度的显式注意力替代方案,为高效序列建模开辟了新途径。相关代码已开源。
研究引入“稳定计数能力”评估法,通过让大语言模型重复计数符号直至出错,检验其程序性可靠性。该方法避免了知识依赖、语义模糊和分词干扰。对超100个模型变体的测试显示,其稳定计数能力远低于宣传的上下文长度上限。模型行为表明其依赖于有限的内部计数状态,类似“掰手指”计数;一旦该资源耗尽,规则遵循表象便消失,精确执行退化为随机猜测,即使增加计算资源也无改善。这表明当前模型的流畅表现并不等同于普遍可靠的规则遵循能力。
自回归视频生成因顺序去噪计算负担重而面临部署挑战。现有缓存重用方法采用粗粒度的块级跳过,无法捕捉细粒度像素动态。为此,研究提出MotionCache运动感知缓存框架,其核心是利用帧间差异作为像素级运动特征的轻量级代理。该方法采用从粗到细的策略:初始预热阶段建立语义连贯性,随后根据运动权重动态调整每个令牌的缓存更新频率。在SkyReels-V2和MAGI-1等先进模型上的实验表明,MotionCache分别实现了6.28倍和1.64倍的显著加速,同时有效保持了生成质量(VBench指标下降分别仅为1%和0.01%)。该框架代码已开源。
针对语言模型需从复杂上下文中学习的问题,本文提出Ctx2Skill自进化框架。该框架通过多智能体自我博弈(挑战者生成探测任务、推理者运用技能集解题、评判者提供反馈)实现无需人工监督的技能自主发现与优化。关键设计包括分析失败案例以针对性更新技能的提议者与生成者,以及防止对抗性崩溃的跨时间重放机制,确保技能集在代表性案例上达到平衡。在CL-bench的四个上下文学习任务上的评估表明,该框架能持续提升不同骨干模型的解题成功率。
关联讨论 1 条X:AK (@_akhaliq)华为乾崑智能汽车解决方案发布4月安全出行报告,其累计辅助驾驶里程已达104.7亿公里,跨越百亿里程碑。月度辅助驾驶里程为9.1亿公里,智驾辅助月活用户数达143万,用户占比94.8%,月度人均辅助驾驶里程637公里。具体功能上,车位到车位功能使用956万次,辅助泊车达6548万次。此前,华为已发布乾崑智驾ADS 5.0系统,首发防误打方向盘与车位到车位3.0版本,并推出了乾崑OS与迭代至3.0版本的乾崑XMC车辆控制技术。
苹果 iOS 27 系统预计于 WWDC 26 大会亮相,9月正式推送。新系统将推出独立 Siri 应用,支持类 ChatGPT 的交互,并新增灵动岛界面。卫星通信功能迎来重大升级,包括通过卫星使用 Apple Maps、收发 iMessage 图片等四项新功能,可能为搭载 C2 基带的 iPhone 18 Pro 系列机型独占。系统将效仿“雪豹”策略,专注于质量修复与性能提升。此外,还正在测试具备增强自动纠错功能的全新虚拟键盘,并可能引入系统级 UI 透明度调整滑块等智能新功能。
谷歌正在其Gemini平台测试一款名为“Omni”的新模型,专注于视频生成功能。泄露信息显示,该模型的界面提示用户“从一个想法开始或尝试一个模板”,并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关,后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni,其性能很可能超越当前的Veo 3.1版本。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型,这标志着谷歌在视频生成领域的重大技术进展,并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。
Visual Studio Code 在提交信息中自动添加“Co-Authored-by: Copilot”标签,无论开发者是否实际使用了GitHub Copilot生成代码。这一改动由微软在GitHub的相关拉取请求中引入,引发了开发者社区的关注与讨论。该行为可能导致代码提交历史中出现不准确的贡献者信息,涉及开发工具伦理与透明度问题。相关话题在Hacker News上获得了超过130个讨论点数。
本研究提出评估编程智能体的新范式:要求其在有限预算下,仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统,其规模适于笔记本电脑运行,但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道,并作为先手以7:1的成绩击败了Pascal Pons求解器,而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。
优步计划利用其平台上数百万司机和配送员的车辆,通过安装传感器设备,为自动驾驶公司构建一个庞大的实时传感器网络。该网络将收集道路环境数据,用于训练和优化自动驾驶系统。此举旨在将优步的运营车队转化为数据采集基础设施,为自动驾驶技术开发提供关键支持,可能改变行业数据获取方式。
加州宣布将开始对违反交通法规的无人驾驶汽车开具罚单,标志着自动驾驶汽车监管迈出关键一步。新政策下,无人驾驶车辆在道路上违规时,将像人类驾驶员一样收到罚单,旨在加强道路安全并规范行业测试。加州作为全球自动驾驶技术测试热点,此举可能影响相关公司的运营和未来发展。
Chatly近日发布Omni Agent,其核心理念是超越聊天,转向工作流组装。该产品采用多智能体路由机制,可将用户设定的目标自动分解,并分配给不同的专业智能体协同完成多元化任务,如邮件营销、演示文稿、落地页设计等。它具备强大的记忆层,能持续学习并复用用户的品牌信息、偏好、项目规则等上下文。通过原生工作空间集成,AI可直接在用户现有的文件、任务和活动环境中操作。产品提供Think、Pro、Ultra三个层级,旨在通过统一界面整合深度研究、多媒体生成与记忆功能,让用户从使用工具转向指挥智能体。
Codex 可利用 Chronicle 记录的电脑操作数据,分析用户习惯并识别效率低下之处,提供直接改进建议。用户通过输入特定提示(如询问低效操作),即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏,但具有试用价值,能帮助提升工作习惯和操作效率。引用推文关键点指出,此功能是实验性的,并提供了英文输入示例以触发分析。