现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。 如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。 感觉得做...
现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。 如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。 感觉得做...
文章批评当前一些公司以“AI提效”为名进行裁员,认为这并非真正的变革。核心观点是,这种做法是用最小成本假装改变,回避了更根本的挑战:即在旧有业务模式结束后,公司未来的新战略方向是什么。作者指出,若无法回答这个关键问题,大规模裁员也无济于事。
http://x.com/i/article/2060890772099170304
Watch me control my computer with just my voice. This is the future of operating systems. No hands. GPT-Realtime 2.0 is ...
文章对比2022-23与当前裁员潮,指出后者常以“AI改变经营方式”为由,但其真实性存疑。例如,有公司同日宣布高利润与大规模裁员,并归因于AI提效。作者提出AI native三层框架:1.找到AI原生新业务;2.构建新组织;3.用AI工具提升个人效率。他认为多数公司跳过前两层直接裁员,并以此证明转型成功,但这回避了核心问题:旧业务增长见顶后,真正的新增长点是什么?文章以赵武灵王胡服骑射为喻,指出仅以提效为名裁员是假装变革,若找不到新方向则无济于事。
Claude Opus 4.8 has landed on DeepSWE Bench, posting a 58% Pass@1 and taking #2 overall behind GPT-5.5. It continues a b...
Chad Whitacre 宣布从科技行业退休,包括退出开源社区。他将AI的发展视为促使他离开的最后一根稻草,并称自己要过一种“新阿米什人”的生活,即停留在没有AI和“信息流刷屏”的1980年。此前,他曾深度体验 Claude Code(模型为 Opus 4.5)进行编程,虽然沉浸其中,但事后感到不安,认为这就像一个大公司的计算机系统侵入了思维。他由此决心彻底脱离技术加速主义的浪潮。
用户指出,Claude在普通聊天中(特别是技术搜索)表现较懒散,但通过Claude Code编程智能体,却能精准获取所需论文图表并完成任务。相比之下,GPT 5.5和OpenAI近期模型表现得极为彻底和坚持不懈,而Codex harness(编程工具框架)对模型的改造相对更轻量。核心对比在于不同模型与不同工具框架结合后,在搜索与研究任务上的表现差异。
推文指出,在AI时代,单一的“功能性”技能正在变得廉价。无论是编程、写作还是外语,作为独立的专业技能其稀缺性在下降。核心观点是,能够将这些工具技能(如编程)整合起来,用以创造有价值产品的“工程能力”或应用能力,才真正稀缺且保值。引用推文也支持此观点,认为计算机技术虽重要,但其单纯的功能属性价值会越来越低。
现在,计算机技术和编程技术我觉得愈发的前所未有的重要的了。 但不等于计算机专业是个年轻人应该选择的专业,因为作为一个曾经黄金的功能性技能,单纯的功能属性会越来越廉价。
今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...
NVIDIA、微软与 Arm 同步发布指向台北音乐中心的坐标,暗示 6 月 1 日发布会将有重大动作。此举被认为是 NVIDIA 与联发科合作的 ARM 笔记本芯片 N1X 的预告。该芯片整合了 CPU、基于 Blackwell 架构的 GPU 及 AI 单元,目标是使轻薄本具备接近 RTX 4070 的图形性能。这标志着 NVIDIA 的战略转变:从显卡供应商,转型为定义整机核心方案的提供商,将直接冲击 Intel、AMD 和高通在 PC 市场的地位。
A new era of PC. 25.0528, 121.5990
Daniel Jalkut 表达了他对当前AI舆论的观察,其核心观点是:无论是反对AI的人还是支持AI的人,双方的观点和立场往往都显得过于极端。
推文指出,AI智能体执行能力趋强,可能使prompt、skills等执行性技能最先贬值。OpenAI的Greg Brockman在红杉闭门会上强调,AI让执行变得近乎无限便宜,真正的稀缺资源是人的判断力——即决策事情是否该做、成果是否符合预期的能力。AI无法替代个人明确自身需求并最终拍板。
http://x.com/i/article/2057668634579714048
在需要长时间运行的动态工作流、大型代码库处理或深度研究任务中,聊天窗口不足以展示成果。HTML Artifacts提供了必要的验证与决策层,已成为作者与AI智能体协作的核心界面。作者将其广泛用于日志记录、实验跟踪、头脑风暴、代码审查、智能体会话管理、深度研究与写作等场景,并构建了标签页系统进行管理。文章最后引用Karpathy的观点:随着智能体应用走向更高级、输出更复杂,我们将需要包括交互式神经视频/模拟在内的更高级交互形式。
作者指出,HTML工件正日益成为其与AI智能体协作的核心媒介,尤其在需要呈现长程任务成果的场景中。随着智能体处理动态工作流、大型代码库及深度研究任务,传统聊天窗口已力不从心。HTML工件提供了关键的验证层,使用户能审核智能体的工作成果并作出决策。作者在日志记录、实验跟踪、头脑风暴、代码审查等众多任务中应用HTML工件,并提及Karpathy关于未来需要更高级AI交互形式(如交互式神经模拟)的观点。
We measure the gap using the Epoch Capabilities Index, our aggregate measure of model capability. Compared to our last a...
旧金山的AI创业者正经历融资热潮。据一位风投描述,22岁或许能收到种子轮融资意向书,而19岁则可能已获得A轮投资机会,这被视为能力的更高认可。
数学家陶哲轩阐述了 AI 如何通过首次实现分工来重塑数学研究。目前,研究者需亲力亲为完成从问题建模到结果验证的全过程。陶哲轩预见“工业数学”的出现:由大型 AI 辅助团队取代孤军奋战的天才,而人类在提供“灵感性猜想”方面仍不可或缺。
推文感叹Tesla FSD在中国路测中的会车能力表现惊艳,堪称“遥遥领先”。引用推文进一步探讨了AI工具的使用本质,提出工具分为替人思考的“Agent型”和与人共思的“实习生型”(以Cursor为代表),后者是使用者“以术入道”、磨炼判断力的过程。其关键瓶颈是必须在场,而作者通过免费工具UU远程(4K 144帧、原生终端支持)在手机上远程操控运行Cursor的Mac,解决了此限制。
今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...
When we go from GPT-5.0 -> GPT-5.1 -> ... -> GPT-5.5, the number incrementing goes with improvements in capabilities and...
Steve Yegge 在 Medium 发表观点文章《最后一次技术面试》,探讨 AI 时代传统技术面试的意义变化。文章在 Hacker News 社区获得 100 分关注。
AI can give researchers the freedom to pursue "crazier" ideas. For Terence Tao, AI creates more room to experiment, test...
http://x.com/i/article/2059811469081141248
Claude Opus 4.8发布后,部分用户反馈其相比Opus 4.7升级感知不强,甚至认为模型变笨了。同时,有声音指出GPT-5.5更好用,并调侃该模型是否蒸馏了Qwen。此外,有用户在发布后尝试测试,发现自己的新注册账号意外变为“未注册”状态,此前该账号仅发送过一条消息,引发了对账号安全性的担忧。
作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。
基于您提供的文章内容,当前仅包含标题“What Is a Dickover?”及元数据(来自daringfireball.net,2026年5月29日发布,获108 HN Points)。由于缺少正文主体,无法提取关于“迪科弗”的具体定义、背景或论述,因此无法生成完整摘要。
如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要? @mfpiccolo 在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-build-your-own-agent-harness/ [引用 @mfpiccolo]:http://x.com/i/article/2060024515619397638
http://x.com/i/article/2060024515619397638
有经济学家提出,真正的技术革命总伴随对能源的颠覆,而互联网和移动互联网时代并未真正做到。AI(人工智能)不同,它直接消耗原始能源,正推动绿色能源、化石燃料及元素周期表中多种元素的需求与价格飙升。作者认为,这种“重写比特容易,重写原子困难”的摩擦,证明我们正处于一场巨大的范式转移中。当技术浪潮同时推高能源、储能和基础元素成本时,只有两种可能:要么是史上最大的泡沫,要么是奇点正在到来。
Someone once told me: "You should be the last one to reinvent something" -- not sure how useful this is, but this is a c...
My conversation with @JeffDean, @koraykv, @NoamShazeer, and @OriolVinyalsML (the Gemini co-leads) about the current stat...
Box创始人Aaron Levie指出,决定用AI替代员工的CEO们往往最不了解工作的实质,他将此现象称为“AI癫狂症”。文章以ClickUp公司为AI智能体裁员22%为例,并指出2026年的科技行业裁员规模已接近2025年全年。
陶哲轩指出,研究过程中存在大量“认知摩擦”——例如验证想法、排除错误路径、将直觉转化为计算等试错环节,占据了主要时间。AI正在将这些摩擦成本降至零,使研究者能更自由地尝试“更疯狂的想法”。推文强调,许多非常规路径并非被证伪,而是被高昂的验证成本所阻碍。AI降低这一成本,让原本因“不便”而被放弃的弱信号得以被审视,这往往是发现的起点。
AI can give researchers the freedom to pursue "crazier" ideas. For Terence Tao, AI creates more room to experiment, test...