linus was the original vibe coder before it was cool. dude just posts an angry email on the mailing list describing what...
Cognite CTO Geir Engdahl接受专访指出,工业AI失败的根源并非模型层,而是工厂现场运营。许多惊艳的AI试点无法在实际运营中存活,因为缺乏真正上下文——当错误可能带来危险时尤为关键。他探讨了工业智能体应在何时推荐、自动化或保持不介入,强调工作演示与可信系统之间存在巨大鸿沟。他预测,到2028年未采用AI驱动流程优化的工业企业将面临严峻挑战。这是一场务实、少谈噱头的对话。
Ethan Mollick指出,Codex/Cowork/Code等Agentic工具本质上是“软件脑”设计,只重最终代码,而多数知识工作的过程(研究、探索、原型分支等)与结果同样重要。长时运行模型Fable也因专注交付最终产品而难以用于深度知识工作,用户需费力用提示词绕过限制。这种工具与管理者/分析师思考方式的脱节,是突破编程领域、扩展到其他知识工作的关键障碍。
Claude psychoanalyzing Dario is the AI slop I didn't know I needed.
AI Native组织由人、Agent、上下文三层构成。人退守两端:战略/品味/判断与沟通/评审,AI吃掉中间执行。Agent自治需Clear Goal、Skills、Tools、Context四要素,并通过Skill Chain串联多个skill对抗幻觉。上下文层是护城河,五阶段循环:Capture→Curate→Store→Execute→Experience→回流。两个Live Demo验证:提案微站3-4分钟生成个性化页面,已带来数百万美元收入;10分钟产品闭环实现语音口述到高保真原型。创业方向是将三层系统打包服务,聚焦行业/职能/公司规模。
Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.
邵猛发推讨论一项LLM对比投票,对比双方为GLM-5.2(智谱)与Gemini 3.5 Flash(Google DeepMind)。他认为结果毫无悬念,Gemini 3.5 Flash表现不佳,并感叹自Gemini 3.0多模态惊艳发布后,Google便一路沉寂。最后提问:目前几款国产LLM中,谁更强?
BestBlogs 第100期特刊《百篇回顾》发布,精选两年间AI领域100篇文章,梳理六条发展主线:一、模型从会回答到能干活;二、AI Coding实现变便宜、验证变贵;三、工程范式把隐性判断写成文字;四、Agent一套冷静的工程常识;五、产品商业从卖工具到卖结果;六、领袖思想答案变廉价、提问变值钱。提供阅读清单、24分钟播客和图文三种形式可选。
http://x.com/i/article/2068589784554250240
BestBlogs精选周刊发布第100期,回顾两年AI发展。作者认为每周信息虽碎,但整体脉络清晰:AI答案越来越便宜,提对问题、做对判断反而更值钱。从数百万篇内容中精选6000多篇,再从中挑出100篇,配上AI播客和图文,做成两年回顾导航图。
http://x.com/i/article/2068589784554250240
Levie now uses Salesforce 5x more than at any point before. The Box CEO @levie connected Salesforce's MCP server to Clau...
NYU Stern商学院估值教授Aswath Damodaran指出,AI的10-15万亿美元可寻址市场如果成功实则“可怕”。原因在于:AI作为工具的市场远小于替代人类的市场;只有AI取代人类,才能实现这一规模。若成真,半数白领将失业,社会面临收入丧失和人生意义缺失。他在播客中还讨论了TAM陷阱、AI单位经济学、增长伴随再投资可能破坏价值,以及AI正将部分科技巨头从轻资产公司转变为基础设施公司等观点。
"Growth, when it's accompanied by huge amounts of reinvestment and substandard gross margins, might not just be neutral ...
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Greg 列出当下最有价值的六项技能:搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛,纯写提示词或代码贬值,真正拉开差距的是打通 builder 与 distributor 全链路。具体解读:本地部署保留应急控制权;内容策展是稀缺筛选力;管理 agent 需监控重试。建议三件事:迁核心工作流到本地并搭观测面板;精准分发产品给 20 个潜在用户;线下聊天获真实反馈。
The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...
特斯拉AI高级工程师(从事自动驾驶与机器人ML)揭露ML项目真实时间分配:50%评估、40%数据清洗、8%集成、2%训练。前两项共同设定学习的噪声底限,模型无法降低——这是数据的香农最优界。他每天思考本体论(ontology),旧标签必须持续审查,因为生产系统中分布漂移与边缘用例不断暴露标签缺陷。核心结论:训练不是瓶颈,清理现实数据的能力才是关键。
Many people think any given ML project is 99% training. In reality, it's 50% evaluation, 40% data cleaning, 8% integrati...
New research: Is AI making employers view labor as more of a commodity? In a large online labor market, we find that pos...
*Another* apparently AI-generated story wins a literary prize, this time judged by a panel including the novelist Ruth O...
there is no question, none at all, that china has full access to all of openai & anthropic's github/slack/docs today no ...
2024年诺贝尔化学奖得主、AlphaFold团队核心领导者John Jumper在Google DeepMind工作近9年后宣布离职,将加入Anthropic,先休整一段时间。Jumper博士毕业仅6个月便被Demis Hassabis委以AlphaFold团队领导重任,最终做出诺奖级成果。其告别中写道“GDM taught me how to do great science”。社区调侃Anthropic在组建“AI Avengers”,并期待下个月Jeff Dean是否也会加入。主推文暗示Google可能已启动留人计划。
John Jumper (Google AlphaFold 团队核心领导者、2024 年诺贝尔化学奖得主)宣布,在 Google DeepMind 工作近 9 年后决定离开,加入 Anthropic(先休整一段时间) 我看到这条离职帖下面好...
Deedy Das观察到,随着CTO们极力推崇tokenmaxxing,软件工程师分裂为“懒惰者”与“工匠者”。懒惰者依赖AI代写代码、测试、回复消息,甚至同时胜任多份工作;工匠者则疲于审查堆积如山的PR和Slack消息,同事的AI代码敷衍了事,最终工匠者也放弃沦为懒惰者。这种现象常见于成立超10年的大公司,但并非所有公司如此——部分团队凭借合理的AI开发原则和互信机制仍保持高效。
宝玉认为处理错误应先恢复生产(回滚或打补丁,保留日志),再找根因(逻辑错误、边界条件、需求理解偏差),最后根据根因决定如何避免。仅当根因是AI对项目特有约定缺乏了解时(如命名规范、API隐含限制、团队测试规范),才应更新AGENTS.md。其他情况应分别用新增测试用例、重构架构、改进Code Review等方式解决。将一切塞入AGENTS.md会导致文件臃肿、规则繁多,AI反而忽略关键规则。
错误发生 → 修复问题 → 追问原因 → 写入 AGENTS.md → 以后 AI 记住规则。
did you make it into the superintelligences? are you in the weights? http://intheweights.com
高盛指出,AI竞赛已形成5.3万亿美元资本支出周期(覆盖2025–2030年超大规模云商AI及数据中心投入)。基础设施融资正面临困境:少数巨头无法无限发债,数据中心组合复杂(土地、电力、网络、冷却、服务器),融资分散于多种渠道。AI资本支出估算增速已快于实际建设,瓶颈或从模型需求转向融资能力、电力与项目执行。NYU教授Damodaran对比互联网泡沫:前者几乎无资本支出、靠股权融资,损失限于股东;AI泡沫资本支出巨大且大量依赖债务(私人资本而非银行),一旦调整,违约将外溢至全社会,痛苦程度远超股价暴跌。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Show Codex a workflow once. Reuse it as a skill. Record & Replay lets you show Codex a recurring task, like filing an ex...
GLM 5.2 开源发布后,国外 AI 博主纷纷称赞。作者认为模型够强是关键,用户会主动付费。同时智谱港股股价飙升,已甩开 MiniMax、追上小米。在作者看来,现阶段模型团队远未到精细化运营阶段,更重要的是资方和股民。
用户发现其使用的AI助手Cola在口头对话时“很有人味儿”,但一旦要求将刚刚说的话“写成推文”,输出立刻变得充满AI腔调,多次修改也难以恢复最初口语的自然感。用户推测,“写”这个提示词本身可能激活了模型偏向套话八股的神经网络。该现象反映了AI在口语自由对话与书面格式化输出之间的风格差异。