X·KOLX:邵猛 (@shao__meng)
作者@mattpocockuk公开了其.claude/目录下的实用Agent Skills集合,旨在解决四大工程痛点:1) 通过/grill-me等技能在动工前对齐需求,修复沟通鸿沟;2) 维护CONTEXT.md与ADR建立共享语言,提升代码一致性;3) 利用/tdd和/diagnose建立快速测试与诊断反馈回路;4) 通过/to-prd、/zoom-out等技能对抗代码熵增,持续投资设计。这些技能分为工程、效率与工具三类,形成从需求对齐到代码落地的完整工作流。
X·KOLX:Greg Brockman (@gdb)
开发者发布了一款名为“codex-startup-pressure-test-skill”的Codex技能工具,旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户,并定义一个可在两周内完成的MVP(最小可行产品)。用户可通过npm命令直接安装,该工具完全开源,相关代码库已公开。
X·KOLX:宝玉 (@dotey)
多数公司无法有效利用AI,核心障碍并非技术,而是企业自身目标模糊、战略混乱且缺乏清晰的业务流程描述。AI擅长执行明确指令,但大多数公司处于“混乱黑盒”状态,无法清晰定义目标、工作流与衡量指标。只有少数具备高度自我认知和组织纪律的公司能真正借助AI提升竞争力。企业应首先审视自身是否具备让AI有效协助的清晰内部状态,而非盲目追求技术应用。
大咖博客Tomer Tunguz 博客(VC 分析)
基于开源模型和商用GPU的广告支持型AI在经济上可行。计算表明,一个由4块B200 GPU组成的集群服务300名用户时,每小时成本约18美元。通过广告收入即可覆盖成本:在内容网络中每3分钟展示一条广告(CPM 3.12美元),或在搜索广告中每39分钟展示一条(CPM 38.40美元),这一广告频率已与常见的移动和网页应用相当。对于代码代理等高强度任务,可采用混合盈利模式:用户每月支付10美元订阅费并每日观看8条广告,即可支持约200万token的用量,这证明了该模式的实用性。
官方Runway:News(网页)
Runway平台团队开发的NCCLBack系统,通过P2P权重传输将模型冷启动时间从数分钟缩短至数秒。其核心创新在于让新启动的GPU推理节点直接从集群内已加载权重的同级GPU获取模型参数,而非从云存储重复下载。该系统利用GPU互连(如InfiniBand、NVLink)高达200-400 Gbps的带宽,相比传统存储下载的2-10 Gbps实现了数量级提升。通过Redis协调与NCCL广播原语,NCCLBack确保了数据传输的效率和正确性,使得大规模集群部署新模型时,冷启动时间不随节点数量线性增长,基本保持恒定。
大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)
一项新综述研究指出,尽管大语言模型(如GPT、Claude、LLaMA)在医疗领域的应用日益广泛,但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究,发现这些模型在诊断支持、文书处理等方面展现出潜力,但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上,尚未展现出统计学上的显著积极影响。研究强调,需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。