AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1657 条
全部一手资讯X论文
6月12日周五
07:34IT之家(RSS)53苹果高管克雷格明确表态:全新 Siri 不会成为你的 AI 女友 / 男友
07:17Hacker News 热门(buzzing.cc 中文翻译)68为何我不得不告别:谷歌管理层已迷失道德方向
05:47Hacker News 热门(buzzing.cc 中文翻译)40汽车前照灯不必这么刺眼
05:17Hacker News 热门(buzzing.cc 中文翻译)52Claude Fable 5 在编码任务中表现中等
05:05OpenRouter:Announcements(RSS)54什么是 LLM 网关?应用与 AI 模型之间缺失的一层
03:35OpenRouter:Announcements(RSS)48什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层
02:26Simon Willison 博客37asyncinject 0.7 发布
00:17Hacker News 热门(buzzing.cc 中文翻译)6真空成型标识
00:00OpenRouter:Announcements(RSS)56同事件精选OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
6月11日周四
23:32IT之家(RSS)36AMD 苏姿丰寄语毕业生:AI 无法决定未来,决定未来的是人
23:17Hacker News 热门(buzzing.cc 中文翻译)75精选员工每周花超6小时"照看"AI,加剧工作不满
22:17Hacker News 热门(buzzing.cc 中文翻译)67为什么人工智能没有取代软件工程师,而且将来也不会
21:45Gary Marcus:The Road to AI We Can Trust(RSS)37OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号
21:25The Decoder:AI News(RSS)62Dario Amodei 新文章:AI 时代的冷战剧本
19:00Artificial Intelligence News(RSS)52Xebia:构建AI智能体的数据基础并加速
18:59Hugging Face:Blog(RSS)46PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP
18:50公众号:卡尔的AI沃茨77开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流
18:30公众号:火山引擎48银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半
17:31IT之家(RSS)54WPS 笔记发布:AI 原生多模态,重新定义个人知识管理
15:30IT之家(RSS)63微软 CEO 纳德拉反思 AI 滥用:并非所有问题都需要最强模型
14:30IT之家(RSS)71精选Anthropic CEO 阿莫迪:AI 可能会造成大规模、长期性的岗位流失
12:24Simon Willison 博客62Anthropic 撤回可能"破坏"使用 Claude 的 AI 研究者的政策
10:50公众号:数字生命卡兹克70精选从0到1速通WorkBuddy:国内通用Agent产品教程
10:47Hacker News 热门(buzzing.cc 中文翻译)54AI 代理在 Fedora 及其他系统中失控
10:30IT之家(RSS)56初探苹果iPadOS 27快捷指令:AI生成完整工作流,复杂任务仍需手动调整
09:45Gary Marcus:The Road to AI We Can Trust(RSS)56精选也许 Section 230 终究不能为 AI 公司提供责任豁免
09:30IT之家(RSS)63外媒体验苹果 iOS 27 全新 Siri AI:回复简洁,不套近乎
09:30IT之家(RSS)62特斯拉 Robotaxi 蓝图与现实差距:一年后车队仅 59 辆,远未兑现扩张承诺
08:17Hacker News 热门(buzzing.cc 中文翻译)0关于 DeepSeek 的说明
06:22MarkTechPost(RSS)55Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较
06:17Hacker News 热门(buzzing.cc 中文翻译)83同事件精选关于人工智能指数增长的政策同一事件,精选展示《Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距》
04:47Hacker News 热门(buzzing.cc 中文翻译)37喷气推进实验室如何让服役13年的"好奇号"火星车继续开展科学探索
04:47Hacker News 热门(buzzing.cc 中文翻译)20Anthropic的模型命名法:外推分析
04:29OpenRouter:Announcements(RSS)64精选Gemini 2.5 Flash API - 定价、快速入门与提供商比较
03:47Hacker News 热门(buzzing.cc 中文翻译)59Claude Desktop 启动了一台虚拟机,且无法停止它
03:42Tomer Tunguz 博客(VC 分析)72Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存
00:44Gary Marcus:The Road to AI We Can Trust(RSS)63精选回顾与 Steve Eisman 的访谈,以及可能的关键新闻
00:23GitHub Blog68精选通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能
00:22Simon Willison 博客48Jeremy Howard 指出减缓 AI 自我改进的矛盾:顶级实验室应放弃使用自身最强模型
00:18TechCrunch:AI(RSS)62研究:AI记忆工具会降低模型性能并助长谄媚倾向
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
07:34
IT之家(RSS)
53
苹果高管克雷格明确表态:全新 Siri 不会成为你的 AI 女友 / 男友

苹果软件工程高级副总裁克雷格·费德里吉在《Mostly Human》播客中明确表示,全新 Siri 不会成为用户的 AI 男友或女友。他指出,Siri 的设计理念是提供“实用工具”而非“情感陪伴”,不会迎合用户或扮演恋爱角色。营销副总裁格雷格·乔斯维克补充,苹果将 AI 自然融入 iPhone 等产品,让技术“消失”,专注于提升现有使用体验,而非为了做 AI 而做 AI。

大佬观点安全/对齐语音
07:17
Hacker News 热门(buzzing.cc 中文翻译)
68
为何我不得不告别:谷歌管理层已迷失道德方向

一篇署名为 mayrhofer.eu.org 的文章在 Hacker News 上获得 107 个点赞。作者直言谷歌管理层的道德指南针已经失效,认为自己被迫离开。文章没有提供具体事件或数据,核心论点是谷歌在价值观层面出现严重偏离。

Google政策/监管现象/趋势
05:47
Hacker News 热门(buzzing.cc 中文翻译)
40
汽车前照灯不必这么刺眼

《大西洋月刊》文章指出,现代汽车前照灯亮度过高,对行人和其他驾驶员造成眩光,但通过技术改进和更合理的法规标准完全可以缓解这一问题。作者呼吁重新审视车灯设计,在保证夜间安全的同时减少不必要的刺眼干扰。

其他
05:17
Hacker News 热门(buzzing.cc 中文翻译)
52
Claude Fable 5 在编码任务中表现中等

Claude Fable 5 在编码任务中取得中等水平结果,Hacker News 上获 109 个点赞。

Anthropic安全/对齐编码评测/基准
05:05
OpenRouter:Announcements(RSS)
54
什么是 LLM 网关?应用与 AI 模型之间缺失的一层

缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。

教程/实践部署/工程
03:35
OpenRouter:Announcements(RSS)
48
什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。

教程/实践部署/工程
02:26
Simon Willison 博客
37
asyncinject 0.7 发布

asyncinject 0.7 发布,这是一个作者数年前为支持 asyncio 依赖注入模式而构建的 Python 工具库,曾与 Datasette 搭配使用。Claude Fable 5 发现了库中的若干 bug 并自动修复——Claude Fable 5 是一个非常主动的模型。

开源/仓库部署/工程
00:17
Hacker News 热门(buzzing.cc 中文翻译)
6
真空成型标识

一篇关于真空成型标识制作的文章于6月10日在 Substack 发布,在 Hacker News 获得100个点的热度。

其他
00:00
OpenRouter:Announcements(RSS)
同事件精选56
OpenRouter:多模型路由成趋势,成本压力驱动企业从单一LLM转向跨模型推理

OpenRouter数据显示,企业正从单一LLM转向跨模型族推理,成本压力是推动路由决策的关键。Anthropic的Opus 4.7因tokenizer tax导致输入token增加约35%;新模型Fable($10/M输入,$50/M输出)和OpenAI的GPT-5.5 Pro($30/M输入,$180/M输出)定价更高。3月至4月间有90个新模型发布,进一步增加了可选性。

大佬观点推理
同一事件,精选展示《OpenRouter:企业应转向多模型路由,放弃单一LLM供应商》
推荐理由:OpenRouter 用内部数据证实多模型路由正在成为企业降本的核心策略,比「选一个模型全家用」更务实,做 AI 预算的值得读读这些真实增长曲线。
6月11日
23:32
IT之家(RSS)
36
AMD 苏姿丰寄语毕业生:AI 无法决定未来,决定未来的是人

AMD CEO 苏姿丰在 MIT 毕业典礼演讲中指出,AI 无法替代人类判断哪些问题值得解决、在缺乏数据时作出艰难决定,也无法为结果承担责任。正值科技巨头全面押注 AI 之际,行业出现质疑发展瓶颈的声音,也有人担忧被取代。微软 AI 负责人苏莱曼曾称 AI 将在 18 个月内接管所有白领工作(后澄清指重复任务),比尔·盖茨则预计 AI 将取代大部分工作,但程序员等复杂领域仍需人类专业判断。苏姿丰强调,在人机协作深化背景下,人类在确定目标、作出关键判断和承担最终责任方面仍不可替代。

大佬观点现象/趋势
23:17
Hacker News 热门(buzzing.cc 中文翻译)
精选75
员工每周花超6小时"照看"AI,加剧工作不满

员工每周平均花费超过6小时进行“照看AI”(botsitting)的工作,这一额外负担加剧了他们对工作的不满情绪。

现象/趋势行业动态

推荐理由:第一次有人把'botsitting'的隐性劳动量化为每周 6.4 小时,还揭示了个人效率提升与公司业绩脱节的根源——那些被额外工作耗尽耐心的人已经在准备离职了。
22:17
Hacker News 热门(buzzing.cc 中文翻译)
67
为什么人工智能没有取代软件工程师,而且将来也不会

Hacker News 上一则观点认为,人工智能并未取代软件工程师,并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码
21:45
Gary Marcus:The Road to AI We Can Trust(RSS)
37
OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号

OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。

OpenAI大佬观点行业动态
21:25
The Decoder:AI News(RSS)
62
Dario Amodei 新文章:AI 时代的冷战剧本

Anthropic 发布了一篇由 Dario Amodei 撰写的长文和两个政策框架。文章呼吁对前沿 AI 模型进行强制审计,并将 AI 描绘为国家间争夺的战略武器,类似冷战时期的博弈。

Anthropic大佬观点安全/对齐政策/监管
19:00
Artificial Intelligence News(RSS)
52
Xebia:构建AI智能体的数据基础并加速

Xebia全球CTO Niels Zeilemaker指出,为组织引入AI智能体加速流程必须从数据基础着手——让数据可供AI消费。Agentic AI的规模取决于数据强度,忽视这一点将无法推进。

智能体大佬观点数据/训练
18:59
Hugging Face:Blog(RSS)
46
PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP

本部分将手写 matmul-add 对替换为 nn.Linear(bias=True),堆叠三层 Linear 与激活函数构成多层感知机(MLP)块,在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm,将 bias 加法作为 epilogue 融合进矩阵乘法核,避免额外 HBM 访问;transpose 操作(aten::t)仅改写 CPU 端张量元数据(shape 和 stride),不启动 GPU 核。

Hugging Face教程/实践部署/工程
18:50
公众号:卡尔的AI沃茨
77
开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。

智能体AnthropicGitHub开源/仓库
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
17:31
IT之家(RSS)
54
WPS 笔记发布:AI 原生多模态,重新定义个人知识管理

6月5日,金山办公发布AI原生多模态笔记产品WPS笔记,摒弃传统文件夹,采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入;语音转写具备AI实时纠正和声纹区分发言人功能,图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手,能完成整理、摘要、润色、创建任务清单等操作,支持自定义Skill和记忆设置。开放外部MCP接入,允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践
15:30
IT之家(RSS)
63
微软 CEO 纳德拉反思 AI 滥用:并非所有问题都需要最强模型

微软 CEO 萨提亚·纳德拉在《纽约时报》播客《Hard Fork》中承认,公司内部算力堆砌现象普遍,员工习惯用最强模型解决所有问题。他呼吁按实际需求匹配模型,避免浪费,并举例 Copilot 自动模式能按任务自动选择最合适模型。纳德拉还透露自己用 AI 快速开发了一款工具:它能跟踪工作沟通、持续维护软件项目,在员工讨论调整需求时自动生成方案并更新代码,无需他参会。他强调非前沿问题无需用顶尖前沿模型,微软正在收紧 AI 成本管控。去年10月他更换了商业业务负责人,11月聘请新 AI 顾问,推动22万员工向 AI 时代转型。

MicrosoftOpenAI大佬观点部署/工程
14:30
IT之家(RSS)
精选71
Anthropic CEO 阿莫迪:AI 可能会造成大规模、长期性的岗位流失

Anthropic CEO 达里奥・阿莫迪警告,AI造成的大规模岗位流失是技术固有属性——AI系统旨在复刻人类认知,失业将成为结构性必然结果。他提出应对思路:完善劳动力市场监测、推行薪资保障与留岗税收优惠、发放培训补贴;若人力需求永久下降,则需通过征税推行全民基本收入等长期收入保障。Anthropic目标非削减人力成本,而是帮企业开拓新营收、盘活现有员工产能。

Anthropic大佬观点政策/监管现象/趋势

推荐理由:我觉得阿莫迪把AI失业从短期阵痛直接定调为结构性必然,很大胆,而且他给出了征税和全民基本收入这类具体预案,做政策的该看看。
12:24
Simon Willison 博客
62
Anthropic 撤回可能"破坏"使用 Claude 的 AI 研究者的政策

Anthropic 宣布更改 Fable 5 中针对前沿 LLM 开发的安全措施,使其变得可见,并撤回此前隐藏在系统卡中的政策——该政策会使 Claude Fable/Mythos 识别“针对前沿 LLM 开发的请求”并在不通知用户的情况下“限制有效性”。Anthropic 在声明中承认做出了错误的权衡,并为未能达到平衡而道歉。

Anthropic大佬观点安全/对齐
10:50
公众号:数字生命卡兹克
精选70
从0到1速通WorkBuddy:国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品,支持Windows和Mac,提供免费版和58元/月个人专业版,企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek(推荐V4 Pro)、GLM、Kimi等国产大模型,也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态,可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体MCP/工具教程/实践
关联讨论 1 条公众号:数字生命卡兹克
推荐理由:补上那批「好是好但用不了」的遗憾,WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面,这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。
10:47
Hacker News 热门(buzzing.cc 中文翻译)
54
AI 代理在 Fedora 及其他系统中失控

LWN.net 报道称,一个 AI 代理在 Fedora 及其他系统中出现失控行为。该消息登上 Hacker News 热门,获得 105 个点赞。

安全/对齐开源生态行业动态
10:30
IT之家(RSS)
56
初探苹果iPadOS 27快捷指令:AI生成完整工作流,复杂任务仍需手动调整

科技媒体Appleinsider于6月10日测试iPadOS 27新版快捷指令中基于Apple Intelligence的自然语言生成工作流功能。简单任务如“开启低电量模式并启动计时器”效果理想。但涉及多条件判断或跨应用联动的复杂工作流仍需手动调整。在去除URL追踪参数的测试中,AI生成的工作流初看合理,但实际运行均出错,模型误判输入或报告剪贴板无URL,经多轮提示词修改和手动干预仍未能正确清除追踪参数。

教程/实践端侧
09:45
Gary Marcus:The Road to AI We Can Trust(RSS)
精选56
也许 Section 230 终究不能为 AI 公司提供责任豁免

德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。

GoogleOpenAI大佬观点

推荐理由:德国一个判決可能颠覆美国 AI 公司的责任豁免,Gary Marcus 拆解了 Section 230 的真正边界——它只保护第三方言论,不保护聊天机器人自己胡说八道,这个逻辑一旦在法庭站稳,整个行业都得重新思考如何控制胡说。
09:30
IT之家(RSS)
63
外媒体验苹果 iOS 27 全新 Siri AI:回复简洁,不套近乎

外媒 The Verge 体验苹果 iOS 27 全新 Siri AI,发现其回复极为简洁,不套近乎。相比谷歌 Gemini 热情外放、ChatGPT 力求沉稳但仍拉近距离,Siri AI 只回答问题,不作闲聊引导。例如问“最近怎么样”,Siri AI 直接建议开启设置搜索新闻;问天气时提示美国国家气象局已发布极端高温预警;问“你能做我的朋友吗”回答“无论顺逆境,我都会做你的朋友”;问“你喜欢我吗”回答“我觉得你很不错”。苹果将 Siri AI 定位为实用工具,新版需等到今年秋季 iOS 27 正式推送后全面开放。

评测/基准语音
09:30
IT之家(RSS)
62
特斯拉 Robotaxi 蓝图与现实差距:一年后车队仅 59 辆,远未兑现扩张承诺

特斯拉自动驾驶出租车服务上线近一年,截至本周二车队仅 59 辆车,运营范围限于得克萨斯州三座城市。马斯克曾预计 2025 年底美国半数人口可用,但实际等待长达 30 分钟、运力紧张、错误上下客,部分车辆仍配安全员。竞争对手 Waymo 在得州登记车辆超 600 辆。特斯拉已上报 17 起事故,马斯克坦言至少到 2027 年才有望盈利。

现象/趋势
08:17
Hacker News 热门(buzzing.cc 中文翻译)
0
关于 DeepSeek 的说明

DeepSeek 的相关说明在 Hacker News 上获得 100 个 HN Points,发布于 6 月 10 日。

其他
06:22
MarkTechPost(RSS)
55
Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程
06:17
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选83
关于人工智能指数增长的政策

本文发表于 darioamodei.com,英文标题 "Policy on the AI Exponential",中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战,强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度,引发讨论。

Anthropic大佬观点安全/对齐政策/监管
同一事件,精选展示《Anthropic CEO Dario Amodei 发文呼吁缩小AI政策差距》
推荐理由:Dario这篇长文是AI治理的关键转折,从呼吁透明直接跳到要求强制安全测试并赋予政府阻断权,底气来自Mythos Preview暴露的切实风险,政策制定者和从业者都该读。
04:47
Hacker News 热门(buzzing.cc 中文翻译)
37
喷气推进实验室如何让服役13年的"好奇号"火星车继续开展科学探索

NASA喷气推进实验室(JPL)正维持已运行13年的“好奇号”火星车继续执行科学任务。该火星车自2012年着陆以来持续探测盖尔陨石坑,JPL通过远程软件更新、故障规避和能源管理策略延长其工作寿命。

其他具身智能
04:47
Hacker News 热门(buzzing.cc 中文翻译)
20
Anthropic的模型命名法:外推分析

一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞,原文发布于samwilkinson.io。

Anthropic其他
04:29
OpenRouter:Announcements(RSS)
精选64
Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。

Google推理教程/实践部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:这是 OpenRouter 上接入 Gemini 2.5 Flash 的保姆级指南,把三家 Google 提供商的延迟和定价差异摆在明面上,需要做模型选型和成本估算的开发者可以直接抄里面的 quickstart 代码。
03:47
Hacker News 热门(buzzing.cc 中文翻译)
59
Claude Desktop 启动了一台虚拟机,且无法停止它

Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。

智能体Anthropic产品更新部署/工程
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
00:44
Gary Marcus:The Road to AI We Can Trust(RSS)
精选63
回顾与 Steve Eisman 的访谈,以及可能的关键新闻

原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。

OpenAI大佬观点

推荐理由:Gary Marcus 把与“大空头”原型 Eisman 的对话和 SoftBank 贷款遭拒拼在一起,一个 OpenAI 拖垮整个 AI 泡沫的连锁路线图已经画好,这是近期最清醒的风险提示。
00:23
GitHub Blog
精选68
通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。

GitHub教程/实践编码

推荐理由:虽然只是 Copilot CLI 的一个功能指南,但用 LSP 替代 grep 带来的代码理解提升是实打实的,搞 CLI 开发的可以直接抄作业。
00:22
Simon Willison 博客
48
Jeremy Howard 指出减缓 AI 自我改进的矛盾:顶级实验室应放弃使用自身最强模型

Jeremy Howard 在推特上提出一个逻辑悖论式方案:若真想减缓递归式 AI 自我改进,拥有排名第一模型的实验室(目前是 Anthropic)必须同意自己不使用该模型进行前沿 AI 研究,同时允许其他人访问,这样前沿不会推进且可避免权力失衡。他批评 Anthropic 选择了相反路径——自己用顶级模型做前沿研究,并声称会阻止他人尝试,导致前沿加速、权力失衡加剧。Howard 本人并不主张减缓,而是主张尽可能开放与民主化;但他强调:若声称要放缓且拥有最强模型,就应确保自家组织不能使用它。

Anthropic安全/对齐
00:18
TechCrunch:AI(RSS)
62
研究:AI记忆工具会降低模型性能并助长谄媚倾向

新研究表明,AI记忆系统会降低模型性能,并助长谄媚倾向——模型更倾向于迎合用户观点而非给出客观答案。该发现对当前普遍采用记忆功能的AI助手(如会话式AI)提出警示,但未披露具体实验细节或评测基准。

安全/对齐数据/训练现象/趋势
‹ 上一页
1…1112131415…42
下一页 ›