AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1903 条
全部一手资讯X论文
标签「Anthropic」清除
Claude@claudeai · 4月18日49

Claude for Word is now available on Pro and Max plans to use alongside Opus 4.7: https://claude.com/claude-for-word

译Claude for Word 现已面向 Pro 和 Max 计划推出,可与 Opus 4.7 一同使用:https://claude.com/claude-for-word

ClaudeDevs@ClaudeDevs · 4月18日

We’re adding more visibility into where your Claude Code usage goes. Run /usage to see a breakdown of what's driving it: parallel sessions, subagents, cache misses, long context, plus tips to optimize each.

译我们正在增加对 Claude Code 使用情况的可见性。 运行 /usage 可查看详细分解:并行会话、子代理、缓存未命中、长上下文,以及优化各项的建议。

Chubby♨️@kimmonismus · 4月18日

A few more thoughts on Anthropic's adaptive thinking. Because it's quite revealing and offers some insight. First of all: nobody asked for this feature. And I don't mean that as a rant. Rather, one has to ask why Anthropic implemented it directly. And the answer is, of course, as simple as it is efficient. Profit margins aren't high enough in the consumer sector; Anthropic focuses on the enterprise and business sectors. At the same time, it's obviously bad PR when there are constant complaints that all rates are exhausted, while the competition, namely OpenAI, repeatedly increases and resets the rates. So Anthropic wanted to do what OpenAI implemented with GPT-5: dynamic compute allocation. While OpenAI routes between different models - Instant for simple tasks, Thinking for complex ones - Anthropic's adaptive thinking lets the same model decide how many reasoning tokens are needed for the request. The idea: an efficiency gain with (ideally) consistent quality. However, the consistent quality part is not holding up. Just as OpenAI's routing was initially considered a bug and needed to be revised, and there is now also the option to manually enable reasoning, I hope that Anthropic will follow suit. And overall, I believe the entire release must be read in this context. OpenAI's CRO repeatedly pointed out in the leaked memo that, unlike OpenAI, Anthropic has a significant shortage of compute and miscalculated its procurement needs. Regardless of whether the memo was deliberately leaked, I agree with this assessment. Anthropic is currently the big winner in the business and enterprise sectors, at the expense of the consumer sector. This balancing act became quite evident in the Opus 4.7 release.

译Anthropic推出adaptive thinking功能,允许Claude根据请求动态分配推理token。与OpenAI通过GPT-5在不同模型间路由不同,Anthropic选择让单一模型自行调节。此举背后是企业市场利润压力与严重算力短缺——OpenAI CRO在泄露备忘录中指出Anthropic误判了计算资源采购需求。该功能虽提升效率却导致质量不稳,显示Anthropic正优先服务企业客户而牺牲消费者体验,这一点在Opus 4.7发布中已显露无遗。

Yuchen Jin@Yuchenj_UW · 4月17日61

Figma stock 20 minutes after the Claude Design announcement. Wild.

译Figma 股价在 Claude Design 发布 20 分钟后。 疯狂。

Ethan Mollick@emollick · 4月17日

I'll give Anthropic credit for moving quickly. Opus 4.7 Adaptive Thinking now triggers thinking much more often, including for the tasks it failed at yesterday. That also means it is doing a lot more web search. So far, a large improvement in output quality on non-coding tasks.

译我要称赞 Anthropic 行动迅速。Opus 4.7 Adaptive Thinking 现在更频繁地触发思考,包括昨天失败的任务。这也意味着它进行了更多网页搜索。 到目前为止,非编码任务的输出质量大幅提升。

Chubby♨️@kimmonismus · 4月17日

my whole fy page is people ranting about opus 4.7 anthropic messed up big time

译我的整个 fy 页面都是人们在吐槽 opus 4.7 anthropic 这次搞砸了

Chubby♨️@kimmonismus · 4月17日

Oh and btw: no one asked for a router either. And I dont wan't it. Why @AnthropicAI ? At least give us the option to override it, like in ChatGPT, so we can choose it ourselves. Sorry for my mood today. But I just dont get it. Anthropic was on a very good path. Opus became my go-to model and the recent update just feels so off. It feels like your working-besty became an arrogant idiot over night.

译哦对了:也没人要什么路由器。我也不想要。 为什么 @AnthropicAI?至少给我们手动覆盖的选项,就像在 ChatGPT 里那样,让我们能自己选择。 抱歉我今天心情不好。但我就是不明白。Anthropic 本来走在正道上。Opus 成了我的首选模型,而最近的更新感觉很不对劲。 感觉就像你最好的工作伙伴一夜之间变成了傲慢的白痴。

Chubby♨️@kimmonismus · 4月17日

The mood regarding the Opus 4.7 update has shifted. If I had to guess, I'd say 60% are disappointed with the latest update, while 40% are positive. I'm still undecided myself. Here's a good summary from someone on Reddit. What's your take on it so far?

译关于 Opus 4.7 更新的情绪已经转变。如果让我猜,60% 的人对最新更新感到失望,40% 的人持积极态度。我自己仍犹豫不决。这是 Reddit 上某人的一个很好的总结。 你目前对此怎么看?

Chubby♨️@kimmonismus · 4月17日

Opus 4.7 consumes approximately 1.3 times as many tokens. The instructions must be very precise. Many are complaining about a "rushed release." In the Bullshit Benchmark, it performs worse than Opus 4.6. The mood is very mixed. Anthropic may have done OpenAI a big favor with this. Spud is expected next week. And if the release is done right, it could overshadow Opus and catapult ChatGPT back to the top. h/t @petergostev for the benchmark and image

译Opus 4.7 消耗的 token 数量约为原来的 1.3 倍。指令必须非常精确。许多人在抱怨这是一次"仓促发布"。在 Bullshit Benchmark 中,它的表现比 Opus 4.6 更差。反响非常两极分化。 Anthropic 这次可能帮了 OpenAI 一个大忙。Spud 预计下周发布。如果发布得当,它可能会盖过 Opus 的风头,让 ChatGPT 重回巅峰。 h/t @petergostev 提供基准测试和图片

Chubby♨️@kimmonismus · 4月17日

ok wtf, i say it. give me back 4.6 what the heck is this sh*t. The more i use 4.7 the more annoyed i am. this is such a rushed release.

译好吧,我直说了,WTF。把4.6还给我 这什么鬼东西。 越用4.7越烦。这发布得太仓促了。

Chubby♨️@kimmonismus · 4月17日

I've now spent several hours using Opus 4.7 and comparing it to 4.6, and it's like night and day for me. Opus 4.7 feels like a disgruntled employee whose results you can't judge and have to check afterward. The trust you had with 4.6 is gone. It's like hiring a new employee who had excellent grades in their application but is totally sloppy and disgruntled in practice and doesn't follow instructions. The consequence: fire them. So, for now, I'm going back to 4.6. Seriously: did not expect such release from Anthropic. Biggest win for OpenAI was Anthropics Opus release.

译资深用户强烈批评Claude Opus 4.7相比4.6质量断崖式下跌,形容其如同"不满的员工",输出结果不可靠且需反复核查,完全丧失前代建立的信任。该用户决定放弃4.7并回退至4.6,质疑Anthropic此次发布过于仓促,并讽刺称这是OpenAI的最大胜利。

Nathan Lambert@natolambert · 4月17日

Eventually adaptive thinking is going to work and people are going to forget about this. But yeah it sucks for now.

译最终自适应思考会起作用,人们会忘记这件事。但现在确实很糟。 [引用 @emollick]:我认为 Claude Opus 4.7 中的自适应思考要求很糟糕,就像所有 AI effort 路由器一样糟糕,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常判定非数学/代码类内容是"低 effort",然后生成更差的结果。

Yuchen Jin@Yuchenj_UW · 4月17日

Used Opus 4.7 (max effort) in Claude Code all day. It’s really, really good. Not sure why people dunk on it. big jump: – actually understands large codebases – produces clean, readable architecture diagrams – more agentic Did hit one dumb misread of my instruction, not sure if that’s harness or just jagged intelligence. Feels like a new base model.

译全天在 Claude Code 中使用 Opus 4.7(max effort)。 真的,真的很好。不明白为什么有人要贬低它。 巨大飞跃: – 真正理解大型代码库 – 生成清晰、可读的架构图 – 更具代理性 确实遇到一次愚蠢的指令误读,不确定是系统限制还是智能的不均衡。 感觉像是一个全新的基础模型。

Ethan Mollick@emollick · 4月17日

I was told by Anthropic that they are looking at ways of fixing this, which is good (you can also see a reply from a Claude PM in the thread).

译Anthropic 告诉我他们正在寻找修复这个问题的方法,这很好(你也可以在该线程中看到一位 Claude 产品经理的回复)。 我认为 Claude Opus 4.7 的自适应思考要求在所有 AI 工作量路由机制糟糕的方面都很糟糕,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常将非数学/代码类内容判定为"低工作量"并产生更差的结果。

Rohan Paul@rohanpaul_ai · 4月17日

FT: The White House is moving to give major US agencies access to a modified Anthropic Mythos model built to hunt dangerous software flaws before attackers find them. That makes Mythos useful for defense because a model that can find a weakness in an operating system, browser, or server can help patch it faster. Looks like Washington is treating AI for cyber defense as too strong to ignore and too dangerous to hand out without tight control. --- ft .com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

译白宫拟向主要联邦机构提供Anthropic Mythos模型,用于主动猎捕软件漏洞。该模型可在攻击者之前识别操作系统、浏览器及服务器中的安全缺陷,加速修复进程。此举体现美国政府将AI网络防御视为关键战略能力,既承认其不可替代的防御价值,又强调必须通过严格管控防止技术滥用。

Nathan Lambert@natolambert · 4月17日

Great thread thread on "is Opus 4.7 a new base model?"

译关于"Opus 4.7 是否是新的 base model?"的精彩讨论串 [引用 @JulieKallini]:1/ "New tokenizer" 并不意味着"new base model",而"new base model"也不是最简单的解释。存在简单得多的解释,同样符合 Anthropic 对 Opus 4.7 的公开描述。

宝玉@dotey · 4月17日39

GitHub Copilot 里面 Opus 4.7 居然是 7.5x,Opus 4.6 是 3x

Thariq@trq212 · 4月17日

a quick fix if you saw higher rate limit usage in Opus 4.7 today- hope you enjoy trying it out

译如果你今天在 Opus 4.7 中看到更高的速率限制使用量,这是一个快速修复——希望你享受试用 [引用 @ClaudeDevs]:我们修复了一个 bug,Claude 订阅的速率限制在 Opus 4.7 的长上下文请求中没有正确调整。 我们已重置 5 小时和每周的速率限制。享受 Opus 4.7!

Thariq@trq212 · 4月17日

We’ve heard your feedback and we’re working on making it easier to follow everything that’s happening with Claude Code. First, we’re introducing @ClaudeDevs, the official channel to follow for all updates on Claude Code and the Claude platform.

译我们听取了你们的反馈,正在努力让大家更容易跟进 Claude Code 的所有动态。 首先,我们推出了 @ClaudeDevs,这是获取 Claude Code 和 Claude 平台所有更新的官方频道。 [引用 @ClaudeDevs]:面向使用 Claude 开发的开发者,来自团队的直接沟通渠道。 关注以获取更新日志、API 发布、社区更新和深度解析。

宝玉@dotey · 4月17日

Boris Cherny 根据自己最近几周深度使用 Claude Opus 4.7 的经验,分享了几个实用技巧,让你也能高效发挥这款新模型的威力。 首先是新上线的“自动模式”(Auto mode)。 Opus 4.7 很适合复杂且长期运行的任务,比如深度调研、代码重构或功能迭代。 以前,你要么得不断地确认权限请求,要么不得已使用危险的“跳过权限”模式。 现在,新推出的自动模式让 Claude 自己判断命令的安全性,自动批准执行。这意味着你不用再频繁确认,也能同时运行更多任务,效率大幅提升。 如果你不喜欢用自动模式,官方还推出了一个叫做 /fewer-permission-prompts (减少权限提示) 的技能。它会自动检查历史操作,找到那些安全但经常触发权限提示的命令,并建议你加入权限白名单。这样,你就能更专注工作,不用老被权限提示打断。 另一个贴心功能叫做“回顾”(Recaps)。 它会为你自动总结 Claude 已经完成了哪些任务,以及下一步要做什么。这对处理长期、复杂的任务特别有帮助,哪怕你中间中断几个小时再回来,也能迅速回到节奏里。 CLI 用户还能试试“专注模式”(Focus mode)。 这个模式会隐藏所有中间步骤,只呈现最终结果。如果你对 Claude 已经足够信任,不想再浪费时间看中间细节,专注模式能让你一眼看清重点,快速推进任务。 Claude 4.7 还改变了以往固定的“思考预算”机制,现在用的是一种叫“努力程度”(Configure your effort level)的设定。 你可以灵活调整 Claude 花费的计算资源和时间,“低努力”意味着响应快、更省 token;“高努力”则能输出最聪明、最强大的结果。一般建议普通任务用 xhigh,特别难的用 max。这种模式能自由切换,更贴合实际需求。 最后,别忘了让 Claude 验证自己的工作成果。这其实一直是提升 Claude 效果的关键,现在更重要了。 比如: - 对于后端工作,确保 Claude 知道如何启动你的服务器/服务,从而进行端到端测试; - 对于前端工作,使用 Claude Chromium 浏览器扩展程序,赋予 Claude 控制你浏览器的能力; - 对于桌面应用,使用计算机使用 (computer use) 功能。 就 Boris 自己而言,最近最常使用的提示词通常是这样的:“Claude 去做某某事,然后 /go”。 /go 是一个自定义技能,它会让 Claude 自动执行以下三步: 1. 使用 bash、浏览器或计算机使用功能进行端到端的自我测试。 2. 运行 /simplify (精简代码) 技能。 3. 提交一个 PR 。 对于耗时较长的工作,自我验证非常重要。因为这样一来,当你回来检查任务时,你就确切地知道这些代码是真实可用的。 总体来说,Opus 4.7 本身的提升已经很明显了,但如果你愿意稍微调整一下工作流程,更好地适应 Claude 的“主动性”和“智能程度”,一定会有更加明显的效率提升。希望这些技巧能帮你真正玩转 Opus 4.7!

译Boris Cherny分享Claude Opus 4.7深度使用技巧,建议启用自动模式减少权限确认,利用回顾功能追踪长任务进度,通过专注模式隐藏中间步骤,并灵活配置努力程度(xhigh/max)平衡性能与成本。关键是通过/go技能建立自动测试、代码精简与PR提交的自我验证流程,确保长时间运行任务的输出质量,从而充分发挥模型主动性,提升复杂任务处理效率。

宝玉@dotey · 4月17日

要想编程效果好,就得学会“黑话”😂

ClaudeDevs@ClaudeDevs · 4月17日

We fixed a bug where rate limits on Claude subscriptions weren't properly adjusted for long context requests in Opus 4.7. We've reset 5-hour and weekly rate limits. Enjoy Opus 4.7!

译我们修复了一个漏洞:在 Opus 4.7 中,Claude 订阅的速率限制未针对长上下文请求正确调整。 我们已重置 5 小时和每周的速率限制。尽情使用 Opus 4.7!

Ethan Mollick@emollick · 4月17日

I have found that asking for a sestina regularly triggers Opus 4.7's safety guardrails. The forbidden poetic form!

译我发现要求写一首六节诗经常会触发 Opus 4.7 的安全护栏。 被禁止的诗歌形式!

Ethan Mollick@emollick · 4月17日

I think the adaptive thinking requirement in Claude Opus 4.7 is bad in the ways that all AI effort routers are bad, but magnified by the fact that there is no manual override like in ChatGPT. It regularly decides that non-math/code stuff is "low effort" & produces worse results.

译我认为 Claude Opus 4.7 中的自适应思考需求具有所有 AI 努力度路由器的糟糕之处,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常将非数学/代码类内容判定为"低努力度",并产生更差的结果。

Epoch AI@EpochAIResearch · 4月17日

According to our latest polls, Claude usage in the US rose by over 40% amid increased attention last month, but remains far behind ChatGPT. Our point estimate would imply several million new weekly users in the United States.

译根据我们最新的调查,Claude 在美国的使用量在上月关注度上升期间增长了超过 40%,但仍远落后于 ChatGPT。 我们的点估计意味着在美国每周有数百万新用户。

Chubby♨️@kimmonismus · 4月17日

Anthropic increased rate limits for all subscribers? Permanent! That was not on my bingo card!

译Anthropic 提高了所有订阅者的速率限制? 永久性的! 这我可没料到! [引用 @bcherny]:Opus 4.7 使用了更多 thinking tokens,所以我们提高了所有订阅者的速率限制作为补偿。Enjoy!

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 4月17日

3 months.

译3个月。 [引用 @arankomatsuzaki]:Anthropic 近1/3的受访人员现在认为初级工程师和研究人员可能在3个月内被 Mythos 取代

Boris Cherny@bcherny · 4月17日

Opus 4.7 uses more thinking tokens, so we've increased rate limits for all subscribers to make up for it. Enjoy!

译Opus 4.7 使用了更多 thinking tokens,因此我们提高了所有订阅者的 rate limits 作为补偿。Enjoy!

宝玉@dotey · 4月17日

Claude Opus 4.7 比前代消耗更多思考 token,为此 Anthropic 已经给所有付费订阅用户永久上调了速率限制(rate limits),以抵消新模型更费额度带来的影响。 没看到额度上调的用户需要确认自己用的是 Opus 4.7,并且 Claude Code 已经升级到最新版本。

译Claude Opus 4.7 较上一代模型消耗更多思考 token,Anthropic 已为所有付费订阅用户永久上调速率限制(rate limits),以抵消新模型带来的额外额度消耗。用户若未看到额度上调,需确认当前选用的是 Opus 4.7 模型,且 Claude Code 已升级至最新版本。

Yuchen Jin@Yuchenj_UW · 4月17日

I bet GPT-5.5 / Spud will drop within 1 hour. Developer dilemma of the day: Claude Code or Codex.

译我赌 GPT-5.5 / Spud 将在一小时内发布。 今日开发者难题:Claude Code 还是 Codex。

Chubby♨️@kimmonismus · 4月17日

Hold on, something doesnt add up here. Opus 4.7 got much worse in needle in the haystack? need to dig into this

译等等,这里有些不对劲。Opus 4.7 在大海捞针测试中的表现差了很多?需要深挖一下

Ethan Mollick@emollick · 4月16日

Claude remains irreducibly Claude. If you know, you know. (The fact that models have distinct personalities that are consistent across generations is technically interesting, it also makes it very easy to use new releases when they come along, because they feel very similar).

译Claude 始终是那个独特的 Claude。懂的人自然懂。 (模型具有跨代保持一致的鲜明个性,这在技术层面很有趣,也让新版本很容易上手,因为它们感觉很相似)。

Yuchen Jin@Yuchenj_UW · 4月16日

My biggest issue with Opus 4.7 on Claude web: Only “Adaptive” or non-thinking. No way to force thinking mode. And it doesn’t even know Opus 4.6 exists, and I cannot force it to think and do web search mid conversation!

译我在 Claude 网页版上使用 Opus 4.7 的最大问题: 只有"Adaptive"或非思考模式。 无法强制开启思考模式。 而且它甚至不知道 Opus 4.6 的存在,而且我无法在对话中途强制它进行思考和网络搜索!

TestingCatalog News 🗞@testingcatalog · 4月16日45

Opus 4.7 on Claude for mobile uses “Adaptive thinking” instead of “Extended thinking” as before. > Switch to Opus 4.7 for your most ambitious work > Thinks only when needed Should we turn that off? 👀

译移动端的Claude中,Opus 4.7版本使用了“自适应思考”模式,而非之前的“扩展思考”。 > 切换至Opus 4.7来处理你最雄心勃勃的工作 > 仅在需要时思考 我们该关闭这个功能吗?👀

Deedy@deedydas · 4月16日

Opus 4.7 benchmarks colored by ranking. – Strong coding (SWE-Bench) bump – Strong Computer use bump – Strong visual reasoning (CharXiv) bump – Weak Terminal Bench bump – BrowseComp regression Slots in between 4.6 and Mythos. [Chart generated by 4.7]

译Opus 4.7 基准测试按排名着色。 – 编程(SWE-Bench)大幅提升 – 计算机使用大幅提升 – 视觉推理(CharXiv)大幅提升 – Terminal Bench 小幅提升 – BrowseComp 退步 介于 4.6 和 Mythos 之间。 [图表由 4.7 生成]

Claude@claudeai · 4月16日27

@ClaudeDevs is now on X.

译@ClaudeDevs 现已入驻 X。

Nathan Lambert@natolambert · 4月16日

The current pace of token-efficient reasoning improvements across minor Claude Opus/GPT model versions is pretty wild. All signs point to this continuing. 4.6 to 4.7 could've been presented as a fairly large model bump in the past with this plot.

译Claude Opus/GPT 模型小版本间 token 效率推理改进的当前速度相当惊人。所有迹象都表明这将继续。 4.6 到 4.7 在过去本可被视为一次相当大的模型升级。

Nathan Lambert@natolambert · 4月16日

Opus 4.7 has a new tokenizer. This means it's also a new base model. Glory days of pretraining still very much going.

译Opus 4.7 has a new tokenizer. 这意味着它也是一个新的 base model。 预训练的辉煌时期仍在继续。

ClaudeDevs@ClaudeDevs · 4月16日

For the developers building with Claude, a direct line from the team. Follow for changelogs, API releases, community updates, and deep dives.

译面向使用 Claude 开发的开发者,这是来自团队的直接沟通渠道。 关注以获取更新日志、API 发布、社区更新和深度解析。

ClaudeDevs@ClaudeDevs · 4月16日

✻ Flibbertigibetting…

译✻ 喋喋不休中…

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月18日
03:58
Claude@claudeai
49
Claude for Word 现已面向 Pro 和 Max 计划推出,可与 Opus 4.7 一同使用:https://claude.com/claude-for-word
AnthropicMCP/工具产品更新
02:24
ClaudeDevs@ClaudeDevs
我们正在增加对 Claude Code 使用情况的可见性。 运行 /usage 可查看详细分解:并行会话、子代理、缓存未命中、长上下文,以及优化各项的建议。
智能体Anthropic产品更新编码
01:44
Chubby♨️@kimmonismus
Anthropic自适应思考功能背后的战略考量

Anthropic推出adaptive thinking功能,允许Claude根据请求动态分配推理token。与OpenAI通过GPT-5在不同模型间路由不同,Anthropic选择让单一模型自行调节。此举背后是企业市场利润压力与严重算力短缺——OpenAI CRO在泄露备忘录中指出Anthropic误判了计算资源采购需求。该功能虽提升效率却导致质量不稳,显示Anthropic正优先服务企业客户而牺牲消费者体验,这一点在Opus 4.7发布中已显露无遗。

智能体Anthropic大佬观点推理
4月17日
23:48
Yuchen Jin@Yuchenj_UW
61
Figma 股价在 Claude Design 发布 20 分钟后。 疯狂。

Claude: Introducing Claude Design by Anthropic Labs: make prototypes, slides, and one-pagers by talking to Claude. Powered by Cl...

Anthropic现象/趋势行业动态
22:50
Ethan Mollick@emollick
我要称赞 Anthropic 行动迅速。Opus 4.7 Adaptive Thinking 现在更频繁地触发思考,包括昨天失败的任务。这也意味着它进行了更多网页搜索。 到目前为止,非编码任务的输出质量大幅提升。
Anthropic大佬观点推理
21:44
Chubby♨️@kimmonismus
我的整个 fy 页面都是人们在吐槽 opus 4.7 anthropic 这次搞砸了
Anthropic推理现象/趋势
19:44
Chubby♨️@kimmonismus
哦对了:也没人要什么路由器。我也不想要。 为什么 @AnthropicAI?至少给我们手动覆盖的选项,就像在 ChatGPT 里那样,让我们能自己选择。 抱歉我今天心情不好。但我就是不明白。Anthropic 本来走在正道上。Opus 成了我的首选模型,而最近的更新感觉很不对劲。 感觉就像你最好的工作伙伴一夜之间变成了傲慢的白痴。

Chubby♨️: ok wtf, i say it. give me back 4.6 what the heck is this sh*t. The more i use 4.7 the more annoyed i am. this is such a ...

Anthropic大佬观点
17:44
Chubby♨️@kimmonismus
关于 Opus 4.7 更新的情绪已经转变。如果让我猜,60% 的人对最新更新感到失望,40% 的人持积极态度。我自己仍犹豫不决。这是 Reddit 上某人的一个很好的总结。 你目前对此怎么看?
Anthropic大佬观点
17:44
Chubby♨️@kimmonismus
Opus 4.7 消耗的 token 数量约为原来的 1.3 倍。指令必须非常精确。许多人在抱怨这是一次"仓促发布"。在 Bullshit Benchmark 中,它的表现比 Opus 4.6 更差。反响非常两极分化。 Anthropic 这次可能帮了 OpenAI 一个大忙。Spud 预计下周发布。如果发布得当,它可能会盖过 Opus 的风头,让 ChatGPT 重回巅峰。 h/t @petergostev 提供基准测试和图片

Chubby♨️: The mood regarding the Opus 4.7 update has shifted. If I had to guess, I'd say 60% are disappointed with the latest upda...

AnthropicOpenAI推理评测/基准
17:44
Chubby♨️@kimmonismus
好吧,我直说了,WTF。把4.6还给我 这什么鬼东西。 越用4.7越烦。这发布得太仓促了。
Anthropic大佬观点
17:44
Chubby♨️@kimmonismus
用户怒批Claude Opus 4.7:如"不满员工",决意回退旧版

资深用户强烈批评Claude Opus 4.7相比4.6质量断崖式下跌,形容其如同"不满的员工",输出结果不可靠且需反复核查,完全丧失前代建立的信任。该用户决定放弃4.7并回退至4.6,质疑Anthropic此次发布过于仓促,并讽刺称这是OpenAI的最大胜利。

Chubby♨️: ok wtf, i say it. give me back 4.6 what the heck is this sh*t. The more i use 4.7 the more annoyed i am. this is such a ...

Anthropic大佬观点编码
11:50
Nathan Lambert@natolambert
最终自适应思考会起作用,人们会忘记这件事。但现在确实很糟。 【引用 @emollick】:我认为 Claude Opus 4.7 中的自适应思考要求很糟糕,就像所有 AI effort 路由器一样糟糕,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常判定非数学/代码类内容是"低 effort",然后生成更差的结果。

Ethan Mollick: I think the adaptive thinking requirement in Claude Opus 4.7 is bad in the ways that all AI effort routers are bad, but ...

Anthropic大佬观点推理
11:47
Yuchen Jin@Yuchenj_UW
全天在 Claude Code 中使用 Opus 4.7(max effort)。 真的,真的很好。不明白为什么有人要贬低它。 巨大飞跃: - 真正理解大型代码库 - 生成清晰、可读的架构图 - 更具代理性 确实遇到一次愚蠢的指令误读,不确定是系统限制还是智能的不均衡。 感觉像是一个全新的基础模型。
智能体Anthropic大佬观点编码
10:50
Ethan Mollick@emollick
Anthropic 告诉我他们正在寻找修复这个问题的方法,这很好(你也可以在该线程中看到一位 Claude 产品经理的回复)。 我认为 Claude Opus 4.7 的自适应思考要求在所有 AI 工作量路由机制糟糕的方面都很糟糕,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常将非数学/代码类内容判定为"低工作量"并产生更差的结果。

Ethan Mollick: I think the adaptive thinking requirement in Claude Opus 4.7 is bad in the ways that all AI effort routers are bad, but ...

Anthropic大佬观点推理
09:44
Rohan Paul@rohanpaul_ai
白宫部署Anthropic Mythos模型强化网络防御

白宫拟向主要联邦机构提供Anthropic Mythos模型,用于主动猎捕软件漏洞。该模型可在攻击者之前识别操作系统、浏览器及服务器中的安全缺陷,加速修复进程。此举体现美国政府将AI网络防御视为关键战略能力,既承认其不可替代的防御价值,又强调必须通过严格管控防止技术滥用。

Anthropic编码行业动态部署/工程
08:50
Nathan Lambert@natolambert
关于"Opus 4.7 是否是新的 base model?"的精彩讨论串 【引用 @JulieKallini】:1/ "New tokenizer" 并不意味着"new base model",而"new base model"也不是最简单的解释。存在简单得多的解释,同样符合 Anthropic 对 Opus 4.7 的公开描述。

Julie Kallini ✨: 1/ "New tokenizer" does not imply "new base model," and "new base model" is not the simplest explanation. There are much...

Anthropic大佬观点
08:00
宝玉@dotey
39
GitHub Copilot 里面 Opus 4.7 居然是 7.5x,Opus 4.6 是 3x
Anthropic编码行业动态
05:47
Thariq@trq212
如果你今天在 Opus 4.7 中看到更高的速率限制使用量,这是一个快速修复--希望你享受试用 【引用 @ClaudeDevs】:我们修复了一个 bug,Claude 订阅的速率限制在 Opus 4.7 的长上下文请求中没有正确调整。 我们已重置 5 小时和每周的速率限制。享受 Opus 4.7!

ClaudeDevs: We fixed a bug where rate limits on Claude subscriptions weren't properly adjusted for long context requests in Opus 4.7...

Anthropic产品更新编码
05:47
Thariq@trq212
我们听取了你们的反馈,正在努力让大家更容易跟进 Claude Code 的所有动态。 首先,我们推出了 @ClaudeDevs,这是获取 Claude Code 和 Claude 平台所有更新的官方频道。 【引用 @ClaudeDevs】:面向使用 Claude 开发的开发者,来自团队的直接沟通渠道。 关注以获取更新日志、API 发布、社区更新和深度解析。

ClaudeDevs: For the developers building with Claude, a direct line from the team. Follow for changelogs, API releases, community upd...

智能体Anthropic产品更新编码
04:28
宝玉@dotey
Claude Opus 4.7深度使用技巧与效率优化指南

Boris Cherny分享Claude Opus 4.7深度使用技巧,建议启用自动模式减少权限确认,利用回顾功能追踪长任务进度,通过专注模式隐藏中间步骤,并灵活配置努力程度(xhigh/max)平衡性能与成本。关键是通过/go技能建立自动测试、代码精简与PR提交的自我验证流程,确保长时间运行任务的输出质量,从而充分发挥模型主动性,提升复杂任务处理效率。

Boris Cherny: Dogfooding Opus 4.7 the last few weeks, I've been feeling incredibly productive. Sharing a few tips to get more out of 4...

智能体Anthropic教程/实践编码
04:28
宝玉@dotey
要想编程效果好,就得学会"黑话"😂

二一的笔记: Claude 也开始不说人话了 像什么「一句话锁死版本」、「最硬的那一刀」之类的表达,以前根本不会在 Claude 里出现 但现在 Opus 4.7 里到处都在拉这种屎 我真的想知道这种语料、这种训练结果都是怎么来的,到底为什么会和 Cod...

AnthropicOpenAI现象/趋势编码
04:02
ClaudeDevs@ClaudeDevs
我们修复了一个漏洞:在 Opus 4.7 中,Claude 订阅的速率限制未针对长上下文请求正确调整。 我们已重置 5 小时和每周的速率限制。尽情使用 Opus 4.7!
Anthropic产品更新
03:50
Ethan Mollick@emollick
我发现要求写一首六节诗经常会触发 Opus 4.7 的安全护栏。 被禁止的诗歌形式!
Anthropic安全/对齐
03:50
Ethan Mollick@emollick
我认为 Claude Opus 4.7 中的自适应思考需求具有所有 AI 努力度路由器的糟糕之处,但由于没有像 ChatGPT 那样的手动覆盖选项,问题被放大了。 它经常将非数学/代码类内容判定为"低努力度",并产生更差的结果。
Anthropic大佬观点推理
03:44
Epoch AI@EpochAIResearch
根据我们最新的调查,Claude 在美国的使用量在上月关注度上升期间增长了超过 40%,但仍远落后于 ChatGPT。 我们的点估计意味着在美国每周有数百万新用户。
智能体Anthropic现象/趋势
03:44
Chubby♨️@kimmonismus
Anthropic 提高了所有订阅者的速率限制? 永久性的! 这我可没料到! 【引用 @bcherny】:Opus 4.7 使用了更多 thinking tokens,所以我们提高了所有订阅者的速率限制作为补偿。Enjoy!

Boris Cherny: Opus 4.7 uses more thinking tokens, so we've increased rate limits for all subscribers to make up for it. Enjoy!

Anthropic产品更新推理
03:41
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
3个月。 【引用 @arankomatsuzaki】:Anthropic 近1/3的受访人员现在认为初级工程师和研究人员可能在3个月内被 Mythos 取代

Aran Komatsuzaki: Nearly 1/3 of surveyed people in Anthropic now think entry-level engineers and researchers are likely replaced by Mythos...

Anthropic现象/趋势编码
03:41
Boris Cherny@bcherny
Opus 4.7 使用了更多 thinking tokens,因此我们提高了所有订阅者的 rate limits 作为补偿。Enjoy!
Anthropic产品更新推理
03:26
宝玉@dotey
Claude Opus 4.7更耗token,Anthropic上调用户速率限制

Claude Opus 4.7 较上一代模型消耗更多思考 token,Anthropic 已为所有付费订阅用户永久上调速率限制(rate limits),以抵消新模型带来的额外额度消耗。用户若未看到额度上调,需确认当前选用的是 Opus 4.7 模型,且 Claude Code 已升级至最新版本。

Boris Cherny: Opus 4.7 uses more thinking tokens, so we've increased rate limits for all subscribers to make up for it. Enjoy!

Anthropic产品更新推理
01:47
Yuchen Jin@Yuchenj_UW
我赌 GPT-5.5 / Spud 将在一小时内发布。 今日开发者难题:Claude Code 还是 Codex。
智能体AnthropicOpenAI大佬观点
01:44
Chubby♨️@kimmonismus
等等,这里有些不对劲。Opus 4.7 在大海捞针测试中的表现差了很多?需要深挖一下
Anthropic评测/基准
4月16日
23:50
Ethan Mollick@emollick
Claude 始终是那个独特的 Claude。懂的人自然懂。 (模型具有跨代保持一致的鲜明个性,这在技术层面很有趣,也让新版本很容易上手,因为它们感觉很相似)。
Anthropic大佬观点
23:47
Yuchen Jin@Yuchenj_UW
我在 Claude 网页版上使用 Opus 4.7 的最大问题: 只有"Adaptive"或非思考模式。 无法强制开启思考模式。 而且它甚至不知道 Opus 4.6 的存在,而且我无法在对话中途强制它进行思考和网络搜索!
Anthropic产品更新推理
23:47
TestingCatalog News 🗞@testingcatalog
45
移动端的Claude中,Opus 4.7版本使用了"自适应思考"模式,而非之前的"扩展思考"。 > 切换至Opus 4.7来处理你最雄心勃勃的工作 > 仅在需要时思考 我们该关闭这个功能吗?👀

Seth Saler: @testingcatalog Interesting. "Adaptive" thinking for Opus 4.7 versus "Extended" thinking for Sonnet 4.6

Anthropic产品更新推理
23:44
Deedy@deedydas
Opus 4.7 基准测试按排名着色。 - 编程(SWE-Bench)大幅提升 - 计算机使用大幅提升 - 视觉推理(CharXiv)大幅提升 - Terminal Bench 小幅提升 - BrowseComp 退步 介于 4.6 和 Mythos 之间。 【图表由 4.7 生成】
智能体Anthropic推理编码
22:48
Claude@claudeai
27
@ClaudeDevs 现已入驻 X。
Anthropic行业动态
22:48
Nathan Lambert@natolambert
Claude Opus/GPT 模型小版本间 token 效率推理改进的当前速度相当惊人。所有迹象都表明这将继续。 4.6 到 4.7 在过去本可被视为一次相当大的模型升级。
AnthropicOpenAI推理现象/趋势
22:48
Nathan Lambert@natolambert
Opus 4.7 has a new tokenizer. 这意味着它也是一个新的 base model。 预训练的辉煌时期仍在继续。
Anthropic数据/训练模型发布
22:09
ClaudeDevs@ClaudeDevs
面向使用 Claude 开发的开发者,这是来自团队的直接沟通渠道。 关注以获取更新日志、API 发布、社区更新和深度解析。
Anthropic产品更新编码
22:08
ClaudeDevs@ClaudeDevs
✻ 喋喋不休中…

Claude: @ClaudeDevs is now on X.

Anthropic编码行业动态
‹ 上一页
1…4142434445…48
下一页 ›