I had Opus 4.8 in Claude Code write a sophisticated, if minor, academic paper from a archive of hundreds of de-identifie...
Wow. Anthropic secures a massive post-money valuation of $965B after raising $65 B. Just three months earlier, in Februa...
关联讨论 14 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)Anthropic:Newsroom(网页)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)X:阿易 AI Notes (@AYi_AInotes)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)消费级AI市场格局发生显著变化。ChatGPT在全球用户中的份额从半年前的80%下滑至60%。同期,Gemini用户数增至约为ChatGPT的50%,Claude份额从约3%增长至20%。在网站流量方面,Claude是上季度增长最快的百强网站。活跃用户数估算显示,ChatGPT周活跃用户约9亿,月活跃用户可能达15亿;Gemini月活跃用户为9亿;Claude月活跃用户约为2.5-3亿。在印度、巴西等非英语国家,Gemini用户数已接近ChatGPT的65-70%,而Claude在中国增长尤为显著。市场形态正从“赢家通吃”向类似云计算或电信市场的三方垄断演变。
Another major problem, this time in additive combinatorics, has fallen, this time to humans rather than AI, but using me...
Many developers have suspected for months that GPT-5.5 outperforms Claude Sonnet for coding. But SWE-Bench reported near...
Every bug in @ChatGPTapp is getting fixed With the help of codex (and the rest of the lovely team and their codexes) alo...
Every公司CEO Dan Shipper指出,全员使用Codex和Claude Code的公司员工数反而翻倍,揭示了AI增强工作而非替代人力的悖论。他设计的“高级工程师基准测试”显示,人类得分85-90分,而AI模型平均仅约30分,GPT-5.5最高也仅达62分。核心问题在于AI能解决已定义的问题,却无法主动识别问题需要被重新定义。他预测未来工作将分裂为两种形态:一是公司共用由专人维护的超级AI智能体;二是Codex或Claude Code等AI工具成为新的工作操作系统。他认为这不会导致大规模失业,而是要求每个人都学会“驾驭模型”,将AI用在真实工作场景中。
文本指出AI领域存在核心张力。Anthropic联合创始人Chris Olah主张前沿AI实验室需要严肃的外部道德审查,因其激励可能与“做正确的事”冲突。与此同时,Anthropic CEO Dario Amodei的叙事正从“AI可能消灭大量白领工作”转向更市场友好的生产力提升与工作转型论述(如杰文斯悖论)。然而,Yale Budget Lab的跟踪数据显示,自ChatGPT发布以来,美国劳动力市场职业构成无明显变化,AI暴露岗位的失业并未加速。因此,当前AI能力曲线与实际就业数据之间的差距可能比以往更大,这构成了讨论的起点。
Dario Amodei predicted last year that AI would eliminate 50% of entry-level white-collar jobs within years. Unemployment...
Lenny发起的“梦想加入的公司Top3”调查显示,Anthropic和OpenAI位列其中,与SpaceX一同成为最受向往的雇主。这反映了科技与AI领域顶尖公司的吸引力。推文进一步讨论,这三家未上市的头部公司是否有可能在今年内上市,并均达到万亿美元市值。引用推文提供了该调查的原始问题,即询问人们当前最向往的三家工作公司。
What are your top 3 dream companies to work for right now?
OpenAI推出Private MCP Tunnels,允许企业将MCP服务器完全保留在内网。ChatGPT、Codex和Responses API仅通过单向HTTPS outbound安全连接,无需开放入站端口或暴露永久API Key。同时推出的Workload Identity Federation和大幅增强的Admin API,提供了支出预警、模型白名单、数据保留策略等企业级管控功能。这些更新旨在打通企业采用AI时“数据不能出墙”与“安全审查漫长”的核心障碍,将OpenAI平台升级为企业级基础设施。
Private MCP servers 🤝 OpenAI products Your team can keep MCP servers inside your network while ChatGPT, Codex, and the ...
At @ThriveHoldings, we built a product with @OpenAI to automate tax prep for the 30+ accounting firms we own across the ...
GPT 5.5 found a 27-year-old RCE introduced in April of 1999. I've triple-checked the flow and commit history, it's real....
Private MCP servers 🤝 OpenAI products Your team can keep MCP servers inside your network while ChatGPT, Codex, and the ...
The wild part of Codex sub-agents isn't that one AI can use Chrome. It's watching a single prompt turn into seven browse...
To simplify our Codex compute fleet management, we will be sunsetting GPT-5.2 and GPT-5.3-Codex in Codex on June 2nd whe...
Repo Prompt 这个工具挺实用的,它可以把你整个Repo的代码拼成一个XML文本,方便你发给像Gemini 2、Claude 3.5、o1 pro这样支持长上下文的模型。 当然你也可以只选择部分文件,目前只支持 Mac https:...
一位用户展示了一款从AliExpress购买的廉价MP3播放器,它存在蓝牙音频卡顿和菜单操作不便的问题。用户将设备芯片的照片提供给OpenAI的Codex进行分析。Codex随后引导用户通过Mac设备提取了播放器的完整固件文件。Codex分析了该固件的机器代码,定位到导致问题的具体代码段,并生成了一个修复了蓝牙问题并优化了菜单导航的定制固件。用户将此固件刷写回设备后,问题得到解决。此案例具体体现了AI工具在处理底层硬件调试与定制化开发任务中的潜力。
ぼくの着想の限界=Codexの限界。 それくらいまーじでCodexでなんでもできる。 これアリエクで買ったやっすいMP3プレイヤー。 でもBluetoothの音飛びと操作性が悪くて放置してたんですよ。 だけど昨日急にシャワーしている時にエウ...
OpenAI 为 ChatGPT 和 Codex 推出 Secure MCP Tunnel 功能,允许它们安全调用部署在企业内网的 MCP 服务器,核心目标是防止数据泄露。其原理是:企业在内网部署 tunnel-client 程序,该程序主动向 OpenAI 建立一条加密的 HTTPS 出站通道。当模型需要调用内部 MCP 服务时,请求通过此隧道安全转发至内网客户端,再由客户端分发给本地服务器,结果沿原路返回。此举补全了 MCP 协议在安全访问私有工具方面的缺口,是 OpenAI 完善企业级应用的关键一步,技术思路类似反向隧道,但作为原生功能与组织权限体系打通。
OpenAI的控股非营利机构OpenAI Foundation承诺投入2.5亿美元,用于研究和缓解能替代付费任务的AI系统对就业市场造成的冲击。资金将支持三个方向:通过独立研究衡量AI的经济影响、为面临近期冲击的工人与社区提供支持(如职业过渡、保险机制、再培训),以及探索更广泛分享AI经济收益的长期途径。该基金会因拥有OpenAI营利部门26%的股份而地位特殊,按OpenAI估值1万亿美元计算,该股份价值可达2600亿美元。
Cognition AI完成超10亿美元融资,投前估值达260亿美元。其年化收入从3700万美元增长至4.92亿美元,客户包括Goldman Sachs和Mercedes-Benz,标志着其产品Devin正进入生产环境。Devin定位为自主初级工程师,能通过多步骤工作流规划、测试和部署代码。Cognition采用自有模型与OpenAI、Anthropic相结合的模型无关技术路线,而非依赖单一模型。此外,该公司于去年7月同意收购编程初创公司Windsurf的剩余资产。
OpenAI与Thrive合作开发了一款自我改进的税务AI智能体,已在30多家会计事务所处理约7,000份报税表。该智能体将准备时间缩短约三分之一,吞吐量提升约50%,并达到高达97%的准确率。技术难点在于处理混乱的K-1s、租赁计划等非结构化文件,以及跨文档的数值匹配。系统为每个操作记录完整追踪链,并利用会计师的重复修正作为评估目标,驱动Codex生成可测试的代码修复任务,形成自我改进闭环。
You can now transcribe meetings in real time using Codex and ask Codex questions about meetings as they're happening! I ...