5月23日

00:21

Yuchen Jin@Yuchenj_UW

哇。DeepSeek给出了高达75%的折扣。要么他们做了重大的推理优化，要么华为芯片就是这么便宜？更多开源AI模型，更好的token经济。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

DeepSeek 开源生态推理行业动态

00:16

HuggingFace Daily Papers（社区热门论文）

通过自我调节的模拟规划实现高效智能体推理

针对当前自适应计算策略导致的推理冗长与低效问题，本文提出将智能体决策分解为模拟推理、自我调节和反应执行三系统。研究开发了SR²AM模型，其两个版本v0.1-8B和v1.0-30B分别通过提示多模块系统和重建训练推理LLM的结构化计划实现。在多项基准测试中，v1.0-30B以25.8%-95.3%更少的推理token，达到了与更大参数量系统相当的性能。引入强化学习后，模型规划深度提升22.8%，而频率仅增2.0%，表明其学会了更前瞻性的规划。这为构建高效、自适应的智能体提供了新范式。

智能体推理论文/研究部署/工程

5月22日

21:19

向阳乔木@vista8

语文作业拥抱AI：老师布置提问式写作新任务

一位家长分享，孩子的语文老师布置了一项创新作业：要求学生通过向AI提问来完成作文。家长认为，这种形式能有效锻炼学生的提问技巧与AI辅助创作能力。为此，他提前准备了Claude Sonnet 4.6、ChatGPT 5.5、Gemini 3.5 Flash等主流AI模型，供孩子届时根据喜好选择使用。

其他推理

19:20

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已登陆Model Studio，限时五折（5月22日至6月22日）！ 100万上下文窗口。专为在长上下文智能体推理中，无缝处理和保留大规模企业数据流而构建。 🚀 立即体验：https://int.alibabacloud.com/m/1000413314/

推理模型发布

关联讨论 9 条

18:19

Qwen@Alibaba_Qwen

近期一项针对前沿AI模型在真实智能体任务上的测试显示，Qwen 3.7-Max在效果与成本方面全面领先。该任务要求模型自主编写并迭代优化一个能自我训练的Tetris机器人程序。在10轮自我改进中，Qwen 3.7-Max仅花费1.32美元，便将机器人性能提升了56%。相比之下，Claude Opus 4.7花费12.15美元提升了28%，GPT-5.5花费2.85美元提升了7%。结果表明，在需要长时间自主推理、代码阅读与迭代的复杂智能体循环场景中，Qwen Max具备极强的成本效益比与自我改进能力。

atomic.chat: Qwen 3.7-max beats Opus 4.7 and GPT-5.5 We tested three frontier models on a real agentic task: write a Tetris bot that ...

智能体推理评测/基准

关联讨论 9 条

18:09

IT之家（RSS）

英伟达黄仁勋：LPX 等 SRAM AI 芯片将长期属于利基市场

英伟达CEO黄仁勋在FY2027Q1财报电话会议上表示，基于SRAM的AI推理解码芯片（如LPX）将长期处于利基市场，GPU仍为主流。他指出，LPX专为低延迟和高词元速率设计，但吞吐量和容量较低，适合软件编程中的上下文处理，却在代理式任务中表现有限。其最佳应用场景是高定价、高词元速率的AI服务，而这类服务目前在整体AI市场中占比不足20%，未来可能增至20%，因此潜在客户群体相对较少。

大佬观点推理

18:09

IT之家（RSS）

AMD CEO 苏姿丰：中国内地占公司营收 20%，是非常重要的市场

AMD CEO 苏姿丰表示，中国内地市场约占公司营收的20%，是一个极其重要的市场。她预测，由于AI推理和智能体AI的加速发展，过去增长缓慢的CPU市场未来五年将迎来强劲增长，年增长率预计将超过35%。此外，AMD在大中华区拥有超4000名工程师，并在多地布局了AI卓越中心。公司近期也在上海首次举办了AI开发者大会，显示了对中国市场的持续投入与承诺。

推理行业动态

18:09

IT之家（RSS）

精选70

网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中，多模态模型（27B参数）专注于教育场景，在处理高难度视觉数理问题上达到行业顶尖水平，纯文本中文数理难题准确率为81.4%。该模型通过思维链优化，将输出长度压缩43.2%，有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆，3秒内即可完成零样本复制，准确度超97%，并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由：有道把垂直教育的多模态模型全量开源，27B参数在视觉数理上做到SOTA，还把思维链压缩了43%，推理成本实打实下降，做教育应用的可以拿来做二次开发；TTS的跨语种情感克隆也实用，3秒克隆14种语言。

16:20

Alibaba Cloud@alibaba_cloud

基础模型论坛 | Qwen Conference 2026 解码核心智能的下一次飞跃。加入新加坡金沙会展中心的会议，探索预训练突破、推理逻辑与未来模型路线图。 🚀 立即预约席位：https://click.qwencloud.com/m/20000000190/

推理行业动态

16:09

IT之家（RSS）

AMD 苏姿丰：CPU 目前供应紧张，未来 5 年市场年复增长率超 35%

推理行业动态