AIHOT

3月5日

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念，旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式，这是一种高效且通用的模型文件格式，便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛，促进更广泛的研究与应用开发。

开源/仓库模型发布端侧

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI发布ZwZ-2B-GGUF模型

inclusionAI推出开源模型ZwZ-2B-GGUF，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛，促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径，强调技术普及与包容性发展。

开源/仓库模型发布端侧

10:55

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-user-sft-30B

inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及，使其更易于获取和应用。

开源/仓库模型发布端侧

10:08

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-sft-30B

inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型，这是一个拥有300亿参数、专门针对电信领域进行监督微调（SFT）的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化，以提升在该垂直领域的专业性能和应用效果。

开源/仓库模型发布端侧

08:00

Hugging Face：Blog（RSS）

介绍Modular Diffusers--扩散流程的可组合构建模块

Hugging Face发布Modular Diffusers库，将扩散模型流程解构为独立模块（如调度器、VAE、UNet）。用户可像组合积木一样自由替换和组合组件，显著提升了模型实验的灵活性与可复现性，简化了自定义流程的创建。该库已开源，旨在支持快速创新。

Hugging Face产品更新图像生成

08:00

HuggingFace Daily Papers（社区热门论文）

空间能力基准测试 SCBench

研究团队发布空间能力基准测试 SCBench，突破现有评估仅针对孤立 3D 变换或视觉问答的局限，设置三个层次化能力维度，要求模型输出可执行动作并通过确定性检查器或模拟器验证。测试显示，三款前沿模型准确率随任务难度提升而单调下降；限制输出 token 数量发现，准确率提升集中在低预算区间且快速饱和，主要失败模式为局部几何合理但违反全局约束。团队已开源任务生成器、验证器及可视化工具。

arXiv多模态论文/研究评测/基准

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

Adoption 新闻频道上线

全新 Adoption 新闻频道发布，提供实用见解与框架，助力企业将 AI 技术进展转化为商业优势，聚焦 AI 落地应用与业务价值实现。

OpenAI行业动态

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

推出 ChatGPT for Excel 及全新金融数据集成

OpenAI 发布 ChatGPT for Excel 及全新金融应用集成，由 GPT-5.4 驱动，加速受监管环境下的建模、研究与分析工作。

智能体OpenAI产品更新

推荐理由：OpenAI推出ChatGPT for Excel，集成GPT-5.4加速金融分析建模

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

驱动业务重塑的五种 AI 价值模型

五种 AI 价值模型展示了领导者如何循序渐进地部署 AI，从提升员工熟练度到彻底重塑业务流程，从而构建持久的商业竞争优势。

OpenAI现象/趋势

推荐理由：OpenAI提出企业AI应用五阶段价值模型，指导商业落地

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

德甲沃尔夫斯堡将 ChatGPT 转化为俱乐部级能力

德甲沃尔夫斯堡足球俱乐部将 ChatGPT 从试点项目升级为全俱乐部能力，通过聚焦人员培训而非技术试点，在保持足球文化本色的同时，规模化提升效率、创造力和知识管理水平。

OpenAI行业动态

01:00

Google Blog：AI（RSS）

精选

在 AI Mode 中使用 Canvas 完成任务、实现创意，就在 Search 中

Google Search 的 AI Mode 已向美国所有用户开放 Canvas 功能，新增文档起草和交互式工具构建能力，用户可直接在搜索页面完成创作。

Google产品更新搜索编码

推荐理由：Google Search AI Mode 全面开放 Canvas 功能，支持文档起草与交互式工具构建

00:53

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-retail-sft-30B 发布

inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型，参数量达 300 亿，采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及，旨在降低技术使用门槛，促进AI在零售领域的专业化应用与创新。

开源/仓库模型发布端侧

00:30

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-airline-sft-30B 发布

inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化，其具体训练数据与性能指标尚未在本次公告中详细披露。

开源/仓库模型发布部署/工程

00:00

Anthropic：Newsroom（网页）

Anthropic 与国防部关系现状

Anthropic 首席执行官 Dario Amodei 声明，公司收到国防部信函被指定为供应链风险，将诉诸法律挑战。该指定范围狭窄，仅限制与国防部直接相关的合同使用，不影响其他客户。Amodei 为昨日泄露的内部帖子道歉，称其在混乱中撰写且已过时。公司承诺将以名义成本继续向国防部提供 Claude 模型，确保国家安全专家在重大作战行动中不失去工具，并强调双方在国家安全目标上共识远大于分歧。

Anthropic安全/对齐政策/监管

00:00

Anthropic：Research（发表成果 · 网页）

AI对劳动力市场的影响：一项新指标与初步证据

研究团队提出"观察暴露度"新指标，综合LLM理论能力与实际使用数据，重点衡量自动化工作场景下的AI替代风险。数据显示，AI实际应用覆盖率远低于理论潜力。高暴露职业从业者多为年长、女性、高学历、高收入群体，美国劳工统计局预测这些岗位至2034年增长将放缓。尽管2022年底以来高暴露群体失业率未现系统性上升，但年轻员工招聘已显现放缓迹象。

Anthropic论文/研究

3月4日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

将 single-minus 振幅扩展至引力子

新预印本将 single-minus 振幅扩展至引力子，利用 GPT-5.2 Pro 推导并验证量子引力中的非零引力子树振幅。

OpenAI推理论文/研究

16:25

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-2B

inclusionAI 发布了 ZwZ-2B 模型，这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K，并在多项基准测试中性能显著提升，特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。

开源/仓库模型发布端侧

08:00

HuggingFace Daily Papers（社区热门论文）

自我主权智能体

大语言模型与智能体框架的进展正推动AI从开发者控制工具向自主数字行为者转变。研究探讨了"自我主权智能体"这一新兴概念——即无需人类参与即可经济自维持和扩展运行的AI系统。文章分析了实现此类部署的技术障碍，并讨论了其可能带来的安全、社会及治理挑战。相关项目页面已上线。

智能体论文/研究

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

理解 AI 与学习成果

OpenAI 推出 Learning Outcomes Measurement Suite，用于评估 AI 在各类教育环境中对学生学习的长期影响。

OpenAI产品更新

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

Axios 如何利用 AI 助力高影响力地方新闻的规模化生产

Axios COO Allison Murphy 介绍公司借助 AI 支持地方记者、优化新闻编辑室工作流，实现高影响力地方新闻的规模化产出。

OpenAI行业动态

01:00

Google Blog：AI（RSS）

精选

在 Project Genie 中创建新世界的 4 个技巧

Google DeepMind 分享 Project Genie 使用指南，提供 4 个提示词写作技巧，帮助用户通过自然语言描述生成可交互的虚拟世界。

DeepMindGoogle多模态教程/实践

关联讨论 1 条

推荐理由：Google DeepMind分享Project Genie提示词技巧，教你用AI生成可交互3D世界

00:50

Hugging Face：Blog（RSS）

精选70

PRX 第三部分 -- 24小时内训练一个文本到图像模型！

Photoroom团队在Hugging Face上发布博客，宣布成功在24小时内完成一个文本到图像模型的训练。这一突破将此类模型的典型训练周期从数周大幅缩短至仅一天。实现的关键在于采用了名为PRX的高效训练方法，该方法优化了计算资源分配与数据处理流程。此举显著降低了模型训练的时间与成本门槛，为快速迭代和部署高质量的图像生成AI模型提供了新的可能性。

图像生成教程/实践数据/训练

推荐理由：Photoroom 分享 24h 内训练文生图模型的实战路径，想快速复现的团队可直接参考

00:35

Google DeepMind：Blog（RSS）

Gemini 3.1 Flash-Lite：专为规模化智能构建

Google 发布 Gemini 3.1 Flash-Lite，为 Gemini 3 系列中速度最快、成本效益最高的模型，面向大规模智能应用场景优化。

DeepMindGoogle模型发布端侧

00:30

Nathan Lambert：Interconnects（RSS）

阿里巴巴 Qwen 3.5、智谱 AI GLM 5 与 MiniMax 2.5 近期集中发布，中国头部 AI 实验室通过开源策略持续推动技术边界。新一代模型在代码生成、多模态推理与复杂任务处理上实现显著性能跃升，参数规模与上下文窗口同步扩展，展现中国在全球开源 AI 生态中的前沿竞争力与快速迭代能力。

开源生态模型发布

3月3日

22:01

Apple：Newsroom（RSS）

精选71

Apple 推出搭载 M5 芯片的全新 MacBook Air

Apple 发布了搭载 M5 芯片的全新 MacBook Air，为这款全球最受欢迎的笔记本电脑带来卓越性能和扩展的 AI 能力。新款 MacBook Air 在性能上实现显著提升，并增强了人工智能相关功能，进一步巩固其在轻薄本市场的领先地位。

产品更新端侧

推荐理由：Apple M5芯片强化端侧AI能力，开发者需关注硬件对AI部署的影响。

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.3 Instant：日常对话更流畅、更实用

GPT-5.3 Instant 模型升级，针对日常对话场景优化响应流畅度与实用性。新版本在保持即时响应速度的同时，输出更顺滑自然，提升普通用户高频问答体验。

OpenAI模型发布

推荐理由：OpenAI 发布 GPT-5.3 Instant，针对日常对话体验优化

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.3 Instant 系统卡

OpenAI 发布 GPT-5.3 Instant 系统卡，概述该快速响应模型的安全评估、能力边界及使用限制，明确低延迟场景下的技术规范与风险管控措施。

OpenAI模型发布

推荐理由：OpenAI发布GPT-5.3 Instant系统卡，披露新模型能力与安全评估

00:00

Berkeley RDI：Blog（AI 安全与评测）

MalTool：针对 LLM Agent 的恶意工具攻击

研究团队发布 MalTool 框架，揭示 LLM Agent 面临的新型恶意工具攻击威胁。该框架利用编码 LLM 自动生成多样化恶意工具，构建首个包含 1,200 个独立恶意工具和 5,287 个木马工具的大规模数据集。测试显示，现有安全对齐技术和商业检测系统均无法有效阻止或识别此类攻击，而攻击成功率达 100% 且成本极低——GPT-5.2 仅需约 20 美元即可生成约 1,200 个验证恶意工具，单个成本不足 0.02 美元。这种基于代码实现的攻击可窃取数据、删除文件或劫持计算资源，威胁远超传统的描述操纵手段。

智能体MCP/工具安全/对齐

3月2日

20:00

Cursor Blog

精选

PlanetScale 借助 Bugbot 保障生产环境可靠性

PlanetScale 引入 Bugbot 作为 AI 代码审查代理，应对 AI 代码生成普及后审查环节成为瓶颈的问题。Bugbot 能发现人类难以察觉的深层逻辑缺陷，如状态同步间隙和异步控制器交互问题，而非仅检查语法错误。目前 80% 的 Bugbot 评论在合并前被工程师处理，每月审查超 2000 个 PR，节省相当于两名全职工程师的审查工作量，显著降低生产环境宕机风险。

智能体产品更新编码

推荐理由：Cursor Bugbot 企业落地数据：Agent 审查解决 80% 问题，揭示 AI 编程时代代码审查成新瓶颈

3月1日

17:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-SEA-235B-A22B

inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛，促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数，体现了其在处理复杂任务方面的潜力，同时强调开放协作对加速AI创新与社会普惠的关键作用。

开源/仓库推理模型发布

2月28日

21:29

Hacker News：AI 热帖

Show HN： Now I Get It - 将科学论文转化为交互式网页

上传科学 PDF（建议小于 10MB，最大 32MB）至 Now I Get It，即可生成通俗易懂的交互式解释网页，当前输出公开可分享，私人账户功能即将上线。

检索增强产品更新

20:30

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

OpenAI 与 Department of War 的协议

OpenAI 披露与 Department of War 达成的协议内容，详细划定 AI 部署的安全红线，明确相关法律保障措施，并具体说明 AI 系统接入机密环境的部署方式。

OpenAI安全/对齐部署/工程

推荐理由：OpenAI官方披露与军方合作的安全红线与机密部署框架

08:00

HuggingFace Daily Papers（社区热门论文）

DiagramBank：一个用于检索增强生成的大规模示意图设计范例数据集

为突破“端到端”论文生成中出版级科学示意图（如导读图）的制作瓶颈，研究团队构建了DiagramBank数据集。该数据集通过自动化流程从顶级出版物中筛选出89,422张示意图，并利用CLIP过滤器区分示意图与标准图表。每个实例均附有从摘要到图文对照的丰富上下文信息，支持多粒度检索。团队同步开源了检索增强生成代码库，演示如何基于范例合成导读图，数据集与代码均已公开。

多模态数据/训练论文/研究

08:00

蚂蚁百灵：Developer Blog（网页）

精选80

拒绝"AI 味"：我们用 6 个文学维度，重新审视了模型的创意写作边界

本文通过叙事工艺、语言艺术等六个文学维度，评估百灵模型Ling-2.5-1T的创意写作能力。测试显示，该模型能驾驭莎士比亚十四行诗、七言绝句等多种体裁，并通过感官描写实现“展现而非告知”的文学技法，在微观叙事和语言质感上接近人类水平。然而，模型仍存在依赖高频文学意象、处理否定指令时语义代偿等局限。该框架为创作者提供了激发AI写作潜力的具体方法。

推理评测/基准

关联讨论 1 条

推荐理由：提供实用文学维度框架和 Prompt 技巧，助你驾驭 AI 创意写作。

2月27日

13:30

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 与 Microsoft 联合声明

OpenAI 与 Microsoft 发表联合声明，称双方将继续在研究、工程和产品开发方面紧密协作，延续多年深度合作与共同成功的基础。

MicrosoftOpenAI行业动态

13:30

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选