inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念,旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式,这是一种高效且通用的模型文件格式,便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛,促进更广泛的研究与应用开发。
inclusionAI推出开源模型ZwZ-2B-GGUF,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛,促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径,强调技术普及与包容性发展。
inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及,使其更易于获取和应用。
inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型,这是一个拥有300亿参数、专门针对电信领域进行监督微调(SFT)的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化,以提升在该垂直领域的专业性能和应用效果。
Hugging Face发布Modular Diffusers库,将扩散模型流程解构为独立模块(如调度器、VAE、UNet)。用户可像组合积木一样自由替换和组合组件,显著提升了模型实验的灵活性与可复现性,简化了自定义流程的创建。该库已开源,旨在支持快速创新。
研究团队发布空间能力基准测试 SCBench,突破现有评估仅针对孤立 3D 变换或视觉问答的局限,设置三个层次化能力维度,要求模型输出可执行动作并通过确定性检查器或模拟器验证。测试显示,三款前沿模型准确率随任务难度提升而单调下降;限制输出 token 数量发现,准确率提升集中在低预算区间且快速饱和,主要失败模式为局部几何合理但违反全局约束。团队已开源任务生成器、验证器及可视化工具。
全新 Adoption 新闻频道发布,提供实用见解与框架,助力企业将 AI 技术进展转化为商业优势,聚焦 AI 落地应用与业务价值实现。
OpenAI 发布 ChatGPT for Excel 及全新金融应用集成,由 GPT-5.4 驱动,加速受监管环境下的建模、研究与分析工作。
五种 AI 价值模型展示了领导者如何循序渐进地部署 AI,从提升员工熟练度到彻底重塑业务流程,从而构建持久的商业竞争优势。
德甲沃尔夫斯堡足球俱乐部将 ChatGPT 从试点项目升级为全俱乐部能力,通过聚焦人员培训而非技术试点,在保持足球文化本色的同时,规模化提升效率、创造力和知识管理水平。
Google Search 的 AI Mode 已向美国所有用户开放 Canvas 功能,新增文档起草和交互式工具构建能力,用户可直接在搜索页面完成创作。
inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型,参数量达 300 亿,采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及,旨在降低技术使用门槛,促进AI在零售领域的专业化应用与创新。
inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化,其具体训练数据与性能指标尚未在本次公告中详细披露。
Anthropic 首席执行官 Dario Amodei 声明,公司收到国防部信函被指定为供应链风险,将诉诸法律挑战。该指定范围狭窄,仅限制与国防部直接相关的合同使用,不影响其他客户。Amodei 为昨日泄露的内部帖子道歉,称其在混乱中撰写且已过时。公司承诺将以名义成本继续向国防部提供 Claude 模型,确保国家安全专家在重大作战行动中不失去工具,并强调双方在国家安全目标上共识远大于分歧。
研究团队提出"观察暴露度"新指标,综合LLM理论能力与实际使用数据,重点衡量自动化工作场景下的AI替代风险。数据显示,AI实际应用覆盖率远低于理论潜力。高暴露职业从业者多为年长、女性、高学历、高收入群体,美国劳工统计局预测这些岗位至2034年增长将放缓。尽管2022年底以来高暴露群体失业率未现系统性上升,但年轻员工招聘已显现放缓迹象。
新预印本将 single-minus 振幅扩展至引力子,利用 GPT-5.2 Pro 推导并验证量子引力中的非零引力子树振幅。
inclusionAI 发布了 ZwZ-2B 模型,这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K,并在多项基准测试中性能显著提升,特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。
大语言模型与智能体框架的进展正推动AI从开发者控制工具向自主数字行为者转变。研究探讨了"自我主权智能体"这一新兴概念——即无需人类参与即可经济自维持和扩展运行的AI系统。文章分析了实现此类部署的技术障碍,并讨论了其可能带来的安全、社会及治理挑战。相关项目页面已上线。
OpenAI 推出 Learning Outcomes Measurement Suite,用于评估 AI 在各类教育环境中对学生学习的长期影响。
Axios COO Allison Murphy 介绍公司借助 AI 支持地方记者、优化新闻编辑室工作流,实现高影响力地方新闻的规模化产出。
Google DeepMind 分享 Project Genie 使用指南,提供 4 个提示词写作技巧,帮助用户通过自然语言描述生成可交互的虚拟世界。
关联讨论 1 条Google DeepMind:Blog(RSS)Photoroom团队在Hugging Face上发布博客,宣布成功在24小时内完成一个文本到图像模型的训练。这一突破将此类模型的典型训练周期从数周大幅缩短至仅一天。实现的关键在于采用了名为PRX的高效训练方法,该方法优化了计算资源分配与数据处理流程。此举显著降低了模型训练的时间与成本门槛,为快速迭代和部署高质量的图像生成AI模型提供了新的可能性。
Google 发布 Gemini 3.1 Flash-Lite,为 Gemini 3 系列中速度最快、成本效益最高的模型,面向大规模智能应用场景优化。
阿里巴巴 Qwen 3.5、智谱 AI GLM 5 与 MiniMax 2.5 近期集中发布,中国头部 AI 实验室通过开源策略持续推动技术边界。新一代模型在代码生成、多模态推理与复杂任务处理上实现显著性能跃升,参数规模与上下文窗口同步扩展,展现中国在全球开源 AI 生态中的前沿竞争力与快速迭代能力。
Apple 发布了搭载 M5 芯片的全新 MacBook Air,为这款全球最受欢迎的笔记本电脑带来卓越性能和扩展的 AI 能力。新款 MacBook Air 在性能上实现显著提升,并增强了人工智能相关功能,进一步巩固其在轻薄本市场的领先地位。
GPT-5.3 Instant 模型升级,针对日常对话场景优化响应流畅度与实用性。新版本在保持即时响应速度的同时,输出更顺滑自然,提升普通用户高频问答体验。
OpenAI 发布 GPT-5.3 Instant 系统卡,概述该快速响应模型的安全评估、能力边界及使用限制,明确低延迟场景下的技术规范与风险管控措施。
研究团队发布 MalTool 框架,揭示 LLM Agent 面临的新型恶意工具攻击威胁。该框架利用编码 LLM 自动生成多样化恶意工具,构建首个包含 1,200 个独立恶意工具和 5,287 个木马工具的大规模数据集。测试显示,现有安全对齐技术和商业检测系统均无法有效阻止或识别此类攻击,而攻击成功率达 100% 且成本极低——GPT-5.2 仅需约 20 美元即可生成约 1,200 个验证恶意工具,单个成本不足 0.02 美元。这种基于代码实现的攻击可窃取数据、删除文件或劫持计算资源,威胁远超传统的描述操纵手段。
PlanetScale 引入 Bugbot 作为 AI 代码审查代理,应对 AI 代码生成普及后审查环节成为瓶颈的问题。Bugbot 能发现人类难以察觉的深层逻辑缺陷,如状态同步间隙和异步控制器交互问题,而非仅检查语法错误。目前 80% 的 Bugbot 评论在合并前被工程师处理,每月审查超 2000 个 PR,节省相当于两名全职工程师的审查工作量,显著降低生产环境宕机风险。
inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型,致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛,促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数,体现了其在处理复杂任务方面的潜力,同时强调开放协作对加速AI创新与社会普惠的关键作用。
上传科学 PDF(建议小于 10MB,最大 32MB)至 Now I Get It,即可生成通俗易懂的交互式解释网页,当前输出公开可分享,私人账户功能即将上线。
OpenAI 披露与 Department of War 达成的协议内容,详细划定 AI 部署的安全红线,明确相关法律保障措施,并具体说明 AI 系统接入机密环境的部署方式。
为突破“端到端”论文生成中出版级科学示意图(如导读图)的制作瓶颈,研究团队构建了DiagramBank数据集。该数据集通过自动化流程从顶级出版物中筛选出89,422张示意图,并利用CLIP过滤器区分示意图与标准图表。每个实例均附有从摘要到图文对照的丰富上下文信息,支持多粒度检索。团队同步开源了检索增强生成代码库,演示如何基于范例合成导读图,数据集与代码均已公开。
本文通过叙事工艺、语言艺术等六个文学维度,评估百灵模型Ling-2.5-1T的创意写作能力。测试显示,该模型能驾驭莎士比亚十四行诗、七言绝句等多种体裁,并通过感官描写实现“展现而非告知”的文学技法,在微观叙事和语言质感上接近人类水平。然而,模型仍存在依赖高频文学意象、处理否定指令时语义代偿等局限。该框架为创作者提供了激发AI写作潜力的具体方法。
关联讨论 1 条蚂蚁百灵:Developer Blog(网页)OpenAI 与 Microsoft 发表联合声明,称双方将继续在研究、工程和产品开发方面紧密协作,延续多年深度合作与共同成功的基础。
宣布获得 1100 亿美元新投资,投前估值达 7300 亿美元。其中 SoftBank、NVIDIA 各出资 300 亿美元,Amazon 出资 500 亿美元。
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI 与 Amazon 达成战略合作,将 Frontier 平台引入 AWS,涵盖 AI 基础设施、定制模型及企业 AI 智能体。
Amazon Bedrock 发布 Stateful Runtime for Agents,为 OpenAI 驱动的多步骤 AI 工作流提供持久化编排、记忆能力和安全执行环境。
OpenAI 发布心理健康安全工作最新进展,包括推出家长控制与可信联系人功能、优化用户危机检测机制,同时披露了相关诉讼案件的最新动态。
Rooms 功能今日正式从网站移除。这一实验性尝试因试图同时解决过多问题而表现不佳,暴露了当前基础设施的不足,但为团队提供了关于社区需求的宝贵认知。