OpenRouter现已为平台上的所有模型提供PDF文件处理支持。这项通用功能意味着用户在使用任何模型时,都能直接上传和分析PDF文档。此举消除了以往特定模型才能处理PDF的限制,显著扩展了工具的应用场景,便于用户进行文档总结、信息提取或内容问答等一系列任务。
OpenRouter平台上线三项核心更新。分析功能推出更智能的交互式图表,支持深入钻取数据。预览体验得到优化,现已支持内联SVG渲染,展示更流畅。平台新增实时用量统计功能,为用户提供即时的成本消耗可见性,便于监控API使用开销。这些改进旨在提升用户在模型使用分析与费用管理方面的操作体验。
团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略,具体性能指标与架构细节未公开。此举旨在保持技术优势,避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展,但核心改进方向与具体应用场景仍有待后续披露。
公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变,旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代,具体性能指标和细节尚未完全公开,但明确指向了增强模型的隐蔽性和适应性。
Anthropic为其AI模型服务推出“零令牌保险”功能,覆盖包括Claude 3和GPT-4在内的所有主流模型。该功能可自动检测并补偿完全无意义、空白或严重错误的响应,用户无需为这些无效输出消耗令牌额度。系统通过实时分析响应结构与语义完整性实现自动判责,补偿令牌将在24小时内返还至账户。早期测试显示,该机制使GPT-4的无效响应计费率降低67%,Claude 3系列模型的空转计费投诉下降82%。
首个深度研究工具已通过 OpenRouter API 正式上线,其 API 响应中直接提供完整的引用来源。该工具标志着 OpenRouter 平台功能的重大扩展,为用户提供了集成化的深度研究能力。同时,平台还发布了多款新模型,进一步丰富了其模型生态,可供开发者和研究者直接调用。
Mistral AI 推出 Mistral OCR,一款专注于文档理解的光学字符识别 API。该模型支持图像和 PDF 输入,能高精度提取并理解文本、表格、公式及内联图像,输出有序的文本与图像内容。其在内部基准测试中总分 94.89,超越了 GPT-4o-2024-11-20(89.77)与 Gemini-2.0-Flash-001(88.69)。API 命名为 `mistral-ocr-latest`,定价为 1000 页每美元,批量推理时处理能力翻倍。该 API 已在 la Plateforme 上线,支持部分组织自托管。模型原生支持多语言,单节点处理速度可达每分钟 2000 页。
OpenRouter 新上线了 Nitro 和 Floor Price 两项快捷排序功能,为用户提供更精细的模型提供商选择控制。Nitro 快捷选项能一键筛选出响应速度最快的模型,而 Floor Price 选项则可立即按最低价格对所有可用模型进行排序。这两项功能旨在帮助用户根据实时需求,在速度与成本之间快速做出权衡,优化使用体验。
Mistral AI 推出全新 le Chat AI 助手,基于其高性能模型提供快速响应(最高约 1000 词/秒)。该助手提供 Pro($14.99/月起)和 Team 版本,并开启企业版私有预览,支持 SaaS、本地及 VPC 部署。功能包括图像生成、代码执行分析及高质量文档处理,并即将推出数据连接器和多步骤智能体。
关联讨论 1 条Mistral AI:News(网页)Cloudflare 现已作为新模型提供商上线 OpenRouter 平台,首批支持其新推出的 Gemma 模型以及多款热门的 Llama 系列模型。此次合作扩大了开发者在部署和调用大语言模型时的基础设施选择,可直接通过 Cloudflare 全球网络访问这些模型。
研究人员为大型语言模型引入了“推理令牌”概念,这是一种特殊的元数据标记,用于显式标注模型在生成最终答案前的内部推理步骤。该机制允许模型将思考过程分解为多个中间步骤,并以结构化令牌形式输出,使人类能够追溯和分析其逻辑链条。这种方法提升了模型决策的透明度和可解释性,有助于调试复杂任务中的错误,并为评估推理质量提供了新工具。目前已在部分开源模型架构中实现测试。
Anthropic 宣布通过 API 为其 AI 模型 Claude 提供联网搜索功能。该功能允许开发者在 API 请求中直接集成实时网络搜索结果,确保模型能获取并基于最新信息进行回应。此举旨在提升 Claude 回答的时效性与准确性,使其能够处理需要当前数据支持的查询,例如新闻、股价或体育比分。用户需在 API 调用中显式启用此搜索选项。
模型现在开始返回标准化的完成原因值,并与OpenAI风格的惯例保持一致。这一变化意味着不同模型(如GPT、Claude、LLaMA)的输出终止原因将采用统一的分类和表述方式,例如“stop”、“length”或“content_filter”,从而提升API调用的可预测性和跨平台兼容性。开发者无需再为不同模型适配各异的终止逻辑,简化了集成与调试流程。
2025年初,Auto Router迎来重要升级,同时宣布与NotDiamond建立合作伙伴关系。本次升级聚焦于提升路由效率与响应速度,具体性能指标未公开。合作方NotDiamond将为其提供技术支持,共同优化多模型调用策略,旨在增强复杂任务的处理能力。此次更新标志着Auto Router在智能化调度领域迈出新的实践步伐。
OpenRouter Chatroom 现已免费提供网络搜索功能。此次更新是假日季发布的一部分,主要包含两项内容:一是开放了网络搜索能力,二是进行了价格下调。用户现在可以在聊天室中直接进行联网查询,而无需额外付费。
OpenRouter推出新功能,允许用户绑定自己的提供商API密钥或云服务积分。此举将用户的现有额度与OpenRouter平台相结合,统一管理不同模型(如GPT、Claude、LLaMA)的使用。用户可以在一个界面下集中监控和分析所有API调用情况,优化资源分配与成本控制。
该API首次实现了为任意大语言模型(如GPT、Claude、LLaMA)编写链上支付脚本的功能。它使LLM能够直接发起和处理加密货币支付,标志着AI与区块链交易整合的关键进展。这一工具将自动化支付流程引入LLM应用生态,为开发者提供了标准化的加密支付集成方案。
OpenAI 的 GPT-4o 模型和 Fireworks 模型现已支持结构化输出功能,开发者可以更可靠地获取格式化的 JSON 数据。与此同时,谷歌宣布其 Gemini Flash 2.0 模型转为免费提供,这为开发者和研究者提供了一个新的、无需付费的高性能大语言模型选项。这两项进展旨在降低应用开发门槛,并提升模型响应的可控性与实用性。
Meta 最新发布了 Llama 3.3 70B 模型,并同步推出了六个不同规格的版本及服务提供商。此次发布伴随着显著的价格下调,旨在提升模型的可及性与市场竞争力。关键变化在于以更低的成本提供强大的 700亿参数模型,具体降价幅度因提供商和版本而异,但整体趋势是大幅降低使用门槛。这一举措预计将推动大语言模型在更广泛场景中的应用与部署。
亚马逊发布了全新的Nova模型家族。此次发布标志着亚马逊在大型语言模型领域推出了新的产品线,旨在增强其AI服务能力。新模型家族预计将在理解能力、生成效率等方面进行关键升级,以应对当前市场上GPT、Claude、LLaMA等模型的竞争。具体性能指标和细节尚未完全披露,但此举明确显示了亚马逊加速布局生成式AI市场的决心。
Mistral AI 对其免费 AI 工作助手 le Chat 进行了重大更新(Beta)。新增功能包括:支持带引用的网络搜索;用于协作创作的 Canvas 界面;由新多模态模型 Pixtral Large 驱动的文档与图像理解功能;由 Black Forest Labs Flux Pro 支持的图像生成能力;以及更快的响应速度(由推测编辑技术驱动)。此次更新也展示了 le Chat 在提供前沿模型访问、网络搜索、Canvas 等多项核心功能方面的免费优势。所有新功能将陆续向用户开放。
关联讨论 1 条Mistral AI:News(网页)Mistral AI发布了新的内容审核API,与驱动Le Chat审核服务的系统相同。该API基于一个大语言模型(LLM)分类器,能够将文本输入划分为9个预定义类别。它提供两个端点,分别用于处理原始文本和对话内容,模型专为评估对话上下文中的最后一条消息而训练。该分类器原生支持多语言,包括阿拉伯语、中文、英语等11种语言,旨在为用户的应用提供可扩展、轻量且可定制的安全防护。
Mistral AI 推出 Mistral Batch API,为开发者提供一种处理大量请求的高效方式,其成本比同步 API 调用降低 50%。用户只需上传批处理文件,待处理完成后下载输出文件即可。该 API 适用于客户反馈分析、文档批量总结与翻译、向量嵌入生成等场景,现已在 La Plateforme 上对所有模型开放,每个工作区并发请求限制为 100 万。
Mistral AI 宣布多项更新:la Plateforme平台推出免费层,支持开发者零成本实验与原型开发,并可无缝升级至商业层;全线模型大幅降价,其中Mistral Small和Codestral的输入价格降幅达80%;发布22B参数的企业级新模型Mistral Small v24.09,定位介于Mistral NeMo 12B与Mistral Large 2之间;开源视觉模型Pixtral 12B现已可在le Chat中免费使用。
Mistral AI 于 2024 年 8 月 7 日在 La Plateforme 平台发布更新,允许开发者对旗舰模型 Mistral Large 2 与专业模型 Codestral 进行定制,方式包括基础提示、少样本提示或微调,并支持自带数据集。同时,平台推出了能封装模型的早期版本智能体功能,可通过 Le Chat 或 API 使用。此外,发布了稳定的 mistralai 1.0 SDK,支持 Python 和 Typescript。
Mistral AI 在 la Plateforme 平台推出模型定制服务,提供三种微调途径:面向开源开发者的 `mistral-finetune` 轻量代码库(基于 LoRA),支持在自有基础设施上微调;平台内的无服务器微调服务,利用专有技术对 Mistral 7B 和 Mistral Small 进行快速、低成本的适配与部署;以及面向部分客户的深度定制训练服务(如持续预训练),使用客户自有数据进行。未来数周内将为微调服务添加更多模型支持。
Mistral AI于2024年2月26日发布其多语言对话助手Le Chat,作为Mistral系列模型的首个应用示范。该助手底层可调用Mistral Large、Mistral Small或名为Mistral Next的简短原型模型。同时,面向企业的Le Chat Enterprise版本也已推出,提供自部署和细粒度审核功能。目前Le Chat正以Beta形式开放,需注意其无法接入互联网,可能不准确或提供过时信息。
Mistral AI 开放平台提供 Beta 访问,包含三个聊天端点和一个嵌入向量端点。聊天端点分别为:提供 Mistral 7B Instruct v0.2、仅支持英语的 mistral-tiny;提供 Mixtral 8x7B、支持多语言与代码的 mistral-small;以及提供高性能原型模型的 mistral-medium。三者 MT-Bench 分数依次为 7.6、8.3 和 8.6。嵌入端点 Mistral-embed 提供 1024 维向量,在 MTEB 检索任务上得分为 55.26。平台 API 兼容通用聊天界面,提供 Python 与 Javascript 客户端库,并支持系统提示词。服务已开放注册,容量将逐步提升。