AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 726 条
全部一手资讯X论文
标签「模型发布」清除
4月14日周一
08:00OpenRouter:Announcements(RSS)42Quasar Alpha 与 Optimus Alpha 揭示
08:00OpenRouter:Announcements(RSS)45Quasar Alpha 与 Optimus Alpha 发布
4月10日周四
08:00OpenRouter:Announcements(RSS)41OpenRouter 推出第二个"隐身"模型 Optimus Alpha
08:00OpenRouter:Announcements(RSS)35OpenRouter 发布第二个"stealth"模型 Optimus Alpha
08:00OpenRouter:Announcements(RSS)53"隐形"模型:Optimus Alpha
4月3日周四
08:00OpenRouter:Announcements(RSS)36OpenRouter 发布首个"隐身"模型 Quasar Alpha
08:00OpenRouter:Announcements(RSS)51OpenRouter 推出首个"隐身"模型 Quasar Alpha
08:00OpenRouter:Announcements(RSS)41"隐形"模型:Quasar Alpha
3月25日周二
21:23公众号:DeepSeek(深度求索)64同事件精选DeepSeek-V3 模型更新,各项能力全面进阶同一事件,精选展示《DeepSeek-V3 正式发布》
3月17日周一
00:00Mistral AI:News(网页)58Mistral AI 发布 Mistral Small 3.1 开源模型
2月19日周三
00:00xAI:News(网页)精选Grok 3 Beta 发布:推理智能体时代来临
2月17日周一
00:00Mistral AI:News(网页)56Mistral AI 发布首个区域语言模型 Mistral Saba
1月30日周四
00:00Mistral AI:News(网页)60Mistral Small 3发布
1月20日周一
20:10公众号:DeepSeek(深度求索)64精选DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
1月13日周一
00:00Mistral AI:News(网页)52Mistral AI 发布 Codestral 25.01 代码生成模型
12月26日周四
19:17公众号:DeepSeek(深度求索)67精选DeepSeek-V3 正式发布
12月13日周五
20:14公众号:DeepSeek(深度求索)47久等了,DeepSeek-VL2
12月5日周四
08:00OpenRouter:Announcements(RSS)36亚马逊推出全新Nova模型家族
11月20日周三
19:59公众号:DeepSeek(深度求索)66精选DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链
11月18日周一
00:00Mistral AI:News(网页)60Mistral AI 开源多模态模型 Pixtral Large 发布
10月16日周三
00:00Mistral AI:News(网页)54Mistral AI发布Ministral 3B和8B边缘模型
9月18日周三
20:06公众号:DeepSeek(深度求索)56DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分
9月17日周二
00:00Mistral AI:News(网页)47Pixtral 12B 发布公告
9月6日周五
19:38公众号:DeepSeek(深度求索)61精选DeepSeek-V2.5:融合通用与代码能力的全新开源模型
8月16日周五
20:46公众号:DeepSeek(深度求索)53DeepSeek 发布开源数学定理证明模型
8月13日周二
00:00xAI:News(网页)Grok-2 Beta 发布
7月24日周三
00:00Mistral AI:News(网页)65Mistral Large 2发布
7月18日周四
00:00Mistral AI:News(网页)62Mistral AI与NVIDIA联合推出开源模型Mistral NeMo
7月16日周二
00:00Mistral AI:News(网页)49Codestral Mamba 发布
00:00Mistral AI:News(网页)37Mistral AI 发布数学推理模型 Mathstral 7B
5月29日周三
00:00Mistral AI:News(网页)57Codestral:Mistral AI团队2024年5月29日发布
5月14日周二
01:39Sam Altman:Blog(RSS)精选GPT-4o
4月17日周三
00:00Mistral AI:News(网页)63更便宜、更好、更快、更强 2024年4月17日 Mistral AI团队
4月15日周一
01:00EleutherAI:BlogPile-T5:基于 The Pile 训练的 T5 模型
4月12日周五
00:00xAI:News(网页)精选Grok-1.5 Vision 预览版
3月28日周四
08:00xAI:News(网页)Grok-1.5 正式发布
3月21日周四
00:00Suno:Blog(网页)39Suno 推出 v3 音乐生成模型
2月26日周一
00:00Mistral AI:News(网页)64Mistral AI发布最新旗舰大语言模型Mistral Large
12月11日周一
00:00Mistral AI:News(网页)62Mistral AI 发布开源稀疏混合专家模型 Mixtral 8x7B
11月3日周五
08:00xAI:News(网页)xAI发布大模型Grok
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月14日
08:00
OpenRouter:Announcements(RSS)
42
Quasar Alpha 与 Optimus Alpha 揭示

OpenRouter 公告显示,Quasar Alpha 与 Optimus Alpha 在测试期间均登顶排行榜,它们是早期测试阶段的模型版本。

模型发布
08:00
OpenRouter:Announcements(RSS)
45
Quasar Alpha 与 Optimus Alpha 发布

Quasar Alpha 和 Optimus Alpha 两个早期测试版本在测试期间均位居榜首。它们是某先进模型或系统的初期迭代,其测试表现优异,在相关评测中取得了领先的排名,显示出强大的潜力。此次发布揭示了这些早期版本的存在及其突出的基准测试结果。

OpenAI模型发布行业动态
4月10日
08:00
OpenRouter:Announcements(RSS)
41
OpenRouter 推出第二个"隐身"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“隐身”(stealth)模型 Optimus Alpha。该模型名称延续了“stealth”系列,但官方目前未公布具体技术参数、功能或应用细节。

模型发布部署/工程
08:00
OpenRouter:Announcements(RSS)
35
OpenRouter 发布第二个"stealth"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“stealth”模型 Optimus Alpha,该模型为闭源产品,尚未公布参数规模、性能基准或价格等细节。

模型发布
08:00
OpenRouter:Announcements(RSS)
53
"隐形"模型:Optimus Alpha

团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略,具体性能指标与架构细节未公开。此举旨在保持技术优势,避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展,但核心改进方向与具体应用场景仍有待后续披露。

智能体产品更新模型发布
4月3日
08:00
OpenRouter:Announcements(RSS)
36
OpenRouter 发布首个"隐身"模型 Quasar Alpha

OpenRouter 宣布其首个“隐身”模型 Quasar Alpha。该模型是 OpenRouter 首次推出的隐藏身份/来源的模型,具体参数、性能、可用性等细节尚未公布。

模型发布
08:00
OpenRouter:Announcements(RSS)
51
OpenRouter 推出首个"隐身"模型 Quasar Alpha

OpenRouter 宣布推出其首个名为 Quasar Alpha 的“隐身”模型。

模型发布
08:00
OpenRouter:Announcements(RSS)
41
"隐形"模型:Quasar Alpha

公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变,旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代,具体性能指标和细节尚未完全公开,但明确指向了增强模型的隐蔽性和适应性。

产品更新模型发布
3月25日
21:23
公众号:DeepSeek(深度求索)
同事件精选64
DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek-V3 新版已发布,关闭深度思考模式即可体验,模型权重同步开源。

DeepSeek开源/仓库推理模型发布
同一事件,精选展示《DeepSeek-V3 正式发布》
推荐理由:DeepSeek-V3 发布时是开源模型的有力竞争者,但这条一年多前的旧闻如今毫无新意,对关注 AI 动态的你来说,可以直接跳过。
3月17日
00:00
Mistral AI:News(网页)
58
Mistral AI 发布 Mistral Small 3.1 开源模型

Mistral AI 于2025年3月17日发布 Mistral Small 3.1。该模型在 Mistral Small 3 基础上改进,支持最高 128k tokens 上下文窗口,推理速度达 150 tokens/秒,并支持多模态理解。官方称其性能超越了 Gemma 3 和 GPT-4o Mini 等同量级模型。Mistral Small 3.1 以 Apache 2.0 许可开源,基础模型与指令微调模型均已发布。模型轻量化,可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行,适用于对话助手、函数调用、专业领域微调及构建推理模型等多种场景。

开源生态模型发布端侧
2月19日
00:00
xAI:News(网页)
精选
Grok 3 Beta 发布:推理智能体时代来临

Grok 3 Beta 正式发布,开启"推理智能体"时代。新版本强化深度推理与自主决策能力,支持复杂任务拆解和多步逻辑链处理,在数学、编程等推理密集型场景表现显著提升,标志着 AI 从简单问答向自主推理决策的范式转变。

智能体xAI推理模型发布

推荐理由:xAI发布Grok 3 Beta,主打推理智能体能力
2月17日
00:00
Mistral AI:News(网页)
56
Mistral AI 发布首个区域语言模型 Mistral Saba

Mistral AI 推出首个区域语言模型 Mistral Saba。这是一个参数量为 24B 的模型,基于来自中东和南亚的精选数据集进行训练。模型在提供比自身参数量大五倍的通用模型更准确的相关响应的同时,具备更快的速度和更低的成本。Mistral Saba 支持阿拉伯语及多种印度语言,在南印度语系如泰米尔语上表现尤为突出。它以 API 形式提供服务,同时也支持在客户的安全环境中进行本地部署。该模型轻量化,可在单 GPU 系统上运行,响应速度超过 150 tokens/秒。

模型发布
1月30日
00:00
Mistral AI:News(网页)
60
Mistral Small 3发布

Mistral AI 发布 Mistral Small 3,一款基于 Apache 2.0 开源、延迟优化的 24B 参数大语言模型。其性能可与 Llama 3.3 70B、Qwen 32B 等更大模型竞争,并作为 GPT-4o-mini 的开源替代。指令微调版本在代码、数学、通用知识等基准测试中表现出色,MMLU 准确率超 81%,推理速度达 150 tokens/s。该模型未使用强化学习或合成数据训练,提供预训练和指令微调两个检查点,适合本地部署,经量化后可在单块 RTX 4090 或 32GB 内存 MacBook 上运行。现已在 la Plateforme 平台提供,并与 Hugging Face、Ollama、Together AI 等合作推出。

开源生态推理模型发布
1月20日
20:10
公众号:DeepSeek(深度求索)
精选64
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API,训练技术同步公开。

DeepSeek推理模型发布

推荐理由:虽已是旧闻,但 DeepSeek-R1 作为首个开源对齐 o1 的模型,其训练技术至今仍有参考价值,做推理方向的值得回溯。
1月13日
00:00
Mistral AI:News(网页)
52
Mistral AI 发布 Codestral 25.01 代码生成模型

Mistral AI 推出了代码生成模型 Codestral 25.01。相比前代 Codestral-2405,该模型采用了更高效的架构并改进了分词器,使代码生成与补全速度提升约 2 倍。Codestral 25.01 的上下文长度为 256k。在多项基准测试中,它在 HumanEval 平均基准上得分 71.4%,在 HumanEvalFIM(填充中间)平均基准上得分 85.9%,成为同量级模型中代码生成,尤其是填充中间(FIM)任务的 SOTA。

模型发布编码
12月26日
19:17
公众号:DeepSeek(深度求索)
精选67
DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型,性能比肩世界顶尖模型,速度跃升,价格更新。

DeepSeek开源/仓库模型发布
关联讨论 1 条公众号:DeepSeek(深度求索)
推荐理由:DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁,首次亮剑就逼近闭源顶尖,开源权重更是直接改变了开发者生态。时隔一年半回头看,它仍是理解 DeepSeek 路径的起点。
12月13日
20:14
公众号:DeepSeek(深度求索)
47
久等了,DeepSeek-VL2
DeepSeek多模态模型发布
12月5日
08:00
OpenRouter:Announcements(RSS)
36
亚马逊推出全新Nova模型家族

亚马逊推出了全新的Nova模型家族。这是亚马逊最新发布的Nova系列模型,现已正式到来。

多模态模型发布
11月20日
19:59
公众号:DeepSeek(深度求索)
精选66
DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链

DeepSeek 上线推理模型预览版,其推理性能与 OpenAI 的 o1-preview 相当,并公开了模型的完整思维链。

DeepSeek推理模型发布

推荐理由:虽然已是旧闻,但 DeepSeek 首次公开推理模型完整思维链,对理解 o1 类模型的内部机制是个重要线索,做推理模型研究的值得回看。
11月18日
00:00
Mistral AI:News(网页)
60
Mistral AI 开源多模态模型 Pixtral Large 发布

Mistral AI 基于 Mistral Large 2 发布了开源多模态模型 Pixtral Large。该模型包含 123B 多模态解码器和 1B 视觉编码器,支持 128K 上下文窗口。性能方面,它在 MathVista、DocVQA、ChartQA 和 MM-MT-Bench 等基准测试中超越 GPT-4o 与 Gemini-1.5 Pro,并在 LMSYS Vision Leaderboard 上成为得分最高的开源模型。需要注意的是,该模型已停止维护,并被更新的视觉模型所取代。

多模态开源/仓库模型发布评测/基准
10月16日
00:00
Mistral AI:News(网页)
54
Mistral AI发布Ministral 3B和8B边缘模型

Mistral AI发布了两个新的边缘计算模型Ministral 3B和Ministral 8B。两者均支持高达128k的上下文长度。Ministral 8B采用了特殊的交错滑动窗口注意力模式,以实现更快、内存效率更高的推理。这些模型在知识、常识、推理、函数调用和效率方面为10B以下类别设定了新标杆,可用于设备端翻译、离线智能助手、本地分析和机器人等场景。在多项基准测试中,它们超越了同级别的Gemma 2 2B、Llama 3.2 3B等模型。Ministral 8B的API定价为$0.1 / M tokens,Ministral 3B为$0.04 / M tokens。

MCP/工具模型发布端侧
9月18日
20:06
公众号:DeepSeek(深度求索)
56
DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分

DeepSeek-V2.5 在 LMSYS ChatBotArena(全球大模型竞技场)榜单中上榜,创下国产大模型在该竞技场的最高得分记录。

DeepSeek开源生态模型发布评测/基准
9月17日
00:00
Mistral AI:News(网页)
47
Pixtral 12B 发布公告

Mistral AI 发布了多模态模型 Pixtral 12B,该模型现已弃用,已被更新更强的版本取代。其基于 Mistral Nemo 构建,包含一个从头训练的 400M 参数视觉编码器,总参数为 12B。模型原生支持可变图像尺寸与宽高比,并能在 128K token 的上下文窗口中处理多张图像。在 MMMU 推理基准测试中,Pixtral 12B 达到 52.5% 的分数,超越了众多更大规模的模型。它在保持强大文本能力(如指令跟随,相对前代开源模型有 20% 提升)的同时,在多模态任务上表现出色。该模型采用 Apache 2.0 许可证。

多模态模型发布
9月6日
19:38
公众号:DeepSeek(深度求索)
精选61
DeepSeek-V2.5:融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力,并更好地对齐人类偏好。

DeepSeekOpenAI开源/仓库模型发布

推荐理由:DeepSeek首次将通用对话与代码能力合一的开源模型,当时直接拉低了多任务成本,今天看仍是模型混合能力演变的早期标杆。
8月16日
20:46
公众号:DeepSeek(深度求索)
53
DeepSeek 发布开源数学定理证明模型

DeepSeek 发布了一款开源数学定理证明模型,目标是加速“数学定理证明的 AlphaGo 时代”的到来。

DeepSeek开源/仓库推理模型发布
8月13日
00:00
xAI:News(网页)
Grok-2 Beta 发布

xAI 正式发布 Grok-2 测试版(Beta),开放新模型体验。该版本在推理、代码生成和多模态能力方面有所升级,用户现可注册试用最新功能。

xAI模型发布
7月24日
00:00
Mistral AI:News(网页)
65
Mistral Large 2发布

Mistral AI发布了大语言模型Mistral Large 2。该模型拥有128k上下文窗口和123B参数,支持数十种语言和80多种编程语言,专为单节点长上下文推理设计。在MMLU基准上,其预训练版本达到84.0%准确率,性能与GPT-4o、Claude 3 Opus和Llama 3 405B相当,并显著降低了模型幻觉倾向。模型通过Mistral的API平台和HuggingFace提供,采用Mistral Research License(研究用途)和商业许可(商用部署)。平台将整合为通用模型(Mistral Nemo、Mistral Large)和专用模型(Codestral、Embed)的组合。

推理模型发布
7月18日
00:00
Mistral AI:News(网页)
62
Mistral AI与NVIDIA联合推出开源模型Mistral NeMo

Mistral AI团队与NVIDIA合作发布了Mistral NeMo,这是一个12B参数的大语言模型。它提供高达128k tokens的上下文窗口,并在推理、世界知识和编码能力上达到了其规模的前沿水平。该模型基于标准架构,是Mistral 7B的即插即用替代品,并支持FP8推理。Mistral NeMo以Apache 2.0许可开源,包含预训练和指令微调版本,权重已发布在HuggingFace并可通过其API平台调用。新引入的Tekken分词器在超过100种语言上训练,在压缩多种语言文本时效率显著高于前代。

开源生态推理模型发布
7月16日
00:00
Mistral AI:News(网页)
49
Codestral Mamba 发布

Mistral AI 团队发布了 Codestral Mamba 模型。该模型由 Albert Gu 和 Tri Dao 协助设计,采用 Mamba 架构而非 Transformer,具备线性时间推理优势,并在代码与推理能力上进行了训练,以达到与 SOTA Transformer 模型相当的性能。模型在高达 256k tokens 的上下文检索能力上进行了测试。它是一个指令微调版本,参数规模为 7,285,403,648,以 Apache 2.0 许可证开源。用户可通过 mistral-inference SDK 或 TensorRT-LLM 进行部署,权重可从 HuggingFace 下载,也已在 la Plateforme 上提供。

开源生态模型发布编码
00:00
Mistral AI:News(网页)
37
Mistral AI 发布数学推理模型 Mathstral 7B

Mistral AI 发布了专注于数学推理的 7B 参数模型 Mathstral 7B。该模型基于 Mistral 7B 构建,旨在解决需要复杂多步推理的高级数学问题。它在 MATH 和 MMLU 基准上分别达到 56.6% 和 63.47%,在同等参数规模中实现 SOTA 性能。通过增加推理时计算,其在 MATH 上的分数可借助多数投票提升至 68.37%,使用强奖励模型则可达 74.59%。该模型为指令模型,权重已托管于 HuggingFace。

开源/仓库推理模型发布
5月29日
00:00
Mistral AI:News(网页)
57
Codestral:Mistral AI团队2024年5月29日发布

Mistral AI推出其首个专用代码模型Codestral。该模型拥有22B参数,开源权重,专为代码生成任务设计,支持80+编程语言,并具备32k的上下文窗口,在RepoBench评测中表现优于竞品。开发者可通过专用端点 codestral.mistral.ai 获得为期8周的免费Beta测试,也可通过 api.mistral.ai 按token计费使用。该模型已集成至LlamaIndex、LangChain以及Continue.dev和Tabnine等IDE工具。

开源/仓库推理模型发布编码
5月14日
01:39
Sam Altman:Blog(RSS)
精选
GPT-4o

OpenAI 将 GPT-4o 向所有 ChatGPT 用户免费开放,无广告。全新语音(及视频)模式响应速度接近人类,表现力极强,被 Sam Altman 称为「用过最好的计算机界面」,像电影里的 AI。未来还将支持个性化、代操作等功能。

OpenAI多模态模型发布语音

推荐理由:Sam Altman 解读 GPT-4o 发布,强调语音交互与免费策略
4月17日
00:00
Mistral AI:News(网页)
63
更便宜、更好、更快、更强 2024年4月17日 Mistral AI团队

Mistral AI发布其最新开放模型Mixtral 8x22B。该模型基于稀疏混合专家(SMoE)架构,在141B总参数中激活39B参数,拥有64K tokens上下文窗口,支持英语、法语、意大利语、德语和西班牙语,并具备强大的数学、编码及原生函数调用能力。在MMLU等标准基准测试中,其推理性能超越其他开源模型,且推理速度优于任何密集型70B模型。该模型以Apache 2.0许可证开源发布。

开源生态推理模型发布编码
4月15日
01:00
EleutherAI:Blog
Pile-T5:基于 The Pile 训练的 T5 模型

Pile-T5 是研究人员基于 T5 架构,在 The Pile 大规模文本数据集上训练的语言模型。该模型继承了 T5 的文本到文本转换框架,通过在大规模多样化语料上的预训练,提升了自然语言理解与生成能力。Pile-T5 的发布为相关研究提供了基于 The Pile 数据训练的 T5 变体,适用于各类下游自然语言处理任务。

开源生态数据/训练模型发布
4月12日
00:00
xAI:News(网页)
精选
Grok-1.5 Vision 预览版

xAI 发布 Grok-1.5 Vision 预览版,新增视觉理解能力,可处理图像、图表及文档内容,支持跨模态推理与视觉问答,现面向早期测试者开放试用。

xAI多模态模型发布

推荐理由:xAI发布Grok-1.5 Vision预览版,具备多模态视觉理解能力
3月28日
08:00
xAI:News(网页)
Grok-1.5 正式发布

xAI 发布 Grok-1.5 大模型,推理与编程能力显著提升,支持 128K 上下文窗口,数学与代码基准测试成绩大幅改进,已向 X 平台 Premium+ 用户开放。

xAI模型发布
3月21日
00:00
Suno:Blog(网页)
39
Suno 推出 v3 音乐生成模型

音乐生成平台 Suno 发布了 v3 模型,这是其首个能生成广播级质量音乐的模型,支持用户在数秒内创作完整的两分钟歌曲,现已对所有用户开放。v3 在音频质量、风格多样性及提示词遵循性上进行了改进,减少了模型幻觉并提升了歌曲结尾的自然度。该模型专为原创音乐设计,不支持对其他艺术家的参考,并部署了不可听水印技术以检测 AI 生成内容。v4 模型已在开发中。

多模态模型发布
2月26日
00:00
Mistral AI:News(网页)
64
Mistral AI发布最新旗舰大语言模型Mistral Large

Mistral AI发布了其最新旗舰大语言模型Mistral Large。该模型在MMLU基准测试中排名全球第二(仅次于GPT-4),拥有32K token上下文窗口,原生支持英语、法语、西班牙语、德语和意大利语,并具备函数调用能力。Mistral Large已可通过Azure AI Studio和Mistral自身的la Plateforme API访问。同时,Mistral还发布了优化低延迟的Mistral Small。

推理模型发布
12月11日
00:00
Mistral AI:News(网页)
62
Mistral AI 发布开源稀疏混合专家模型 Mixtral 8x7B

Mistral AI 发布开源模型 Mixtral 8x7B,采用 Apache 2.0 许可证。这是一个稀疏混合专家(SMoE)模型,总参数 46.7B,但每个 token 仅激活 12.9B 参数。其推理速度比 Llama 2 70B 快 6 倍,并在多数基准测试中匹配或超越 GPT-3.5。模型支持 32k token 上下文窗口,掌握英语、法语、意大利语、德语和西班牙语,并具备强大的代码生成能力。同步发布经监督微调和直接偏好优化(DPO)的指令版本 Mixtral 8x7B Instruct,其在 MT-Bench 上得分 8.3。

开源生态推理模型发布
11月3日
08:00
xAI:News(网页)
xAI发布大模型Grok

xAI发布大模型Grok,灵感源自《银河系漫游指南》,主打幽默叛逆风格,能回答敏感问题并通过X平台获取实时信息。底层模型Grok-1拥有330亿参数,在HumanEval编码测试达63.2%、MMLU达73%,性能超越GPT-3.5和同计算量级模型。在2023匈牙利高中数学考试中获C级(59%)。系统目前处于早期测试阶段。

xAI推理搜索模型发布
‹ 上一页
1…16171819
下一页 ›