Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...
Opus 4.8 has been found staged in the claude code model selector on the desktop app. It should be releasing today! lets ...
Krea is now built in to Hermes Agent as an image generation API provider, allowing your agent to use Krea 2: a new found...
关联讨论 1 条X:Krea AI (@krea_ai)KREA 2 Image is now a Partner Node in ComfyUI KREA's first foundation image model - trained from scratch - with tunable ...
关联讨论 1 条X:Krea AI (@krea_ai)Krea 2 is now on Runware 🖌️ - two variants: Large (photorealism, creative control) & Medium (illustration, anime, desig...
@Shaughnessy119 https://poolside.ai/blog/introducing-laguna-xs2-m1 All models will be open going forward
Qwen3.7 Max now available in Go - text only - 1M context - smartest model in the Qwen family to date
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》MiniMax即将发布M3模型。其核心架构为基于GQA的动态块稀疏注意力机制,通过轻量索引分支筛选相关token块进行稀疏注意力计算。性能方面,在1M token上下文窗口下,Prefill速度相比M2提升9.7倍,解码速度提升15.6倍。该设计旨在大幅降低处理超长上下文的算力成本,使百万token级别的Agent应用得以更高效落地。
Something BIG is coming
OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。
PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。
Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...
#MSA #OpenSource #M3 🫣😎
MiniMax预览了其M3架构采用的新稀疏注意力(Sparse Attention)技术。测试显示,在1M token上下文下,该技术相比M2实现了9.7倍的预填充(prefilling)加速和15.6倍的解码(decoding)加速。M2曾为保证生产环境就绪而采用全注意力机制,M3则采用了新的两阶段方法:先用轻量级索引分支选择数据块,再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。
#MSA #OpenSource #M3 🫣😎
网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。
腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...
Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...
影眸科技推出 Rodin Gen-2.5,号称全球首个千万面级 3D 生成模型。该模型提供从极低(4秒)到极高(80秒)的五档思考模式,以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理,支持 PBR 材质与 360° 无死角覆盖,并提供 Faithful(贴合参考)与 Creative(自动优化)两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。
Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题(部分问题存在56年),每个问题的成本约几百美元。它还证明了44个OEIS猜想,解决了一个15年的代数几何问题,并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合,Lean自动检查每一步逻辑,无需人工复核。研究发现,一个仅交替使用大语言模型生成与编译器反馈的基础智能体,便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域(如组合、数论),仍无法解决需要全新理论的大问题。
StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征,如语气、节奏、停顿甚至轻叹,从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格,内置超过10,000种可组合的预置角色,并提供5种开箱即用的预设角色供体验。同时,模型经过RLHF优化,能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。
i am absolutely THRILLED to announce that it appears they're beginning to make strides on UI de-slopification with GPT-5...
claude-opus-4.8 is on Google Vertex 👀
Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...
ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。
🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...
关联讨论 1 条IT之家(RSS)The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。
智谱近期推出GLM-5.1-Highspeed模型,实测输出速度达300+ tokens/s,首token延迟约1秒,相较于标准版GLM-5.1的35 tps和9秒延迟,性能提升约10倍。技术上,智谱联合TileRT团队重构了推理链路,通过将整个推理流程编译为常驻GPU的大kernel,大幅减少CPU调度与数据搬运开销,并优化单卡内的计算、IO分配及多卡间任务协作,显著提升GPU利用效率。该模型单次激活40B参数,高性能运行需依托多卡并行,建议现有用户切换使用以获得更实时的生成体验。
🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)这一波估计XX词典凉的透透的了... 刚看到这个图坐不住了, 30B-A3B 的小模型跑分碾压 DeepSeek-V4-Pro? 谁给你的勇气? 然后定睛一看, 原来是翻译专用大模型. 腾讯刚刚放出了3个翻译专用大模型, 分别是 Hy-MT...