Krea is now built in to Hermes Agent as an image generation API provider, allowing your agent to use Krea 2: a new found...
关联讨论 1 条X:Krea AI (@krea_ai)KREA 2 Image is now a Partner Node in ComfyUI KREA's first foundation image model - trained from scratch - with tunable ...
关联讨论 1 条X:Krea AI (@krea_ai)Krea 2 is now on Runware 🖌️ - two variants: Large (photorealism, creative control) & Medium (illustration, anime, desig...
@Shaughnessy119 https://poolside.ai/blog/introducing-laguna-xs2-m1 All models will be open going forward
Qwen3.7 Max now available in Go - text only - 1M context - smartest model in the Qwen family to date
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)Qwen3.7 Max (20250517) debuts at #4 in Code Arena: Frontend - the top-ranked Chinese lab on the board, surpassing GLM-5....
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》MiniMax即将发布M3模型。其核心架构为基于GQA的动态块稀疏注意力机制,通过轻量索引分支筛选相关token块进行稀疏注意力计算。性能方面,在1M token上下文窗口下,Prefill速度相比M2提升9.7倍,解码速度提升15.6倍。该设计旨在大幅降低处理超长上下文的算力成本,使百万token级别的Agent应用得以更高效落地。
Something BIG is coming
OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。
PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。
Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...
#MSA #OpenSource #M3 🫣😎
MiniMax预览了其M3架构采用的新稀疏注意力(Sparse Attention)技术。测试显示,在1M token上下文下,该技术相比M2实现了9.7倍的预填充(prefilling)加速和15.6倍的解码(decoding)加速。M2曾为保证生产环境就绪而采用全注意力机制,M3则采用了新的两阶段方法:先用轻量级索引分支选择数据块,再仅对相关的KV块执行稀疏注意力。这是开源领域的新进展。
#MSA #OpenSource #M3 🫣😎
网易有道发布子曰4,一个27B参数的全模态大语言模型,在视觉数理方向达到同规模SOTA,纯文本数理难题准确率为81.4%。该模型在27B“甜点级”参数规模下,实现了多模态与纯文本数理推理的双重优势。同时,子曰4全模态模型和TTS引擎已同步开源,开放参数权重,支持本地部署与二次训练。其TTS模型只需3秒即可克隆原声,支持14种语言,克隆准确度超97%,音色还原度达95%以上。
腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...
Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...
影眸科技推出 Rodin Gen-2.5,号称全球首个千万面级 3D 生成模型。该模型提供从极低(4秒)到极高(80秒)的五档思考模式,以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理,支持 PBR 材质与 360° 无死角覆盖,并提供 Faithful(贴合参考)与 Creative(自动优化)两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。
Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题(部分问题存在56年),每个问题的成本约几百美元。它还证明了44个OEIS猜想,解决了一个15年的代数几何问题,并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合,Lean自动检查每一步逻辑,无需人工复核。研究发现,一个仅交替使用大语言模型生成与编译器反馈的基础智能体,便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域(如组合、数论),仍无法解决需要全新理论的大问题。
ANTHROPIC 🔥: Mythos 1, "claude-mythos-1-preview", is being prepared for a release on Claude Code and Claude Security. T...
StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征,如语气、节奏、停顿甚至轻叹,从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格,内置超过10,000种可组合的预置角色,并提供5种开箱即用的预设角色供体验。同时,模型经过RLHF优化,能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。
i am absolutely THRILLED to announce that it appears they're beginning to make strides on UI de-slopification with GPT-5...
claude-opus-4.8 is on Google Vertex 👀
Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...
ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。
🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...
关联讨论 1 条IT之家(RSS)The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。
智谱近期推出GLM-5.1-Highspeed模型,实测输出速度达300+ tokens/s,首token延迟约1秒,相较于标准版GLM-5.1的35 tps和9秒延迟,性能提升约10倍。技术上,智谱联合TileRT团队重构了推理链路,通过将整个推理流程编译为常驻GPU的大kernel,大幅减少CPU调度与数据搬运开销,并优化单卡内的计算、IO分配及多卡间任务协作,显著提升GPU利用效率。该模型单次激活40B参数,高性能运行需依托多卡并行,建议现有用户切换使用以获得更实时的生成体验。
🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)