精选69
精选理由
将视频理解提升到结构化空间输出,动态帧率分析让模型能真正「看懂」动作,做具身智能的开发者可以关注。
AI 摘要
Perceptron Mk1已在OpenRouter上线,由@perceptroninc开发。 前沿视频与具身推理的视觉语言模型。以动态帧率(最高2 FPS)分析视频,具备32k多模态上下文,采用混合推理和结构化空间基元(点、框、多边形、片段)作为首要输出。
AI 翻译 · 中文
Perceptron Mk1 已在 OpenRouter 上线,由 @perceptroninc 构建。
这是一款具备前沿视频与具身推理能力的视觉语言模型。它能在 32k 多模态上下文中以动态帧率(最高 2 FPS)分析视频,并支持混合推理,将结构化空间基元(点、框、多边形、片段)作为一等输出。