Perceptron推出Agentic Detection视觉检测模型,用户只需提供一张图片并用自然语言描述目标,即可自动框出并分类,无需预先训练。该模型还能处理物理推理检测任务,例如定位森林火灾的起火点(“烟的来源”)、挑出变形电线杆(“需要维修的电线杆”)、标记空车位等。引用推文指出,该模型支持用自然语言或示例描述任意物体进行定位。
兄弟们 这个牛P啊
Agentic Detection:一个视觉检测模型
用一句话描述,AI 就在图里精确圈出目标
你只需要给它一张照片,描述你要找什么,它要把里面的东西用方框圈出来,再告诉你每个框里都是什么。
而且不需要你提前训练它…
它还能处理需要物理推理的检测,例如:
你说"烟的来源"在哪,它会推理整个画面,定位到森林火灾的起火点
你说"需要维修的电线杆",它能挑出变形的电力设施
你说"空着的停车位有哪些",它能找出来并标记