豆包Seed-2.1实测:编程可用,识鱼封神! · AI HOT
向阳乔木 @vista8 精选 82
2026-06-25 15:28 ·1天前
精选理由 乔木的实测很有说服力,Seed 2.1 Pro 在编程和 Agent 任务上已能用,多模态识鱼甚至反超 Gemini,对正在选模型的开发者是及时且扎实的参考。
AI 摘要 火山引擎发布豆包Seed-2.1系列(Pro、Turbo)。实测Seed-2.1 Pro显示:Agent和Coding能力达到生产级可用线,能完成SVG动画、网页开发、CMS系统等任务;配合开源Skill可生成标题、调研报告、信息卡片及电子书。多模态识别惊喜,拍照识鱼准确识别鱼种和数量,优于Gemini 3.1 Flash。价格实惠,API已通过火山方舟全量开放。
智能体 多模态 编码 评测/基准
← 返回
向阳乔木 @vista8 · X 精选 82
2026-06-25 15:28 · 1天前
在 X 看原推 · x.com 精选理由 乔木的实测很有说服力,Seed 2.1 Pro 在编程和 Agent 任务上已能用,多模态识鱼甚至反超 Gemini,对正在选模型的开发者是及时且扎实的参考。
AI 摘要 火山引擎发布豆包Seed-2.1系列(Pro、Turbo)。实测Seed-2.1 Pro显示:Agent和Coding能力达到生产级可用线,能完成SVG动画、网页开发、CMS系统等任务;配合开源Skill可生成标题、调研报告、信息卡片及电子书。多模态识别惊喜,拍照识鱼准确识别鱼种和数量,优于Gemini 3.1 Flash。价格实惠,API已通过火山方舟全量开放。
没想到老实巴交的豆包 Seed 2.1,也能瞬间变标题党,相当炸裂!
竞品调研报告 很多人的日常工作,经常要做一些产品分析调研,把下面提示词发给 Seed 2.1 Pro:
调研 3 个「AI 会议纪要工具」的官网、价格、核心功能、集成生态、隐私合规表述和用户评价。输出一张竞品矩阵,并给出面向中小企业的 MVP功能优先级、差异化定位和 90 天 Roadmap。
生成内容很长,我补了一句:"写入飞书文档",精准调 lark-doc 写入文档,效果如下:
直接抓取被拦截时,还会调用 Playwright 读页面获取信息。
生成信息卡图 将任意文本或链接一键转化为杂志质感信息卡片,自动截图输出图片,适合分享到 X、小红书、微信。
npx skills add joeseesun/info-card-designer
然后把开篇的微信文章发给 Seed 2.1 Pro,提示词:
读取 https://mp.weixin.qq.com/s/a-eevQvWVAYwZQeFi1ZomA 用信息卡skill生成卡片
默认生成了蓝紫渐变图 😂 ,让它调整生成白色简洁风格信息图。
制作电子书 互联网上有些博客写的非常好,很值得做成 epub 电子书,导入微信读书随时看。
npx skills add joeseesun/qiaomu-epub-book-generator
此任务可以测试 Seed 2.1-pro的 Skill 调用和执行能力,提示词很简单:
抓取 Paul Graham 最新 x 条博客,用乔木 epub 制作 skill 生成epub电子书
还能遵循 Skill 封面设计规范,先设计网页,再调用 Playwright 截图,生成电子书封面。
拍照识鱼 乔帮主作为钓鱼佬,最近在开发一款自用 iOS App。
产品需求:拍照后 AI 自动读取相片 exif 信息记录钓点,同时识别渔获,什么鱼种,有几条。
之前测试 Gemini 3.1 Flash,竟把白条识别成"泥鳅",非常恼火。
听火山发布会说 Seed 2.1 Pro 多模态不错。
抱着试试看心态,给了一张没抹去 exif 信息的图片,输入提示词:
读取这张图片的地理位置信息,并识别图中有几条鱼,什么鱼
结果让人感动,不仅调用 exif 工具读取了图片地理位置(温榆河),还准确识别了鱼种和数量。
连泥水中看不太清楚的两条都识别到了,还给我科普了白条的拉丁名和其他俗名,震惊!
鱼种:几乎全是白条鱼(学名䱗,Hemiculter Leucisculus,俗称餐条、青鳞子、游刁子)
如何体验? 虽然豆包专业版-办公模式、TRAE、TRAE WORK、扣子都上线了 Seed-2.1-Pro。
但企业和专业用户一般会接 API,在Claude Code等工具中使用。
为还原实际能力,避免产品系统提示词影响,上面测试都用是 CC Switch + 火山方舟 API ,终端用的 cmux。
写在后面 可能最近牛 X 模型太多了,豆包 Seed 2.1 Pro 感觉稍微有点中规中矩。
好消息是 Agent 能力达到可用线,常规编程、调工具、写文档、截图、生成电子书都能搞定,这对依赖 AI 工作流的人来说,体感差异很明显,且价格还不错。
最大惊喜来自多模态,至少我测试的场景,明显领先 Gemini 3.1 Flash。
等后面有空我再测下自动化视频剪辑,这个更考验多模态实力。
上面测试的 Skill 都是开源的,直接 npx skills add 就能用。
如果想在 Claude Code 中调用,直接去火山方舟申请 API 即可,已经全量开放。
前端网页开发 用大模型,很多时候是为了开发网站,前端网页开发能力多少得测下,提示词如下:
设计并实现一个面向 CFO 的「AI 财务预测平台」官网首页,要求包含首屏 Hero、可信客户 Logo、3 个核心卖点、一个实时财务预测仪表盘预览、客户证言、价格入口和 CTA。输出可运行的单文件 HTML/CSS/JS 或 React 组件。要求视觉风格接近 Linear/Stripe/Notion 的高级感,但不能照抄任何品牌。
界面简洁清晰,提示词遵循也不错,图表展示效果不错,但整体中规中矩,算符合超预期。
https://www.32kw.com/view/ed38b2d
后台功能开发 身边 AI Coding 厉害的朋友,现在都是用文档驱动开发(Spec开发)。
先让 AI 生成需求文档,自己检查没问题后,丢给 AI 开发即可。
最常见案例就是开发个 CMS(内容管理系统),大部分网站基础就是这个,复杂点会加上注册登录、用户权限管控、页面SEO页面优化、Rest API 等。
试下 Seed 2.1 Pro 是否能完美执行这套工作流:
Seed 2.1 Pro 选择了 nextjs 框架、sqlite数据库,还设计了 REST API 接口。
5 分钟左右完成开发,增删改查正常,功能完全符合文档要求,除界面不够 fancy,挑不出别的问题。
这么看,一些常规编程任务也可以用 Seed 2.1 Pro 了。
生成炸裂标题 不是人人都需要编程,但日常写文章,取个标题,是最常见不过的任务。
大聪明(赛博禅心)一直跟我说,做自媒体要研究新智元。
新智元发布了5000多篇文章,让 AI 分析了 2688 篇,提炼了一套新智元标题生成 Skill
npx skills add joeseesun/qiaomu-xinzhiyuan-title
虽然用 Prompt 也能生成标题,但用 Agent 能读取飞书、公众号页面,再参考 Skill 的 Reference 文档,生成标题质量更稳定、更轻松。
用新智元标题Skill生成10个候选标题,读取这里的内容:https://mp.weixin.qq.com/s/a-eevQvWVAYwZQeFi1ZomA
没想到老实巴交的豆包 Seed 2.1,也能瞬间变标题党,相当炸裂!
竞品调研报告 很多人的日常工作,经常要做一些产品分析调研,把下面提示词发给 Seed 2.1 Pro:
调研 3 个「AI 会议纪要工具」的官网、价格、核心功能、集成生态、隐私合规表述和用户评价。输出一张竞品矩阵,并给出面向中小企业的 MVP功能优先级、差异化定位和 90 天 Roadmap。
生成内容很长,我补了一句:"写入飞书文档",精准调 lark-doc 写入文档,效果如下:
直接抓取被拦截时,还会调用 Playwright 读页面获取信息。
生成信息卡图 将任意文本或链接一键转化为杂志质感信息卡片,自动截图输出图片,适合分享到 X、小红书、微信。
npx skills add joeseesun/info-card-designer
然后把开篇的微信文章发给 Seed 2.1 Pro,提示词:
读取 https://mp.weixin.qq.com/s/a-eevQvWVAYwZQeFi1ZomA 用信息卡skill生成卡片
默认生成了蓝紫渐变图 😂 ,让它调整生成白色简洁风格信息图。
制作电子书 互联网上有些博客写的非常好,很值得做成 epub 电子书,导入微信读书随时看。
npx skills add joeseesun/qiaomu-epub-book-generator
此任务可以测试 Seed 2.1-pro的 Skill 调用和执行能力,提示词很简单:
抓取 Paul Graham 最新 x 条博客,用乔木 epub 制作 skill 生成epub电子书
还能遵循 Skill 封面设计规范,先设计网页,再调用 Playwright 截图,生成电子书封面。
拍照识鱼 乔帮主作为钓鱼佬,最近在开发一款自用 iOS App。
产品需求:拍照后 AI 自动读取相片 exif 信息记录钓点,同时识别渔获,什么鱼种,有几条。
之前测试 Gemini 3.1 Flash,竟把白条识别成"泥鳅",非常恼火。
听火山发布会说 Seed 2.1 Pro 多模态不错。
抱着试试看心态,给了一张没抹去 exif 信息的图片,输入提示词:
读取这张图片的地理位置信息,并识别图中有几条鱼,什么鱼
结果让人感动,不仅调用 exif 工具读取了图片地理位置(温榆河),还准确识别了鱼种和数量。
连泥水中看不太清楚的两条都识别到了,还给我科普了白条的拉丁名和其他俗名,震惊!
鱼种:几乎全是白条鱼(学名䱗,Hemiculter Leucisculus,俗称餐条、青鳞子、游刁子)
如何体验? 虽然豆包专业版-办公模式、TRAE、TRAE WORK、扣子都上线了 Seed-2.1-Pro。
但企业和专业用户一般会接 API,在Claude Code等工具中使用。
为还原实际能力,避免产品系统提示词影响,上面测试都用是 CC Switch + 火山方舟 API ,终端用的 cmux。
写在后面 可能最近牛 X 模型太多了,豆包 Seed 2.1 Pro 感觉稍微有点中规中矩。
好消息是 Agent 能力达到可用线,常规编程、调工具、写文档、截图、生成电子书都能搞定,这对依赖 AI 工作流的人来说,体感差异很明显,且价格还不错。
最大惊喜来自多模态,至少我测试的场景,明显领先 Gemini 3.1 Flash。
等后面有空我再测下自动化视频剪辑,这个更考验多模态实力。
上面测试的 Skill 都是开源的,直接 npx skills add 就能用。
如果想在 Claude Code 中调用,直接去火山方舟申请 API 即可,已经全量开放。