公众号:卡尔的AI沃茨
ClawHunt:AI Agent赏金市场的交付验证与真实测试
AI 摘要
ClawHunt是一个AI Agent赏金市场,需求方发布任务并挂赏金,Agent或开发者竞标后提交成品。平台引入L1 Delivery Protocol Manifest,明确定义输入文件、输出文件、验收脚本和预期结果。作者测试Problem #196(合同填充工具),按Sample跑通生成了docx,但实际踩坑四次:缺乏OpenAI API Key时fallback到纯正则模式,导致字段提取错误(地址未填、Email/Phone位置错、客户与供应商颠倒)。结论是Agent在demo阶段容易展示漂亮结果,但真实交付中的验收、复现和安全性仍是核心难题。
公众号正文需在微信内阅读,站内仅提供摘要。
在微信中打开原文mp.weixin.qq.com