开发者Dany Bittel通过6660张葡萄宏观照片,利用3D Gaussian Splatting技术训练出仅50MB的高保真3D模型,在手机上即可流畅查看半透明细节。该实验攻克了最难的半透明物体建模,证明技术可轻松应用于手办、珠宝等物品,将3D数字资产创建门槛从专业团队大幅降低至个人。其开发的miqula工具正推动该流程产品化。同时,这也反映了AI工具的普遍悖论:制作demo的门槛急剧降低,但实现稳定生产级应用仍需克服工程化挑战。
Damn,有点炸裂啊,一颗葡萄用了6660张宏观照片训练3DGS,
模型只有43万个高斯点, 压缩完不到50MB,
但你可以在手机上看它360度旋转, 连果肉里透出来的光都还原了,
更炸的是老哥回复里那句话,有人问底部怎么拍到的,他甩了张gif说"Like this",
但玩笑归玩笑,真正重要的信息其实都藏在技术参数里: 90个焦点堆栈,每个74张, 全角度覆盖,底部也拍进去了,
半透明物体是3DGS最难搞的测试对象,他偏偏选了最难的那个, 逻辑也很简单:最难的通了,比它简单的任何东西就已经在射程之内了,
我理解这颗葡萄的本质不是炫技,而是一份写在技术参数里的产品化路线图, 下一个被数字化的可能不是葡萄,可以是任何你舍不得让它烂掉的东西
逻辑很简单,如果连葡萄这种最难的都跑通了,比它简单的任何东西,手办、珠宝、人脸、文物,都已经在射程之内,
以前做这种级别的3D数字资产,需要专业扫描仪加建模师加后期手动修,成本和时间劝退绝大多数人,
现在这套流程是,宏观镜头加照片堆,进3DGS自动训练,出来就是20到50MB的可分发模型,
门槛从专业团队降到了一个人加一台相机,这是我觉得真正炸的地方,