AYi@AYi_AInotes

2026-05-17 21:30·46天前

AI 摘要

开发者Dany Bittel通过6660张葡萄宏观照片，利用3D Gaussian Splatting技术训练出仅50MB的高保真3D模型，在手机上即可流畅查看半透明细节。该实验攻克了最难的半透明物体建模，证明技术可轻松应用于手办、珠宝等物品，将3D数字资产创建门槛从专业团队大幅降低至个人。其开发的miqula工具正推动该流程产品化。同时，这也反映了AI工具的普遍悖论：制作demo的门槛急剧降低，但实现稳定生产级应用仍需克服工程化挑战。

Damn，有点炸裂啊，一颗葡萄用了6660张宏观照片训练3DGS，

模型只有43万个高斯点，压缩完不到50MB，

但你可以在手机上看它360度旋转，连果肉里透出来的光都还原了，

更炸的是老哥回复里那句话，有人问底部怎么拍到的，他甩了张gif说"Like this"，

但玩笑归玩笑，真正重要的信息其实都藏在技术参数里： 90个焦点堆栈，每个74张，全角度覆盖，底部也拍进去了，

半透明物体是3DGS最难搞的测试对象，他偏偏选了最难的那个，逻辑也很简单：最难的通了，比它简单的任何东西就已经在射程之内了，

我理解这颗葡萄的本质不是炫技，而是一份写在技术参数里的产品化路线图，下一个被数字化的可能不是葡萄，可以是任何你舍不得让它烂掉的东西

逻辑很简单，如果连葡萄这种最难的都跑通了，比它简单的任何东西，手办、珠宝、人脸、文物，都已经在射程之内，

以前做这种级别的3D数字资产，需要专业扫描仪加建模师加后期手动修，成本和时间劝退绝大多数人，

现在这套流程是，宏观镜头加照片堆，进3DGS自动训练，出来就是20到50MB的可分发模型，

门槛从专业团队降到了一个人加一台相机，这是我觉得真正炸的地方，

Dany自己还在开发miqula工具，明显在把这套流程进一步封装成产品，他用一颗葡萄，相当于给整个行业画了一张产品化路线图。 https://x.com/DanyBittel/status/2055623109890253163/video/1

AYi说个所有AI创业者都不愿意承认的事实: 现在做一个AI工具的门槛已经降到了地板, 普通人做一个AI工具都只需要一天, 但学会用它干成一件事,却至少得一个月, 感觉像是AI时代的一个悖论😅 5.7M 阅读 23 万点赞的这条推,表面看是游戏圈在自嘲, 视频展示的是一颗树莓 237 万个高斯点,做一筐扔进游戏直接 2 F...

多模态现象/趋势

在 X 查看原推

AYi@AYi_AInotes · X

69导出 Markdown