AI+3D重建#2:端到端的360全景室内3D重建角点模型,AR、装修设计、室内导航

人类的出发点是因果,模型的出发点是数据 — David 9

没有上层逻辑(或reasoning)和自恰的抽象归纳,在这一点上深度学习只能沦为一般的“工具”。举例说这个360全景室内图的3D重建应用

来自:https://arxiv.org/pdf/1903.08094v2.pdf

如果要设计一个端到端的模型,应该把神经网络实际输出抽象成什么?也许只有像作者等领域专家才会想到分成两个图(角点图边缘图)去建立室内3D场景:

来自:https://arxiv.org/pdf/1903.08094v2.pdf

因为对于室内场景,把角点边缘线准确找到,再假设房顶和地面平行,就可以预测出比较好的3D模型盒子(box)了:

来自:https://arxiv.org/pdf/1903.08094v2.pdf

因此细想一下,AI专家系统的复兴是不是未来一个可以期待的方向?况且,David认为,论文中“reladted work”部分蕴含了大量人类探知知识的“因果”。

我们还是回到室内3D重建上来,该文章还有两个有意思的改进。

首先,对于挖掘轮廓信息,文章所用的CFL(corners for layout)也采用类似Unet的对称跳层连接

来自:https://arxiv.org/pdf/1903.08094v2.pdf

并且由上图可以注意到,在Decoder部分的较低像素层也采用了初步的预测反馈(preliminary predictions),保证在低像素阶段也在学习轮廓相关的信息。

其次,文章针对全景图片提出全景卷积(EquiConvs)的方式,如下图依次是一般卷积、变形卷积和全景卷积

来自:https://arxiv.org/pdf/1903.08094v2.pdf

为什么这种“扇形”卷积对全景图像适配性比较好呢 ?因为本质上360全景图像未展开时就是一个球体投影:

来自:https://arxiv.org/pdf/1903.08094v2.pdf

而如果要在球面上卷积,当球面展开为类似世界地图的长方形时,是不是就是相应的“梯形”卷积了:

来自:https://arxiv.org/pdf/1903.08094v2.pdf

值得注意的是文中也支持靠近边缘的卷积不需要做padding,因为如果有offset的话,卷积会自动去找另一端相连的像素(整个球体投影是收尾相连的)。

参考文献:

  1. Corners for Layout: End-to-End Layout Recovery from 360 Images
  2. https://github.com/cfernandezlab/CFL
  3. Equirectangular Projection(ERP)

本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创,如需转载,请联系微信: david9ml,或邮箱:yanchao727@gmail.com

或直接扫二维码:

发布者

David 9

邮箱:yanchao727@gmail.com 微信: david9ml

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注