如果不能像上帝那样创造, 那么就试着模仿吧 — David 9在哪听过
ICLR我们知道ICLR的中文全称是:国际学习表征大会。今天讲的文章就非常贴合学习表征这一主题 。我们知道哺乳动物海马体中的内嗅皮质(entorhinal cortex),简称EC,是神经科学中公认的管理空间定位的器官:
而2013《自然》上发表的一篇论文更是研究了内嗅皮质中细胞活跃度和动物所处空间位置的关系:
上图是内嗅皮质中的几种细胞在方块空间坐标中的活跃度(红色代表相当活跃)。有些叫做grid cell(格子细胞),它们在空间中间隔的地方总是显得较活跃;有一些细胞叫border cell(边缘细胞),当动物走到区域边缘时,这些细胞显得相当活跃。
这些各有功能的细胞结合起来,就构成了哺乳动物的空间感。
这对于我们创造算法高效地编码空间位置提供了启示。
这篇送审ICLR2018的论文恰巧发现了RNN单元在训练中与内嗅皮质细胞表征的一致性,即,用RNN训练出的定位模型,其中的RNN 单元(unit)的活跃度也会随着空间位置呈现网格状(grid like), 是不是很神奇:
先让我们看看论文的实验方法:
论文用了典型的RNN模型, 输入是当前模拟动物的速度和方向,输出是预测的当前空间位置坐标(x轴,y轴),当然,在训练时模拟动物是不能超出训练区域边界的。(如右图为正方形区域)
RNN的训练就是用来预测右图中的动物轨迹坐标。
其中, RNN的内部使用100个RNN单元(unit)(上图没有真的画100个unit蓝球)。
一个类似RNN的门限单元长啥样?我们可以回顾一下LSTM单元:
关键点是最后一个式子:
每次输出是上次的记忆值ht-1 和当前的计算ht 的结合,所以总是有人会说rnn有记忆能力。
注意,论文中的更新式子有些不一样,每个rnn单元之间的连接交互非常多:
上式的当前计算包含了较多内容,有其他rnn单元的激活值输入:
也有当前的外部输入(方向,速度):
还加入了一些偏置和噪音:
论文rnn模型就啰嗦到这里,接下来我们看看最让人兴奋的实验结果:
记得刚才说的100个RNN中的单元(units)吗?如果我们训练模拟环境是正方形,上图就是每个RNN单元(unit)在正方形环境中的激活情况图 (rnn unit激活值越大,颜色就越是黄色)
这与脑神经科学家发现的网格状细胞激活情况是一致的 ! 同时RNN展现的高级感知能力也令人震惊,可能在某些高级应用上超越CNN。
这或许说明我们用rnn去构建空间定位算法可能是一个好路子 , 但是这一研究才刚刚开始,要呈现上述的网格化激活图,并不是那么简单(需要加入正则约束),文章只是一些初期的发现,并不知道真正的原因和背后的理论。
比如,文章发现要经过较长时间的训练才能达到网格状的激活状态:
蓝色是训练前期的rnn单元激活状态,这是他们多呈现边缘化的激活状态。
当经过一定时间训练后,它们才变为网格化的激活状态(右图黑色连线连接的右上方点)。
另外,文章还发现激活强度和运动速度多呈线性,因运动方向扰动较大:
上述是在三角形场地实验图,文章较多的是一些实验观察到的发现,但是启发性确实不容小觑。
2018年4月16日更新,
该引用的论文来自纽约大学,ICLR 2018
参考文献:
- https://openreview.net/pdf?id=B17JTOe0-
- https://zh.wikipedia.org/wiki/%E6%B5%B7%E9%A9%AC%E4%BD%93
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3565234/
本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创,如需转载,请联系微信: david9ml,或邮箱:yanchao727@gmail.com
或直接扫二维码:
David 9
Latest posts by David 9 (see all)
- 修订特征已经变得切实可行, “特征矫正工程”是否会成为潮流? - 27 3 月, 2024
- 量子计算系列#2 : 量子机器学习与量子深度学习补充资料,QML,QeML,QaML - 29 2 月, 2024
- “现象意识”#2:用白盒的视角研究意识和大脑,会是什么景象?微意识,主体感,超心智,意识中层理论 - 16 2 月, 2024