好奇心的本质探讨，元学习与增强学习的好奇 | David 9的博客 --- 不怕"过拟合"

与其说人类是智能“搜索”机，不如说人类是智能“贪婪”机— David 9

David最近在思考一个问题，表面上看所有智能问题都是“搜索”问题，包括今天我们讨论“好奇心”本质，也可以理解为对“好奇心”算法的搜索。

但是，人类仅仅是一台高级一点的“搜索机”吗？或者说除了“搜索”，“智能”(灵性)是否必须有一些其他重要属性比如“抽象能力”，“信息组织能力” ？换句话，仅仅用显式“搜索”构建的“智能”是不是“伪智能”？

事实上，今天我们探讨的这篇MIT在ICLR 2020的论文，就是这样一种“搜索”出来的“好奇心”。但是，这已经是当今一群聪明人可以设计的较好的“好奇心”机制了。

毫无疑问，好奇心是智能体主动探索外部环境，获取有用经验的驱动力。

在内部，MIT研究人员把“好奇心”设计为一种“代理回报”（proxy rewards）的机制:

在传统RL算法和外部环境之间又架了一层“好奇心”模块，模块返回的 $\hat{r}$ 是RL算法真正训练使用的回报。(并不直接使用环境回报r )。

这样对于RL算法，回报不再是“傻乎乎”地锚定某个特定环境，而是可以适应多个环境。事实上该论文的实验就是针对多个RL环境游戏的，如Grid World：

Lunar Lander：

AcroBot：

那么为了适应多个环境，“好奇心”模块又是怎么训练的呢？

为了同时适应多个环境，...阅读更多...加入David9的星球群阅读所有文章: 加入David9的星球群，获得通行密码 , 阅读全文
×用微信扫描并分享
The following two tabs change content below.
Bio
Latest Posts

David 9

邮箱：yanchao727@gmail.com 微信: david9ml

Latest posts by David 9 (see all)

修订特征已经变得切实可行， “特征矫正工程”是否会成为潮流？ - 27 3 月, 2024

量子计算系列#2 : 量子机器学习与量子深度学习补充资料，QML，QeML，QaML - 29 2 月, 2024

“现象意识”#2：用白盒的视角研究意识和大脑，会是什么景象？微意识，主体感，超心智，意识中层理论 - 16 2 月, 2024

发布者

David 9

邮箱：yanchao727@gmail.com 微信: david9ml 查看David 9的所有文章

发布于 24 6 月, 20208 8 月, 2020作者 David 9分类业界、增强学习、学术、算法

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

ICLR 2020论文精选：“好奇心”的本质探讨，元学习与增强学习(RL)的“好奇心”机制，好奇心算法搜索，智能体的适应力增强

...阅读更多...加入David9的星球群阅读所有文章:

David 9

Latest posts by David 9 (see all)

发布者

David 9

发表回复取消回复

...阅读更多...加入David9的星球群阅读所有文章:

David 9

Latest posts by David 9 (see all)

发布者

David 9

发表回复 取消回复

发表回复取消回复