7 月 2017 | David 9的博客 --- 不怕"过拟合"

CVPR 2017论文精选#2 密集连接的卷积网络DenseNet（Best paper award 最佳论文奖）

如果大脑中的每个神经元都代表一些训练参数，那么，我们在不断的学习过程中，现有的神经元够用吗？大脑是如何优化参数效率的？ — David 9

这届CVPR上的两篇最佳论文中, David 9更欣赏康奈尔大学和清华大学的密集连接卷积网络DenseNet（Densely Connected Convolutional Networks） , 内容有料，工作踏实！我们在之前文章就提到，模型泛化能力的提高不是一些普通的Tricks决定的，更多地来源于模型本身的结构。

CNN发展至今，人们从热衷于探索隐式正则方法（Dropout, Batch normalization等等），到现在开始逐渐关注模型本身结构的创新。这是一个好现象。

密集连接卷积网络DenseNet正是试图把跳层连接做到极致的一种结构创新：

图1-密集连接模块，来自：https://arxiv.org/pdf/1608.06993.pdf

跳层连接方法是对中间层输出特征图信息的探索，之前的ResNets和Highway Networks都曾使用，把前层的输出特征图信息直接传递到后面的一些层，可以有效地提高信息传递效率和信息复用效率。继续阅读CVPR 2017论文精选#2 密集连接的卷积网络DenseNet（Best paper award 最佳论文奖）

CVPR 2017论文精选#1 用模拟+非监督对抗生成图片的增强方法进行学习（Best paper award 最佳论文奖）

人类的想象力似乎是天生的, 而现今计算机的”想象力”来自”数据增强”技术. — David 9

这届CVPR上, 苹果为博得AI界眼球, 竟然拿到了最佳论文 ! 也许这篇论文没有什么深远意义，也许只能反映学术被业界商界渗透的厉害，也许有更好的文章应该拿到最佳论文。

这又何妨, 历史的齿轮从来不会倒退, David 9看到的趋势是, 人类越来越擅长赋予计算机”想象力”, 以GAN为辅助的”数据增强”技术是开始, 但绝不是终点 !

言归正传, 来剖析这篇论文, 首先，这篇文章的目标非常清晰，就是用非监督训练集，训练一个“图片优化器”（refiner），用来优化人工模拟图片，使得这一模拟图片更像真实图片，并且具有真实图片的独特属性：

如上图，人工模拟的伪造图片（Synthetic）经过优化器Refiner变得与非监督集合（第一行的3张图片）非常相似，极大的增强了模拟图片的真实性。继续阅读CVPR 2017论文精选#1 用模拟+非监督对抗生成图片的增强方法进行学习（Best paper award 最佳论文奖）

迁移学习101: Transfer learning, pretrained learning, fine tuning 代码与例程分析源码实践

目前的迁移学习太粗浅, 归因于我们对表征的理解太粗浅. 但这是一个好方向, 如果我们能从”迁移学习”上升到”继承学习”, 任何模型都是”可继承”的, 不用担心今天的模型到了明天就毫无用处, 就像人类的基因一代代地演变, 是不是会有点意思 ? — David 9

太多初学者总是混淆迁移学习和预训练模型, David 9一直想为大家区分两者, 其实迁移学习和预训练并不难区分:

把模型的所有参数保存起来, 都可以宽泛地叫做预训练, 所以预训练比迁移学习宽泛的多. 我们并不设限预训练的保存模型未来的用处 (部署 or 继续优化 or 迁移学习)
把预训练的模型用在其他应用的训练可以称为迁移学习.

迁移学习(Transfer learning) 的原理相当简单:

如上图, 复用之前预训练的复杂深度网络(第一行大蓝框), 我们复用倒数第二层对图像的输出特征作为新的训练输入.

使用这个输入, 我们再训练一个迷你的浅层网络(第二行绿底网络), 就可以应用在其他领域. 继续阅读迁移学习101: Transfer learning, pretrained learning, fine tuning 代码与例程分析源码实践

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31