Pycon 2016 tensorflow 研讨会总结 — tensorflow 手把手入门 #第二讲 word2vec

上一期我们讲到Pycon 2016 tensorflow 研讨会总结 — tensorflow 手把手入门 #第一讲 . 今天是我们第二讲, 来趴一趴word2vec.

什么是word2vec?

用来学习文字向量表达的模型 (相关文本文字的的特征向量).

向量空间模型解决了NLP中数据稀疏问题, 如果文字是离散的. 即, 把文字映射到相邻的空间点上.

立刻上图感受一下word2vec:

这里看看与文字’Cat’接近的词汇, 一目了然啊~如果一定要给’cat’一个向量描述, 上图左边这一列特征和权重是不是挺合理的呢? 嘿嘿~~~

word2vec两种方法:

基于计数的(如, LSA)
预测型的: 试着用学习到的embeddings在相邻文字中预测文字(如, word2vec 和其他神经概率语言模型)

Mikolov等人的NIPS论文, http://bit.ly/word2vec-paper

两种word2vec

连续Bag-of-Words (COBW)
- 从上下文来预测一个文字

Skip-Gram
- 从一个文字来预测上下文

使得word2vec可扩展

使用对数回归把文字从假造的噪声文字中区分出来, 而不是使用完全的概率模型.
噪音对比估计(NCE) 损失.
- tf.nn.nce_loss()
- 用噪音文字扩展

afda

Skip-Gram 模型(用目标文字预测上下文)

上下文/目标文字组合, 双向窗口大小为1:

the quick brown fox jumped over the lazy dog … →
([the, brown], quick), ([quick, fox], brown), ([brown,
jumped], fox),

输入/输出组合:

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Pycon 2016 tensorflow 研讨会总结 — tensorflow 手把手入门 #第二讲 word2vec

什么是word2vec?

两种word2vec

使得word2vec可扩展

Skip-Gram 模型(用目标文字预测上下文)

上下文/目标文字组合, 双向窗口大小为1:

输入/输出组合:

word2vec Tensorflow代码实例

参考文献

David 9

Latest posts by David 9 (see all)

发布者

David 9

《Pycon 2016 tensorflow 研讨会总结 — tensorflow 手把手入门 #第二讲 word2vec》上有1条评论

发表回复取消回复

什么是word2vec?

两种word2vec

使得word2vec可扩展

Skip-Gram 模型(用目标文字预测上下文)

上下文/目标文字组合, 双向窗口大小为1:

输入/输出组合:

word2vec Tensorflow代码实例

参考文献

David 9

Latest posts by David 9 (see all)

发布者

David 9

《Pycon 2016 tensorflow 研讨会总结 — tensorflow 手把手入门 #第二讲 word2vec》上有1条评论

发表回复 取消回复

发表回复取消回复