#4 大话“奇异值”矩阵

“奇异值”的物理意义是什么?

矩阵的奇异值是一个数学意义上的概念,一般是由奇异值分解(Singular Value Decomposition,简称SVD分解)得到。如果要问奇异值表示什么物理意义,那么就必须考虑在不同的实际工程应用中奇异值所对应的含义。下面先尽量避开严格的数学符号推导,直观的从一张图片出发,让我们来看看奇异值代表什么意义。

这是女神上野树里(Ueno Juri)的一张照片,像素为高度450*宽度333。暂停舔屏先(痴汉脸)

7916513406802738740

继续阅读#4 大话“奇异值”矩阵

文本特征提取方法研究

一、课题背景概述

文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化的,而文档(web)都是半结构或无结构的。所以,文本挖掘面临的首要问题是如何在计算机中合理地表示文本,使之既要包含足够的信息以反映文本的特征,又不至于过于复杂使学习算法无法处理。在浩如烟海的网络信息中,80%的信息是以文本的形式存放的,WEB文本挖掘是WEB内容挖掘的一种重要形式。 继续阅读文本特征提取方法研究

8个学习pandas数据分析的超级资源

转自:Top 8 resources for learning data analysis with pandas

我最近发布了一系列关于“pandas”的视频,pandas是一个流行的python数据分析,控制和可视化的库。但是对于想要学习pandas的小伙伴,我已经准备了我的推荐列表:

  1. pandas数据结构入门: 这是Greg Reda的经典pandas教程三部曲的第一部, 第二部和第三部戳这里:第二部, 第三部 。它非常易读,对入门非常有益, 而且有很多有用的例子。
  2. Pandas简介 / 用Pandas折腾数据/ Pandas作图: 三个比较长但是写的很好、很好读的Jupyter notebook笔记,出自范德堡大学的Chris Fonnesbeck写的高级统计计算教程。 如果你想深入了解Pandas的细节和强大功能,这些笔记不容错过。

继续阅读8个学习pandas数据分析的超级资源