机器学习中 有价值,高质量的数据集汇总 持续更新中…

巧妇难为无米之炊,没有有价值,高质量的数据集, 我们搞数据科学的怎么混呢?

今天David 9 把收集的机器学习中的高质量数据集晒一晒,以后也会持续更新:

1. 机器学习UCI数据库 :http://archive.ics.uci.edu/ml/

2. KDD cup竞赛数据集 : http://kdd.ics.uci.edu/

3. 明尼苏达大学整理的数据集http://dmr.cs.umn.edu/datasets.html

4. 华盛顿大学整理的数据集: http://www.cs.washington.edu/dm/vfml/

5. 预测者网,金融数据服务: http://yucezhe.com/product/home

6.  TuShare : 一个免费、开源的python财经数据接口包: http://tushare.waditu.com/index.html

7. Awesome public datasets: https://github.com/caesar0301/awesome-public-datasets

8. Google Public Datasetshttps://cloud.google.com/bigquery/public-data/#usa-names

9. /r/datasets : https://reddit.com/r/datasets

 

发布者

David 9

邮箱:yanchao727@gmail.com 微信: david9ml

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注