巧妇难为无米之炊,没有有价值,高质量的数据集, 我们搞数据科学的怎么混呢?
今天David 9 把收集的机器学习中的高质量数据集晒一晒,以后也会持续更新:
1. 机器学习UCI数据库 :http://archive.ics.uci.edu/ml/
2. KDD cup竞赛数据集 : http://kdd.ics.uci.edu/
3. 明尼苏达大学整理的数据集:http://dmr.cs.umn.edu/datasets.html
4. 华盛顿大学整理的数据集: http://www.cs.washington.edu/dm/vfml/
5. 预测者网,金融数据服务: http://yucezhe.com/product/home
6. TuShare : 一个免费、开源的python财经数据接口包: http://tushare.waditu.com/index.html
7. Awesome public datasets: https://github.com/caesar0301/awesome-public-datasets
8. Google Public Datasets: https://cloud.google.com/bigquery/public-data/#usa-names
9. /r/datasets : https://reddit.com/r/datasets
David 9
Latest posts by David 9 (see all)
- 修订特征已经变得切实可行, “特征矫正工程”是否会成为潮流? - 27 3 月, 2024
- 量子计算系列#2 : 量子机器学习与量子深度学习补充资料,QML,QeML,QaML - 29 2 月, 2024
- “现象意识”#2:用白盒的视角研究意识和大脑,会是什么景象?微意识,主体感,超心智,意识中层理论 - 16 2 月, 2024