David的粉丝中不少是跨学科学习机器学习(深度学习)的。如何在自己的专业领域里上手数据科学和分析是我经常被问到的问题。
这里我总结一些简单的方法,帮大家快速自学。
1,多数跨学科朋友都不是CS计算机专业的,所以不要折磨自己在编程上,专注一个容易上手的流行语言如R,python,julia可以为你减轻编程负担,如果能力有限建议只精通其中一种语言。
2,立即上手。不要害怕有些编程思想和理论还没有掌握,这里的上手是让你快速了解你这个专业的数据科学家在做什么,用了哪些流行工具?渠道大概有下面3种:
1) 找到你们行业领域的热门竞赛(如推荐领域有亚马逊,Netflix办的竞赛),如果你实在找不到,可以看官方的数据科学竞赛如kaggle, 阿里天池,以生物学DNA测序为例:
直接在kaggle中搜索:“DNA sequencing”就可以得到许多相关信息:
进入到第一个果蝇基因组的数据你就可以看到已经有一些kernel代码可以直接跑了学习:
2) 除了各种竞赛,你还要了解行业中的标准数据集,要对数据集深入的见解,
加入David9的星球群,获得通行密码 , 阅读全文