卡内基梅隆大学(CMU),那些经受住时间考验的机器学习论文–第一弹:互联网拓扑规律研究

这一期,接着上一期,开始我们的卡内基梅隆大学(CMU)机器学习论文之旅。

CMU果然是机器学习的牛叉大学(拥有专门的机器学习专业系)。David 9翻看所有获得“Test of Time Award”(经得住时间考验奖)的论文,没有一篇论文是应用型,全部是奠基类的基础研究文章,不得不赞叹才疏学浅啊。先来获奖看一下列表:

  1. Graphs over time: densification laws, shrinking diameters and possible explanations [.pdf]
    Jure Leskovec, Jon Kleinberg, Christos Faloutsos, Test of Time Award, KDD 2016
  2. Dynamic Topic Models [.pdf]
    John Lafferty, David Blei, Test of Time Award, ICML 2016
  3. Realistic, Mathematically Tractable Graph Generation and Evolution, Using Krinecker Multiplication [.pdf]Jure Leskovec, Deepayan Chakrabarti, Jon M. Kleinberg, Christos Faloutsos, Test of Time Award, ECML/PKDD 2015
  4. Beyond Independent Relevance: Methods and Evaluation Metrics for Subtopic Retrieval [.pdf]
    Cheng Zhai, William Cohen, John Lafferty, Test of Time Award, SIGIR 2014
  5. Diffusion Kernels on Graphs and Other Discrete Input Spaces [.pdf]Risi Kondar and John Lafferty, Test of Time Award, ICML 2012
  6. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data [.pdf]
    John Lafferty, Andrew McCallum, and Fernando C. N. Pereira, Test of Time Award, ICML 2011
  7. On Power-Law Relationships of the Internet Topology [.pdf]Michalis Faloutsos, Petros Faloutsos and Christos Faloutsos, Test of Time Award, ACM SIGCOMM 2010
  8. Integration of heterogeneous databases without common domains using queries based on textual similarity [.pdf]William Cohen, Test of Time Award, ACM SIGMOD, 2008

David 9发现一个规律,里面几乎所有论文都和“”有关系啊,看来CMU对Graph研究很热衷啊? 继续阅读卡内基梅隆大学(CMU),那些经受住时间考验的机器学习论文–第一弹:互联网拓扑规律研究

#12 机器学习能力自测题—看看你的机器学习知识能打几分?不容错过的机器学习试题与术语

一直苦于没有办法自测一下机器学习知识掌握程度,最近看到一篇Ankit Gupta写的博客Solutions for Skilltest Machine Learning : Revealed。有40题机器学习自测题,马上可以看看你的机器学习知识能打几分?顺便还能查漏补缺相关术语,以及SVM, 隐马尔科夫, 特征选择, 神经网络, 线性回归等众多知识点.

以下是试题, 附答案:

Q1:在一个n维的空间中, 最好的检测outlier(离群点)的方法是:

A. 作正态分布概率图

B. 作盒形图

C. 马氏距离

D. 作散点图

答案:C

马氏距离是基于卡方分布的,度量多元outlier离群点的统计方法。更多请详见:这里和”各种距离“。

 

Q2:对数几率回归(logistics regression)和一般回归分析有什么区别?: 继续阅读#12 机器学习能力自测题—看看你的机器学习知识能打几分?不容错过的机器学习试题与术语

机器学习美国哪家强? 卡内基梅隆(CMU)?斯坦福? 伯克利? 哥伦比亚? MIT?威斯康星?

最近看到一篇Quora很好地解答了机器学习界的知名高校相关问题。机器学习究竟美国哪家强? 卡内基梅隆(CMU)?斯坦福? 伯克利? 哥伦比亚? MIT?还是威斯康星?总结了所有评论,这几个名校都有大牛潜伏,但是值得注意的是,CMU有一整个机器学习系,是一个巨大的团体,其它大学也有很强的小团队, 但是团队比较小,要谨慎选择自己的感兴趣点。来看下面一些的评论:

Jordan Boyd-Graber, CS计算机教授的回答:

首先,我在我的答案可能会有一些语言偏差; 我可能会给机器学习和语言学的交叉学科更高的优先级。

其他人给出了明显的答案:斯坦福,伯克利,CMU,哥伦比亚大学,UW和麻省理工学院。这些大学本身在一个类别中。

在下一层级有许多人(没有特定的顺序):TTI,Alberta,UBC,Madison,Edinburgh,Duke,UT Austin,马萨诸塞,密歇根,U Penn,ETH,UCSC,霍普金斯,多伦多,UCSD,布朗, ,Georgia Tech,Cambridge,MPI Tuebingen,UCL,Oxford,Cornell。几个非常好的教授和良好的记录,出色的博士学生。还有一些我忘了(对不起!)。

但是,正如其他评论者所说,个人喜好和适应,以及一个顾问,比其他事情重要。有很多伟大的教授是他们领域的世界专家,他们不在机器学习的大阵营(例如,加州理工学院的Yisong Yue,麦格理的Mark Johnson)。底线是找到教授,去任何地方,做你想做的工作。

最后,如果我没有提到马里兰州和科罗拉多州,他们有很好的招聘记录教授乔丹·博伊德·格拉伯,这是我认为比较大学的最重要的标准。

Igor Markov, Michigan EECS教授- 目前在Google的回答

CMU有一个整个的机器学习系 – 这点很难与之竞争。 伯克利是强大的,主要是由于与统计学的密切关系(Michael Jordan+更多)。 在麻省理工学院,纽约大学,普林斯顿,多伦多和加州理工学院有非常强但很小的机器学习小组(这些信息可能会因聘请新教授而过时)。 斯坦福大学有几个有名的研究人员,但是小组不大(Sebastian Thrun和Andrew Ng不在那里了)。

密歇根现在有一个相对较大的ML组通过CSE和ECE传播 – 部分通过最近招聘— Clay Scott @ ECE,Laura Balzano @ ECE,Honglak Lee @ CSE,Jake Abernethy @ CSE等等,部分通过更多 (Satinder Baveja),部分是因为在相关领域的研究人员/教授在应用ML到网络,信号处理,机器人感测和导航等方面具有强大的专业知识(Mingyan Liu,Al Hero,Ed Olson等)。

继续阅读机器学习美国哪家强? 卡内基梅隆(CMU)?斯坦福? 伯克利? 哥伦比亚? MIT?威斯康星?