Python高级图像处理–反向图片搜索

David 9 博客没有专门分享过机器视觉,或者图像处理的文章,但是,上周2016年计算机识别大会(CVPR 2016)在拉斯维加斯举办了,借着这个契机我们分享一篇好文:Advanced Image Processing with Python ,希望大家喜欢。

建立图像处理搜索引擎不是一项简单的工作。 有太多的概念,统计,想法和技术需要深入。其中一个重要的图像处理概念是“反向图片查询” (RIQ) 或者说“反向图片搜索”。 谷歌,Cloudera,Sumo Logic和Birst是一些使用RIQ的知名组织。RIQ提供了好的方法去分析图像,并且利用数据挖掘。

知名公司和反向图片搜索

许多公司使用RIQ来达成他们的需求。比如Pinterest在2014年首次引入基于图像的搜索。随后在2015年出了白皮书展示架构。反向图片搜索使得Pinterest能够从时尚对象获得图像特征,并且展示相似产品推荐。

众所周知,谷歌反向图片搜索使得用户可以上传一张图片,然后搜索类似图片。上传的图片经过分析和模型计算。图片与成千上万的图片做对比然后匹配返回结果。

这里是一张来自OpenCV2.4.9的特征对比报告:

search-engine-graph

算法和Python库  

在我们开始工作前,让我们来看看Python图像处理搜索引擎的主要元素。

专利算法

SIFT(Scale-Invariant Feature Transform)弹性不变特征转换算法

  1. 专利收费算法,可以用图片识别器识别相似图片,甚至可以从不同角度,尺寸,深度和拉伸识别搜索结果。在这里你可以查看详细视频。
  1. SIFT在一个大的数据库特征上非常多的图片都正确地达到了一定搜索精度。

继续阅读Python高级图像处理–反向图片搜索

重要python工具-代码质量篇

作为一名开发者,无论是不是在IDE或者命令行,你应该使用那些有用的工具库武装自己。如果你没有考虑代码干净、可读和可维护性,你就很可能看不到一些工具的好处。

python禅道

% python -m this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
...

继续阅读重要python工具-代码质量篇

8个学习pandas数据分析的超级资源

转自:Top 8 resources for learning data analysis with pandas

我最近发布了一系列关于“pandas”的视频,pandas是一个流行的python数据分析,控制和可视化的库。但是对于想要学习pandas的小伙伴,我已经准备了我的推荐列表:

  1. pandas数据结构入门: 这是Greg Reda的经典pandas教程三部曲的第一部, 第二部和第三部戳这里:第二部, 第三部 。它非常易读,对入门非常有益, 而且有很多有用的例子。
  2. Pandas简介 / 用Pandas折腾数据/ Pandas作图: 三个比较长但是写的很好、很好读的Jupyter notebook笔记,出自范德堡大学的Chris Fonnesbeck写的高级统计计算教程。 如果你想深入了解Pandas的细节和强大功能,这些笔记不容错过。

继续阅读8个学习pandas数据分析的超级资源