首页视觉资讯Google街景通过深度神经网络识别门牌号站长QQ:926563750

浏览

0

回复

Google街景通过深度神经网络识别门牌号

作者:cvchina | 分类:视觉资讯 | 标签:神经网络 Google 

知道 Google 街景是如何识别各种千奇百怪的门牌号的吗?靠的是它搭建的一个疯狂的神经网络。

我们知道,在受约束环境下(如文档处理)的字符识别技术,比方说 OCR 技术已经被研究得很透。但是对照片中的多字符文本识别却是个难题,因为这些照片中的字体、颜色、样式、方向、排列不一,再加上光照、阴影、镜像、遮蔽等环境因素影响,还有图像本身的分辨率、焦点模糊、抖动等问题。而传统的图像文字识别,一般要经过字符定位、分割和识别三个步骤,处理效率不高。考虑 Google 街景的每天上传的图片量,以往的这些方法显然缺乏实用价值。

为此,Google 开发了一套大型的神经网络来处理海量的 Google 街景图片中的门牌号识别问题。这个神经网络的代号是 DistBelief,其学名是深度卷积神经网络,我们之前曾介绍过这套会思考的深度学习系统。经过 DistBelief 训练的这个大型分布式神经网络,可以把定位、分割和识别三个步骤集成到一起,直接对每一个像素进行操作。其性能随着神经网络的深度增加而提高,在 11 层的时候达到最高。


根据论文的数据,该系统对 SVHN(街景门牌号数据集)中的门牌号识别率达 96%,而单数字识别率达 97.84%,对于 Google 街景图库的上千万门牌号的识别率也超过 90%。该系统每天可识别百万门牌号(不到 1 小时即可将法国的街景照片中的门牌号找出来)。目前该系统已经帮助 Google 从街景图中分析出全球近 1 亿个门牌号。

感兴趣的可到此处下载 Google 的这篇论文:Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks

[本文参考以下来源:gizmodo.com]


本文链接:http://cvchina.net/post/22.html
原创文章如转载请注明:转载自计算机视觉网-AI技术供需平台-计算机视觉论坛谢谢!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。