首页未分类搜狗互联网图片库2.0(SogouP2.0)发布及下载地址站长QQ:926563750

浏览

0

回复

搜狗互联网图片库2.0(SogouP2.0)发布及下载地址

作者:cvchina | 分类:未分类 | 标签:
搜狗互联网图片库2.0(SogouP2.0)正式发布: 1000万张图片,200万组图片源,2T数据规模,包括原图文件、URL、所在网页的URL、所在网页中的Surrounding Text文本、同主题系列图片等信息。


图片库还包括了一个识图搜索结果人工标注集合,用于训练和评测。


介绍及下载地址http://www.sogou.com/labs/dl/p2.html。现在开始接受在线申请。


以下为搜狗老大对该库特点的简单说明:
@茹立云:终于正式发布了,说一下这个数据集的一个特点吧:平均每张图片有5张左右的同源图片(被不同互联网页面引用,可能会被打上水印或切割或某种程度的转换),对于图片滤重、图片标注等工作是非常有价值的。(今天 14:53)


@茹立云 第二个特点:所有数据都来自真实网络环境的真实抽样,通过搜狗识图技术为基础,以200万左右的随机query找到匹配的同源图片和同主题图片,从而最终构建出一个1000万的图片数据集,使得做识图类研究工作跟数十亿数据集上基本没有差别,从而一定程度上解决以前研究数据集偏小,抽样不合理导致的过学习问题(今天 14:59)


以上信息来自围脖http://weibo.com/2335069057


搜狗实验室网址:http://www.sogou.com/labs/  上面还有一些其它资源,可以点进去看一看哦


本文链接:http://cvchina.net/post/31.html
原创文章如转载请注明:转载自计算机视觉网-AI技术供需平台-计算机视觉论坛谢谢!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。