首页深度学习电脑视觉时代来临 深度学习演算法能预测照片的可记忆性站长QQ:926563750

浏览

0

回复

电脑视觉时代来临 深度学习演算法能预测照片的可记忆性

作者:cvchina | 分类:深度学习 | 标签:深度学习 

  一群来自美国麻省理工学院(MIT)电脑科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory, CASIL)的研究团队创造一个可以预测影像或照片中,让人容易忘记与记忆的区域。目前研究团队正在拟定以这项功能为原型,设计一个能够帮助使用者的照片调整成容易让人印象深刻的应用程序(app)。假如这款应用程序如期上架,将会对教学、行销和记忆领域有所帮助。

  数据集 LaMem 用热地图解密影像对于各张照片,“MemNet”演算法能让有兴趣的使用者在线上体验这项功能,并创造一个能辨识影像那些区域最能被记住的热力图(heat map)。“了解记忆特性能帮助我们系统捕捉最重要的资讯,或是储存人类有可能遗忘的讯息。”CASIL 研究生,以及这篇论文主要作者 Aditya Khosla 说道。这就像是有群焦点团体能立即告诉你人类是怎么去记忆视觉讯息。

  此外,团队成员也在构想多款潜在的应用程序,从改善广告内容和数码媒体照片,到发展更有效率的教学资源,甚至是创造个人的“健康助理”设备,提醒使用者要记住的事情。

  此外,研究团队也公布世界上数量最多的影像可记忆资料集(image-memorability dataset)LaMem。网站上有着大约 6 万张照片,每张都有关于影像详细的注释资料,像是受欢迎程度或是情绪影响。LaMem 是团队成员努力想更深一层探讨在电脑视觉的主题。

  LaMem 的相关成果将会撰写成论文,由 CSAIL 研究生 Akhil Raju 和教授 Antonio Torralba 和主要研究科学家 Aude Oiliva 共同完成,会由 Khosla 在智利国际电脑视觉会议(International Conference on Computer Vision),发布这篇论文。

  神奇的演算法?利用深度学习软件不过或许有人会质疑,真的有这么神奇的系统能够分辨照片的记忆区与遗忘区吗?的确,研究团已经发展一个为脸部记忆性运作的演算法。值得关注的是,不仅是这套新程序的辨识度能达到将近人类的准,它还使用“深度学习(deep-learning)”技术。深度学习软件是指在人工智能领域使用一款名为“神经网络(neural network)”系统,用来教导电脑筛选大量资料后,能自行找到型式和规律。像是,苹果的语音助理 Siri、Google 搜索的自动完成(auto-complete)和FaceBook(Facebook)照片标签功能都是利用这项技术,也使得这些科技巨擘愿意投资数亿资金在研究深度学习的创新公司身上。

  神经网络则是在没有人类给予任何指引情形下,能够独自处理相关联的数据。它们被安排在处理器的不同层阶中,而每一层阶都在连续执行数据上的随机运算。当神经网络收到越多数据后,会重新调整并产制更精确的预测。由此特性,研究团队研究团队喂养它的演算程序来自不同数据库、数千万的影像,包括 LaMem 和以风景导向的 Sun 和 Place。这些影像会基于人类在线上实验中对内容记忆程度,各自获得“记性成绩”。对于每张影像,演算程序会产生一张热地图,上面会显示哪些部分是影像最容易被记住的区域。藉由强调不同区域,它们具有提高影像记忆性的程度。

  未来希望能朝个人化与专门产业研究这项研究也意外的开启对人类记忆自然的研究。Khosla 表示:“如果人类只看到最容易记忆的影像,会不会就能记住任何事情呢?”我们一般会认为人类会如同往常一样,会适应和忘记许多事情,但他们的研究结果却显示相反情况。因此,Khosla 认为如果我们呈现难忘的影像,将有提升人类记忆的可能性。团队下一步的计划是希望提升系统技术,使能够预测特定某人的记忆以及为专门产业打造客制化系统,像是零售衣服商和标志设计。像这样的研究不但让科学家更了解人类会注意到哪些视觉资讯,也提供电影制片者和其他内容创作者一个新的探索方向。


本文链接:http://cvchina.net/post/157.html
原创文章如转载请注明:转载自计算机视觉网-AI技术供需平台-计算机视觉论坛谢谢!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。