【看车知政:李飞飞团队最新成果】识别谷歌街景中汽车图像,预测人口倾向


新智元AI World 2017世界人工智能大会开场视频


中国人工智能资讯智库社交主平台新智元主办的 AI WORLD 2017 世界人工智能大会11月8日在北京国家会议中心举行,大会以“AI 新万象,中国智能+”为主题,上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论,2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。


全程回顾新智元AI World 2017世界人工智能大会盛况:


新华网图文回顾
http://www.xinhuanet.com/money/jrzb20171108/index.htm

爱奇艺
上午:http://www.iqiyi.com/v_19rrdp002w.html

下午:http://www.iqiyi.com/v_19rrdozo4c.html

阿里云云栖社区
https://yq.aliyun.com/webinar/play/316?spm=5176.8067841.wnnow.14.ZrBcrm










  新智元编译  

来源:Stanford News

编译:常佩琦


【新智元导读】李飞飞领导的斯坦福大学视觉研究室近期将人工智能的研究成果应用到人口统计学中。研究人员通过算法对谷歌街景图像中各社区的汽车类型和位置数据进行分析,在此基础上可为人口统计提供重大参考,。利用谷歌街景的人工智能算法分析几乎可以实时生成分析结果,相较社区调查优势显著。




"You are what you drive."


从低调的宾利到实用的皮卡,美国人认为你所开的汽车就代表了你的个性。俗话说,"You are what you drive." 斯坦福的研究人员把这句话提升到了一个新的高度。


斯坦福研究人员使用具有视觉和学习能力的算法分析了Google街景视图上的数百万个公开可用的图像。研究人员说,只要看看街上的汽车,。

 

“与通过人口普查花费数十亿美元才能获得的信息相比,我们使用容易获得的视觉数据就能对社区有更深的了解。更重要的是,这项研究打开了更多的可能性。有时通过成本很低的视觉数据就能对社会进行持续研究。” 斯坦福大学计算机科学副教授、斯坦福大学人工智能实验室主任李飞飞在实验室表示。


李飞飞是计算机视觉和深度学习方面的专家。这是人工智能的分支,计算机教自己别二维图像中的三维物体。用李飞飞的话来说,计算机能看见了。

 

算法经过训练,或者更准确地说,算法进行自我训练,以识别谷歌街景中来自200个美国城市的5000多万份图像中,自1990年以来生产的每辆汽车的样式、型号和年份。


然后将有关汽车类型和位置的数据与当前最全面的人口数据库、美国社区调查和总统选举投票数据进行比较,以预测种族、教育、收入和选民偏好等人口因素。


李飞飞及团队发现了汽车、。作者在11月28日发表在《美国国家科学院学报》上的论文中论述到,社会联系“简单而强大”。


例如,如果一个社区的轿车数量大于皮卡的数量,那么该地区有88%的可能性会投票给民主党。如果皮卡的数量大于轿车,则该选区投票给共和党的可能性是82%。



为人口调查提供更及时、持续的补充


,研究人员认为他们的算法可以为当前的人口统计调查提供更及时和持续的补充。美国社区调查每年要花费2.5亿美元来进行上门调查。即便成本如此之高,数据收集和出版之间也有两年甚至更久的延迟,小城市和农村地区情况更糟。


相比之下,李飞飞的工作建立在谷歌街景构建的公开且定期更新的图像数据库上,能够近乎实时地生成分析结果。


该论文的第一作者、李飞飞实验室的一位前成员Timnit Gebru说:“我不认为这样做能够取代美国社区调查,这是保持数据持续更新的一种补充方法。” Gebru现在是微软研究院人工智能小组FATE的博士后研究员。


Gebru说,要实现这一点并不容易。该团队首先必须手动构建自1990年以来所有汽车的图像数据库(包括年份、品牌、型号、装饰包装),然后教计算机识别汽车之间的细微差别,尤其是从模糊、奇怪的角度。


识别细微差别


他们从汽车销售网站Edmunds.com里1.5万辆汽车的数据库着手做起,但这只是一个开始。接下来,研究员必须一个接一个地把汽车分类为最细微的细节。例如,2007年和2008年的本田雅阁之间的差异是后尾灯几乎不可察觉的变化。


该算法运行速度很快,仅用了两周的时间,就按照品牌、型号和年份,将5000万张图像中的汽车分类为2657个类别。如果让人类来做这件事,按照一个人每分钟识别六个图像的相对较高速度,也需要15年时间才能完成相同的任务。


Gebru说,研究组以外的一些人持怀疑态度。他们指出,拍摄时间的不一致可能会影响交通流量模式和车辆构成。Gebru补充说,为了避免交通堵塞,许多街景图像是在凌晨拍摄的,这样图像拍摄时间相对一致。她表示,无论交通状况如何,图像都提供了有价值的数据。


Gebru说:“如果你在一个社区走动,看那里的车辆,有时交通密度数据和你在街道上看到的汽车类型一样有价值。“我们可以在算法中使用所有这些信息。”


Gebru对她的新应用寄予厚望。她期待超越人口统计学,使用视觉图像分析来改善对偏僻地区的调查,或做一些其他有益于社会的工作,如监测二氧化碳水平和缓解交通堵塞。


李飞飞表示同意。她说:“这可以帮助我们理解社会如何运作、人们需要什么,以及如何改善生活。以建设性的、充满慈悲的方式来使用计算机视觉技术,潜力将会非常巨大。


10月31日,李飞飞到访新智元并接受新智元创始人兼CEO杨静专访。



论文摘要




“美国每年在美国社区调查(ACS)上的花费超过2.5亿美元。这是一项劳动密集型的上门调查,用于衡量与种族,性别,教育,职业,失业和其他人口因素有关的统计数据。虽然这是一个全面的数据来源,但是人口统计变化与其在ACS中出现的时间之间,可能会有超过几年的时滞。随着数字图像变得无处不在,机器视觉技术不断完善,自动化数据分析可能成为ACS的补充。在这里,我们提出一种方法,通过使用谷歌街景车收集的5000万张街景,来估计跨越美国200个城市地区的社会经济特征。使用基于深度学习的计算机视觉技术,我们确定了在特定社区看到的所有汽车的品牌、型号和年份。这次统计总计2200万辆汽车(占美国所有汽车数量的8%)的汽车普查数据被用来准确估算某一选区的收入、种族、教育和投票模式。 (美国的平均选区大约有一万一千人。)由此产生的关联简单而强大。例如,如果在开车穿过一个城市的过程中遇到的轿车数量高于皮卡车的数量,那么在下次总统选举期间,这个城市可能会投票给民主党的几率为88%。相反,投票给共和党的几率是82%。我们的研究结果表明,用于监测人口统计学的自动化系统可以有效地补充劳动力密集型方法,并有可能以接近实时的精细空间分辨率来测量人口统计特征。”


作者:Timnit Gebru, Jonathan Krause, Yilun Wang, Duyun Chen, Jia Deng, Erez Lieberman Aiden, and Li Fei-Fei.


原文地址:https://news.stanford.edu/2017/11/28/neighborhoods-cars-indicate-political-leanings/

论文地址:http://www.pnas.org/content/early/2017/11/27/1700035114.full.pdf