从论文发布、学术会议到创业,斯坦福发布了一份「AI指数」年度报告

人工智能一跃成为全球话语最前沿,吸引了从业者、政策制定者和大众的广泛注意。剥开热闹的表象,斯坦福大学基于数据追踪了人工智能的动态和进展。

选自斯坦福大学

机器之心编译


人工智能指数(AI Index)是一个追踪 AI 动态和进展非营利性的项目,由斯坦福大学创立,旨在研究过去百年来的 AI 总体状况,目标是促进基于数据的 AI 的广泛交流和有效对话。这是 AI Index 的首届年度报告,从多个角度观察和汇报了人工智能中的动态和进展。这篇报告中的所有数据将在网站 aiindex.org 上开放。


目录


简介


今年各种新闻中不同的见解和争论表明 AI 受到广泛的调查、研究和应用。但是,AI 领域仍然在快速发展,甚至专家有时候都难以理解和追踪该领域的发展。没有 AI 状态的相关数据,我们就只能在与 AI 相关的交流和决策中盲目行动。


领域活力


学术


1. 论文发表数


下图统计了发表在计算机科学领域,且子领域或标签为「Artificial Intelligence」的论文数量。


自 1996 年,年 AI 论文数量增加了 9 倍多。


下图展示的是各个领域内的论文增长速度,其中我们可以看到计算机科学领域下的的 AI 论文自 2010 年起增速就已经大大超过了计算机科学领域的增速和平均论文发表的增速。此外,如图所示自 1996 年来,计算机科学领域的论文发表数增长了 6 倍,而 AI 领域的论文数增长了 9 倍。


2. 课程注册人数


除了论文发表数以外,课程的参与人数也能体现这个领域的活力。以下展示的是注册斯坦福大学人工智能与机器学习导论课程的学生数量。


本报告之所以突出斯坦福大学导论课程注册数,是因为这一部分的数据最全。不过如下所示,其它高校的导论课程参与趋势也与斯坦福的趋势相似。


此外,本报告还着重关注机器学习导论课程的参与度,因为目前人工智能领域很多成果都是基于机器学习的算法与理论。


3. 参会情况


以下展示了人工智能领域顶会的参与情况,其中既有如 AAAI、IJCAI 和 ICML 那样的综合性会议,也有像 CVPR、ACL、ICRA 那样关注于计算机视觉、自然语言处理和机器人的顶会。


上图的参会人数同样展示了研究前沿从符号推理转向了机器学习与深度学习。下图展示了参会人数少于 1000 人的小型学术会议,其中我们需要注意的是 ICLR,该会议专注于深度学习领域,且第一次会议于 2013 年由深度学习先驱 Yann LeCun 及 Yoshua Bengio 主办。


ICLR 第一次会议就表示尽管表征学习或深度学习对于机器学习及包括视觉、语音、音频及 NLP 领域起着至关重要的作用,但目前还缺乏一个场所让学者们交流分享该领域所关心的话题,ICLR 的宗旨正是提供这样的场所。如下图所示,ICLR 的参会人数每年都有很大的提升。



尽管注意力近年来转移到了机器学习以及深度学习,但根据这些会议的发展趋势,我们发现仍有一小部分研究者继续在符号推理方法上进行探索。


工业


1. AI 创业公司


下图展示了由风投资本支持并开发 AI 系统的美国活跃创业公司的数量。



这一数量自 2000 年以来增加了 14 倍。


2. AI 创业基金


下图为在所有融资阶段上风投资本每年投资美国 AI 创业公司的金额。


这一金额自 2000 年以来增加了 6 倍。


3. 工作机会


下图分别展示了两个在线招聘网站 Indeed 和 Monster 上需要 AI 技能的工作数量的增长数据。通过标题和工作描述的关键词区分出需要 AI 技能的工作。



自 2013 年以来,在美国需要 AI 技能的工作比重增长了 4.5 倍。


Indeed.com 平台上报告的多个国家需要 AI 技能的工作比重的增长趋势。



注:虽然在加拿大和英国 AI 就业市场增长很快,但是 Indeed.com (http://indeed.com/) 报告它们在绝对规模上仍然只有美国 AI 就业市场的 5% 和 27%。


Monster 平台发布的一年内 AI 工作机会总数,按照所需的特定技能划分。



注:一个 AI 相关的工作可能出现计算两次的情况(属于不同的类别)。如,一个工作可能需要自然语言处理和计算机视觉技能。


4. 机器人进口


船运到北美和全球的工业机器人数量。


船运到北美和全球的工业机器人数量增长趋势。


开源软件


GitHub 项目统计

GitHub 上 TensorFlow 和 Scikit-Learn 软件包被收藏(star)的次数。二者都是深度学习和机器学习的常用软件包。


GitHub 上不同 AI & ML 软件包被收藏的次数。



注:GitHub 库的 Fork 数量遵循几乎同样的趋势(尽管,每个库的 fork 量和 star 量不同)。


技术表现


计算机视觉


1. 目标检测


LSVRC 竞赛中 AI 系统在目标检测任务上的性能表现。



图像标注的误差率从 2010 年的 28.5% 降至低于 2.5%。


2. 视觉问答(Visual Question Answering)


在开放式回答有关图像问题的任务中,AI 系统的性能。


注:VQA 1.0 数据集已经被 VQA 2.0 数据集超越,目前尚不明确 VQA 1.0 数据集未来将受到多少关注。


自然语言理解


 1. 解析(Parsing)


AI 系统在确定句子的句法结构任务中的性能。


2. 机器翻译


英德新闻互译任务中,AI 系统的表现随年度变化如下:


 3. 问答(Question Answering)


从文档中找到问题答案的 AI 问答系统的年度表现变化如下:



4. 语音识别


语音识别 AI 系统的表现随年度变化如下:



报告全文链接:https://aiindex.org/2017-report.pdf,也可点击阅读全文查看