国科大本科生以第一作者身份发表AAAI论文,用神经网络分析三维模型


新智元 AI World2017世界人工智能大会开场视频


中国人工智能资讯智库社交主平台新智元主办的 AI WORLD 2017 世界人工智能大会11月8日在北京国家会议中心举行,大会以“AI 新万象,中国智能+”为主题,上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论,2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。


全程回顾新智元AI World 2017世界人工智能大会盛况:


新华网图文回顾:
http://www.xinhuanet.com/money/jrzb20171108/index.htm

爱奇艺:
上午:http://www.iqiyi.com/v_19rrdp002w.html

下午:http://www.iqiyi.com/v_19rrdozo4c.html

阿里云云栖社区:
https://yq.aliyun.com/webinar/play/316?spm=5176.8067841.wnnow.14.ZrBcrm

  新智元报道  

来源:中国科学院大学,arXiv
作者:闻菲


【新智元导读】江山代有才人出,此前新智元报道过22岁复旦学生赢得世界深度学习竞赛冠军,日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文被 AAAI 2018接受。本科生以一作身份在国际顶会发表论文十分难得。论文描述了一种全新的基于网格的自编码器架构,能够处理具有不规则拓扑的网格,克服了传统机器学习方法无法对三维模型库进行智能分析的缺点。



中国科学院大学官方微信公众号消息,日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文《Mesh-based Autoencoders for Localized Deformation Component Analysis》,被计算机科学领域人工智能顶级会议AAAI录用,并将于2018年2月2日赴美作大会宣讲。


该研究成果是谈清扬同学在中国科学院大学博士生导师、中国科学院计算技术研究所夏时洪研究员领导的人体运动仿真课题组完成的。这是中国科学院大学首批本科生以第一作者身份在顶级国际学术会议发表论文,即便在美国麻省理工学院、普林斯顿大学等国际一流高校本科生中也属相当难得。



谈清扬同学参与了2016年度中国科学院大学生创新实践训练计划项目——基于RGBD相机的人体运动捕获,深入研究了其中的三维模型序列分析,具体由夏时洪研究员和高林副研究员指导完成。


三维模型序列分析在三维模型重建与建模中起到关键的作用,而传统的机器学习方法无法智能地对三维模型库进行合理的分析。该研究工作使用一种新的神经网络结构来对三维网格进行卷积操作,基于课题组前期研究的大尺度形变表示方法,通过在自编码器的网络节点上引入稀疏性约束来得到合理的局部的形变分量,从而可以帮助用户更加精确的编辑模型和根据外部约束进行重建


中国科学院大学计算机与控制学院首届本科生谈清扬同学


同时,谈清扬同学还完成了另一篇第一作者论文,“Variational Autoencoders for Deforming 3D Mesh Models“,目前正在审稿中。此前,谈清扬作为国科大首批访学麻省理工学院本科生,共选修4门专业课,成绩均为A,平均绩点达到5.0(麻省理工学院的GPA为5分制)。2014年,谈清扬从江苏南京师范大学附属中学考入国科大。


AAAI是人工智能领域的顶级国际会议(CCF A类会议),每年吸引世界各国数千名学者共同探讨人工智能发展前沿。AAAI 2018将于2月2日-7日在美国新奥尔良(New Orleans, Louisiana, USA)召开。本届会议论文录取率低于25%。


下面简单介绍论文及实验结果。


论文:用基于网格的自编码器进行局部形变组件分析


摘要


空间局部变形组件对于3D几何处理中的形状分析和合成非常有用。最近研究人员已经提出了好几种方法,旨在提取直观、可解释的变形部件。然而,这些技术存在重大局限(fundamental limitation),特别是对于具有噪声或大规模变形的网格而言,而且这些方法有可能识别不出重要的变形分量。


在本文中,我们提出了一种全新的基于网格的自编码器架构,能够处理具有不规则拓扑的网格。我们在这个框架中引入了稀疏正则化,和卷积运算一起帮助定位变形。我们的框架能够从具有大规模变形的网格数据集中提取局部变形分量,并且对噪声具有鲁棒性。使用提取出的基础,这个框架还提供了一个非线性的方法来重建网格,比当前的线性组合方法更加有效。大量的实验表明,我们的方法在定性和定量评估方面均优于最先进的方法。



上图展示了使用模型生成不可见数据(unseen data)的错误率,使用的数据集是(a) SCAPE(Anguelov et al.2005)和(b) (c) Swing(Vlasic et al.2008)。从上图可见,论文提出的模型(较为深的蓝线)在数据集和指标方面均优于其他方法。


下面这张图展示了使用有限控制点重建SCAPE(Anguelov et al. 2005)和Swing(Vlasic et al. 2008)数据集中不可见数据的泛化误差。同样,较深的蓝色代表论文提出的方法,误差相对其他是最低的。



在下面的对比中,上面一行是通过物理模拟创建的一个旗帜数据集的关键帧。下行是两种方法提取前四个变形分量的结果对比,左边是论文提出的方法。


通过结合这四个组件(权重相同),得出合成结果(下排蓝色的图像),作者展示了使用他们的方法得出的结果更加合理(与上排最右边的结果相比)。



论文地址:https://arxiv.org/pdf/1709.04304.pdf