首页  >  院系科研动态  >  正文
电子系彭良瑞研究组古籍识别与深度学习研究成果获DAS2016最佳论文奖
2016-04-22 10:00:58      毛雪鸥 [     ]

近日,清华大学电子工程系彭良瑞副教授研究组在希腊召开的第12届文档分析系统国际研讨会(DAS 2016)上发表论文“基于卷积神经网络迁移学习的古籍汉字识别”,获得DAS 2016 最佳论文奖。论文第一作者博士生汤野骏出席会议并做口头报告,获得与会专家的好评。DAS 2016是国际模式识别学会主办的文字识别领域的国际学术会议,自1994年起,每两年举办一次。

古籍汉字识别是一种将古籍图像转换为可全文检索文本的技术,由于其技术难度大,传统的模式识别与机器学习方法尚未提供完善的解决方案。卷积神经网络是机器学习领域新兴的深度学习方法之一,通常训练一个较复杂的卷积神经网络需要数以百万计的海量标注样本数据,但是在缺乏具有类别标记训练样本的古籍汉字识别任务中,直接运用卷积神经网络无法获得较好的效果。论文所提出的方法先利用从现代印刷体繁体汉字样本集上训练得到的卷积神经网络参数,再辅以少量实际古籍汉字样本集进行迁移学习,最终得到适用于古籍汉字识别的模型。论文还对模型结构与参数、样本选取方案等技术要点进行了深入细致的分析。这一研究成果对于发展我国古籍全文数字化技术、进一步促进珍贵中华古籍资源的保护和利用具有重要意义。

 

DAS 2016 最佳论文奖证书

 

汤野骏在DAS2016会议期间与国际学术界最早进行汉字识别研究的George Nagy教授交流。

论文工作有关古籍汉字识别方面的研究得到国家自然科学基金委员会与法国国家科研署共同资助的“手写体中文古籍识别”项目的支持,项目研究用的古籍样本由合作单位国家图书馆提供;有关深度学习方面的研究得到日本东芝公司国际合作项目的支持,项目负责人均为彭良瑞副教授。论文作者为清华大学的汤野骏、彭良瑞、徐倩、王言伟和日本东芝公司的古畑彰夫。

彭良瑞长期从事多文种文字识别与古籍识别方面的研究工作。此前,她指导的硕士生冯继雄发表的论文“基于高斯过程风格映射的古籍汉字识别方法”,于20152月获得第22届文档识别与检索国际会议最佳学生论文奖。彭良瑞研究组所属的电子工程系智能图文信息处理研究室在丁晓青教授的带领下,在文字识别、人脸识别、视频监控等领域具有长期深厚的研究基础。彭良瑞也是电子工程系近期成立的媒体大数据认知计算研究中心的技术骨干,该中心主任王生进教授指出,将深度学习前沿技术与困难的古籍汉字识别课题结合,是这项论文工作做出的重要创新。(摘自清华新闻网)