为了纪念我校信息学院计算机系成立十周年,信息学院于12月6日上午在学术会堂606会议室举办了题为“基于图的信息技术暨计算机系成立十周年纪念”的学术研讨会。中科院自动化所程健研究员、中国人民大学信息学院赵鑫博士应邀参加此次研讨会。会议由计算机系王焱老师主持,院长朱建明教授、副院长曹怀虎教授、计算机系主任金鑫教授以及计算机系、信息安全系、信息管理系、电子商务系20余名师生参加了此次研讨会。
研讨会的主题是基于图的信息技术。在过去的几十年中,基于图的信息技术已经深入到人们的生活当中,无论是广泛使用的 GPS还是生活已无法离开的标准搜索引擎,其中都能看到它的影子,同时,其相关研究一直备受国内外学术界和产业界的关注。当今,伴随着大数据时代的到来,基于图的信息技术更加成为了应用与研究热点中的热点。这不仅仅是因为图与大数据有着天然良好的结合性,更是因为它能够解决很多大数据领域中新出现的问题,例如,社交网络中的问题和海量数据挖掘中的问题。
中科院自动化所程健研究员做了题为“大数据搜索与挖掘”的学术报告。面对爆炸式增长的网络资源,程老师指出,只有好的数据组织和搜索方法,才能使之成为“数字化金矿”而不是沦为“资源的沼泽”,因此大数据如何索引尤为重要。在介绍了目前网络数据检索的基本流程并梳理了国际上相关国家政策和主要研究方法后,程老师重点介绍了其所在团队即模式识别国家重点实验室在图的近似近邻搜索算法以及三维重建两个方面的最新研究成果。其间他提到,无监督的在线学习是提高效率、解决大规模数据搜索问题的有效方法,为此他们针对谱哈希投影中的矩阵运算提出一种在线学习的算法,实现了在只需新数据条件下特征矩阵及其均值的递推计算,从而大大降低了原有离线算法对存储空间的需求,同时显著提高了计算效率。该工作发表于人工智能领域国际顶级会议CVPR’14和CVPR’15,是自适应方法与图搜索的成功结合。

随后,中国人民大学信息学院赵鑫博士与大家分享了“面向社交大数据的商业挖掘”。报告中,赵老师展示了他们设计开发的基于新浪微博的电商产品推荐平台METIS系统,该系统能够根据微博内容为博主做出个性化的京东产品推荐,其中针对产品受众属性的挖掘、面向购买受众的产品推荐算法引人关注,是大数据时代信息技术在经济领域的重要应用体现。报告后,在场的各位老师就社交数据的获取、水军评论的剔除、用户的隐私保护等问题与赵老师进行了讨论。

之后,计算机系的王悦副教授和白璐博士分别就网络建模和图核函数分享了自己在相关领域的重要进展。王老师在报告“Discovering the Causal Network of Terms from the Text Corpus”中展示了他在基于文本的因果网络结构自动学习的成果,重点讲述了自然语言中存在的不同语态、嵌套和冲突等问题的解决方法,并通过生动有趣的实验案例深入浅出地展现了因果网络在经济领域的应用。白璐老师的报告“An Aligned Subtree Kernel for Weighted Graphs”系统地阐述了基于热力学深度模型的快速子图核算法,面向结构型数据提出若干新的图核函数,与经典图核函数相比,白璐老师及其导师、世界著名学者Edwin R. Hancock教授所提出的图核函数不仅能够全面体现图中整体和局部子结构的相关信息,从而具有更精确的计算效果,而且具有更高的计算效率,相关成果分别发表在国际顶级期刊《Pattern Recognition》以及国际人工智能顶级会议ICML2015、IJCAI2015上,代表着图核函数未来新的发展方向。