10月12日,信息学院召开了学科建设研讨会暨“Web数据挖掘”团队启动会。会议由党总支书记章宁教授主持,学院全体教职工参加了会议。
研讨会上,院长朱建明教授首先对学院学科建设的现状进行了分析。朱院长总结了近几年学院在师资队伍、科学研究、学科建设及合作交流等方面的成就,同时也指出学院目前学科建设与其他院校之间还存在差距。研讨会召开之前,学院进行了一次学科方向及学术成果的调研,根据调研情况及结果统计显示,学科发展还面临许多挑战。朱院长最后提出了今后学科建设与发展的目标和思路。他强调,必须要整合优势资源、凝练学科方向、强化特色,加大吸收优秀青年教师和引进高层次人才的力度。只有全体教师不断拓宽思路,积极进取,学院学科的发展才能上新台阶,学院和个人才能有更广阔的发展空间。
研讨会现场
之后举行了“Web数据挖掘”团队启动会。2013年7月份信息学院下发《关于申报“基于Web的数据获取、融合与挖掘”方向预探索项目的通知》,经过信息学院学术委员会评审,学院将资助四个预探索项目。团队启动会议上,四个项目负责人介绍了项目相关情况。
项目负责人发言
计算机系王焱老师项目名称是“网络爬取中关键词的选择研究”。此项目计划解决关键词选择问题中的关键词优化问题。优化问题可转换为集合覆盖问题,现有方法多为传统贪心算法,选择策略都未利用文档大小和频率中幂定律和对数正态分布,他的项目提出一个带权重贪心算法利用此分布来改善爬取效果。
信息管理系李海峰老师的项目“基于MapReduce的WEB数据获取技术研究” 致力于大数据研究的基础平台建设,研究基于MapReduce架构的WEB数据的搜索技术、预处理方法以及存储模型,构建WEB数据获取的分布式系统,为大数据研究提供基准实验数据。
信息管理系杨铭老师项目“社会化媒体中大数据的抽样与有偏性纠正研究”将从数据挖掘和数理统计两个视角对社会化媒体中的大数据展开研究。这些理论和方法的应用可以帮助企业深入了解客户的需求及意见,获得商品的市场评价反映,有效地进行客户意见反馈及参与或干预客户讨论等,以便制订更加适合的商务策略,从而提高企业的核心竞争力。
信息管理系海沫老师首先介绍了预探索项目“面向大数据的并行K-Means聚类算法研究”的研究意义,分别从聚类算法的Web应用、聚类算法的分类、串行和并行K-means算法的研究现状三个方面进行了介绍,并分析了目前并行K-means算法研究存在的问题,进一步阐述了本项目所要解决的关键问题、主要研究内容和初步的研究思路。