题 目:“才聚语海”天天讲系列讲座:大数据背景下的舆情监测与分析
时 间:11月20日(周三) 14:55
地 点:奉贤校区二教F106
主 办:学工部、校团委
承 办:理虎扑nba
报告人简介:
上海应用技术虎扑nba理虎扑nba副教授,华东师范大学金融与统计虎扑nba在读博士,中国现场统计学会试验设计分会(国家二级学术协会)常务理事,曾获中国教育发展学会《第二届全国基础教育课程改革教研成果一等奖》、中国教育发展学会《2013年度全国基础教育课程改革教研先进个人》、上海市教育委员会《上海市育才奖》、上海应用技术虎扑nba教改项目一等奖、上海应用技术虎扑nba《我心目中的好老师》等奖项,主要研究领域为数理统计、组合数学、系统科学,主持或参与多项国家级、省部级、校级科技发展基金项目、教改基金项目与高教研究课题,近几年已在Communications in Statistics–Theory and Methods、Communications in Statistics–Simulation and Computation、Journal of Data Analysis、应用概率统计等国内外专业期刊上发表40余篇研究论文。
讲座主要内容:
当前,互联网进入大数据时代。它有如下几个特征,首先数据体量巨大,非结构化数据的超大规模和增长占总数据量的80%至90%,比结构化数据增长 快10到50倍;第二,大数据的异构和多样性,比如图片、视频、博客、微博、微信等等,比大更重要的是数据的复杂性,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值;第三,价值密度低,大量的不相关信息,需要沙里淘金;第四,传播速度快,因此,需要实时分析而非批量式分析。
在大数据时代,面对如此海量快速的信息,纯人工监测互联网已经不可行了。软件成为大数据环境下教育舆情监测和分析的引擎。监测舆情可以设立一些关键词,首先要与自己机构相关,可以包括竞争者或者是合作伙伴,然后要放在一个区域或全国范围内进行搜集。所有“沙子”搜集完之后,我们开始聚合信息,判断哪些和教育相关,哪些跟区域相关,哪些跟自己相关。把这些信息进行精确地采集和过滤之后,下面就要炼化分析,包括传播统计和分析(媒介分析、主体传播分布、传播路径分析、传播源头追踪)、敏感(负面)舆情研判、舆情信息传播趋势分析,预判所收集到舆情信息的未来走势。在此基础上生成舆情简报,舆情简报由系统自动生成,以日或周为单位,对本阶段监测到的舆情进行统计和分析,包括舆情分布、热点舆情排行、负面舆情分析、正面舆情排行等情况。