微博庞大的用户量和即时的传播速度,使其成为舆情事件酝酿、产生和传播的重要场所。微博中的热门话题可在短时间内大范围扩散,甚至形成重大的舆情事件,需政府部门或相关责任人及时应对解决。因此尽早预测微博舆情事件的走向和趋势具有很重要的现实意义。
微博内容无结构性、动态性和短文本的特点,给舆情事件的趋势预测带来了一定的技术困难。虽然已有多个领域对微博舆情展开研究,但大多侧重于心理学、传播学相关的理论研究,或仅进行个案分析。当前研究基于微博数据的预测没有充分利用现有心理学及传播学上关于舆情事件的研究成果,研究的特征较为单一,且实验验证的数据量较小。
心理学系工程与大数据心理学教研室主任、中国科学院行为科学重点实验室朱廷劭及其研究组基于社会心理学、传播学理论基础及已有的研究结果,完善微博舆情趋势的影响因素,并从实际舆情事件中提取情绪值、意见领袖、社会态度等特征,通过比较多种经典回归方法,基于大量舆情事件的网络数据训练模型,模型最后可以达到0.78的准确率和0.88的召回率。三个模型的最优特征集的准确率、召回率和F值分别如下:
通过上述实验得到的有效特征和预测方法,选取一个新的事件进行次日微博量的预测,即福建漳州PX爆燃事件。根据PX事件在发展过程中每天的真实微博量和预测微博量,描绘出该事件的真实发展趋势和预测发展趋势图。由图1可看出预测值与真实值虽然存在一些偏差,但二者的整体发展趋势较为接近。PX事件在4月8号有明显的下降趋势,且模型也准确地预测到了这一下降趋势。因此,研究最后得到的一系列影响因素不仅有理论基础,也展现出了其实际应用价值,对可能发展成为重大舆情事件的微博舆情提供预警。
该研究成果已被国际期刊Cyberpsychology, Behavior, and Social Networking录用并在线发表:
Zhou Yang, Zhang Lei, Liu Xiaoqian, Zhang Zhen, Bai Shuotian, and Zhu Tingshao. Cyberpsychology, Behavior, and Social Networking. September2017,20(9):533-539.https://doi.org/10.1089/cyber.2017.0142