基于情绪信息熵的网络舆情传播模型研究
随着互联网的发展,当前网络舆情的传播异常迅速。网络舆情通常指公众由于事件刺激而产生的在互联网上对特定事件的认知、态度、情感以及行为倾向[
大数据时代网络舆情传播的规模越来越大,传播的速度越来越快,造成的影响越来越大,产生的原因也越来越复杂。网络舆情目前在社会舆情中占据重要地位,针对网络舆情的相关研究已经在世界各地逐步开展,就网络舆情的传播规律而言,相关研究主要以模型研究为主,对信息的传播和扩散进行分析。比较常见的有小世界网络模型[
传染病模型是研究舆情演化使用最广泛的模型之一。目前针对网络舆情使用较多的有SIR(susceptible infected removed)模型[
以上这些模型虽然在理论上对网络舆情的传播进行了模拟,但由于其只关注舆情传播的过程,在实际应用中具有一定的局限性,主要包括以下几个方面:
1)已有的传播模型主要以舱室模型为主,但部分舱室的设置不合理。
2)模型内部不同状态的转变始终维持着一个固定的概率,导致计算的结果与实际差异较大。
3)网络传播模型只描述了事件本身的发展,无法反映用户的情感因素。
情绪能够影响人类的行为[
1 情绪倾向分析
1.1 情绪指数的统计特征
散粒体材料的颗粒形状和空间分布具有显著的随机性,根据颗粒级配、粒径、形状、孔隙率等生成三维多面体颗粒及其在空间中的分布[
在自媒体时代,任何一个网民都很容易成为情绪传播的主体。网络舆情类型不同,传播的情绪类型也不同,本文使用闻海大数据分析平台,将舆情的情感倾向划分为感动、信心、恐慌、警惕和愤怒5类情绪指数。一般来说,网络舆情涉及的文本内容反映网民的情绪倾向,利用闻海平台内置的词频统计工具,可以分析出微博文本中的情绪倾向。情绪指数反映了微博中涉及的话题情感倾向,微博中每条文本都具有表达作者情感的词汇和语句。利用自然语言处理工具可以分析微博内容的词频、用词倾向、句法逻辑等,同时再根据专家系统对数据进行分类并打上对应情感的标签,即可知道特定的微博在不同情感上的倾向如何,并用频数或其他标量进行情感指数的量化。本文分析了微博平台涉及新冠肺炎疫情相关话题的情绪指数,5种情绪倾向的变化趋势如
图1 情绪指数的变化趋势
Fig.1 The changing trend of emotion index
由
1.2 信息熵
在信息论中,通常用信息熵来表示信息量[
(1) |
式中:为随机变量;为随机变量的可能结果,;为的概率;决定信息熵的单位,时,信息熵的单位为bits;时,信息熵的单位为nats;时,信息熵的单位为dits。
对于某些的情况,由于
可以定义,其中p为概率。当时,信息熵取得最大值,即当所有的信息概率相等时,信息处于最混乱的状态。
信息熵是从信息论发展过来的一种度量信息的物理量,是用不确定性和混乱程度来研究信息的量[
将微博在疫情期间的情绪倾向统计量代入
图2 情绪指数的信息熵序列
Fig.2 Information entropy sequence of emotion index
2 传播动力学模型
2.1 SI模型
1927年,Kermack等[
由于信息的扩散和传染病的感染机制类似,一般使用SI模型对信息的扩散进行模拟和仿真。SI模型的微分方程组如下:
(2) |
式中:S为易感者,表示接收到相关信息的人;I为感染者,表示转发相关信息的人;为转发概率;为单位时间。
在传播过程中,涉及的总人数K保持不变,且满足,进一步可以得到
(3) |
2.2 SEIR模型
SEIR模型在SI模型的基础上加入了潜伏者E和免疫者R,模拟过程多了2个舱室状态以描述更多的人群类型。由于信息的扩散存在不可逆的过程,这就使得SEIR模型在应用到信息扩散中和应用到传染病过程中存在一些差异。SEIR模型的微分方程组如下:
(4) |
式中:E为潜伏者,表示看到舆情后在犹豫是否转发的人群;R为免疫者,表示始终不转发的人群;为免疫率,即看到舆情并不感兴趣的几率;为转发率。各个舱室中的人群数量满足系统总人数恒定,即。
2.3 改进模型
舆情信息扩散的SEIR模型通过设置不同的舱室大致描述了用户的转发行为,但由于缺少对用户转发的深层原因进行分析,依然会导致仿真结果与实际存在一定差距的情况。因为SEIR模型中各状态的转变是靠定值转发率来控制,并没有将情绪倾向的驱动代入到模型中,而情绪特征对于微博用户的转发行为具有明显的影响[
本文将信息熵作为量化指标,将用户情绪倾向加入到SEIR模型中,改进的模型流程如
图3 模型流程图
Fig.3 Flowchart of the model
(5) |
式中:;为舆情信息中的倾向对易感者的影响因子,定义如下:
(6) |
式中:c为常数。
上述描述影响因素的公式和单个情绪指数没有直接的关系,而与情绪指数整体的分布有关,即情绪在社会上的分布影响着舆情信息的传播效率。当各个情绪所占比例势均力敌时最大,此时信息最为混乱;反之,当某一个情绪优势明显时,较小,此时信息较为有序。
3 案例分析
3.1 舆情事件描述
网络舆情传播点多、线杂、面广,信息量庞大,互动性、即时性、自主性传播特点突出。尤其在疫情期间,网络舆情的传播具有较为明显的“病毒式传播”特征,传播的速度快、范围广、影响大。
本文选取疫情期间微博上几个较为热门的子话题进行研究,即事件1:春节延长假期间上班先安排补休;事件2:湖北将临床诊断纳入确诊标准;事件3:湖北省卫健委党组书记张晋和省卫健委主任刘英姿双双被免职;事件4:俄罗斯向武汉捐赠23 t医疗物资。对于某个特定话题,搜索其关键词可以得到一定时间范围内不同用户的微博数据。本文以涉及关键词微博的用户名作为网络节点(这些话题的节点总数分别为85、63、409、925),按照消息来源者到消息转发者作为连边,建立特定舆情事件的传播网络,进而分析该舆情传播网络的相关特征。这些事件传播网络的节点规模不同,方便本文提出的模型研究在不同网络规模的情况下,信息传播的情绪驱动影响机制和传播网络的演化趋势。
3.2 舆情事件描述
在复杂网络中,常常使用节点的度属性、网络的聚类系数和网络密度来描述网络的整体特征[
事件 | 幂律系数 | 聚类系数 | 密度 |
---|---|---|---|
1 | 3.091 1 | 0.054 9 | 0.018 2 |
2 | 2.892 0 | 0* | 0.021 5 |
3 | 3.287 0 | 0.036 1 | 0.005 4 |
4 | 1.976 2 | 0.005 4 | 0.001 2 |
*注:表中数据近似到小数点后4位,该值由于太小而被忽略,实际值并不为0。
1)传播网络的度分布
在网络中,节点的度数是指与该节点相邻的节点数目,即连接该节点的边的数目,网络的平均度指网络中所有节点度的平均值。度分布是对一个图(网络)中顶点(节点)度数的总体描述,指不同的度在网络中出现的概率分布。通常定义网络的度分布为网络中度数为的节点个数占节点总个数的比例。本文对上述微博热门事件分别进行了统计分析,得到各事件的度分布如
图4 微博舆情事件传播网络的度分布
Fig.4 Degree distribution of microblog public opinion transmission
2)传播网络的聚类系数
在网络中,节点的聚类系数是指与该节点相邻的所有节点之间连边的数目占这些相邻节点之间最大可能连边数目的比例。而网络的聚类系数则是指网络中所有节点聚类系数的平均值,它表明网络中节点的聚集情况即网络的聚集性,即同一个节点的2个相邻节点仍然是相邻节点的概率有多大,它反映了网络的局部特性。整体的聚类系数可以对1个图中整体的集聚程度进行评估,聚类系数高则说明各个结点之间倾向于形成密度相对较高的网群。
3)网络密度
网络密度描述网络中节点间相互连边的密集程度,在线社交网络中常用来测量社交关系的密集程度以及演化趋势。1个具有N个节点和L条实际连边的网络G,其网络密度为
(7) |
网络密度取值范围为0~1,当网络为全连通时,d(G)=1;当网络中不存在连边关系时,d(G)=0。真实网络中能够发现的最大的密度一般为0.5。由
3.3 仿真试验
为了验证模型的有效性,选取疫情期间的4个事件进行分析。如
图5 模型仿真结果
Fig.5 Model simulation results
事件 | N | c | α | γ |
---|---|---|---|---|
1 | 85 | 0.37 | 0.25 | 0.10 |
2 | 63 | 0.27 | 0.25 | 0.10 |
3 | 300 | 0.21 | 0.25 | 0.10 |
4 | 920 | 0.43 | 0.25 | 0.10 |
4 结语
由于突发公共卫生事件对于人们意识影响的协同效应,使网络信息的传播更加迅速、影响力更加巨大。利用复杂网络传播动力学的相关理论研究突发疫情下的舆情传播机理,能够深入剖析传播系统中各作用主体之间的相互耦合关系,并估算出舆情演化速率的极值点,进而控制突发性重大公共卫生事件中不良舆情的扩散,以达到正确引导网络舆情的目的。本文通过改进带有潜伏期的SEIR传播模型,利用信息熵将网民的情绪倾向进行量化并引入传播模型中,能够有效模拟真实的舆情传播网络,为有关部门引导舆情传播提供理论参考。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了