灰理论数列灰预测在CERNET西南网点网络流量预测中的应用-科技论文
随着互联网的飞速发展,网络用户急剧增加,大规模的交换结构不断涌现,导致许多问题[1]:网络越来越复杂,网络动态性越来越大,网络设备工作的可靠性越来越需要得到重视。在网络的性能管理方面,通过对复杂网络中流量的测量和预测,能了解到网络的目前流量状况,未来可能出现的情况。根据这些信息可以预先采取一些优化措施,对网络进行改建和负载均衡设计,避免因网络拥塞等使网络的性能降低,也可以据此了解用户现在的网络行为和做出行为预测,得到网络系统的宏观特征,用以解释许多网络现象和解决网络问题[2]。
灰理论[3]是研究少数据不确定的理论。灰理论中灰预测用于预测数据的变化。很多情况下,条件和诸多因素限制,导致无法取得大量数据的情况下,用概率论的大样本来进行数据分析是不得当的。这种少数据不确定的情况,用灰理论分析,从结果来看,是有效可行的。
一、网络检测与数据采集
与西南网点网管达成协议,将监测点设置于通信学院二级子网与校园主干网相接的线路上,如图1所示。
图1监测点设置
流量采集一般有两种方式,一种是基于数据包的采集方式,另一种是利用SNMP协议采集交换机或路由器的端口流量[4]。前一种的网络监测大致有3种监测方式:HUB监测,防火墙方式和Monitor方式。HUB监测虽然方便实惠,但是会使得网络速率下降并且当监测机也在主动发送数据时将对被监测线路造成干扰。防火墙方式虽然可以工作在100Mbps,但是被监测线路受监测机性能影响很大。Monitor方式虽然拥有此功能的交换机价格昂贵,但不会改变网络拓扑,不对被监测线路造成影响。
此次数据采集就是利用Bay350交换机的Monitor功能,将交换机上与通信学院连接的端口上进出的数据复制到监测端口,达到监测目的。据目前经验,平均流量在30M,用Monitor方式很难产生数据失真。
在监测机上将网卡的全接收功能打开,它可以接收所有数据并存盘和分析。在精度与采样时间之间要做出选择。若采样时间太长,硬盘不可能放下数据,也不可能分析完这么多数据;若采样时间太短,也不能由样本值反映正确的流量。采用5分钟采一次样值,每次采10秒,用按键精灵设置10秒的捕获时间,5分钟的间隔时间手动。这样能够保证较客观反映网络的流量又节约资源,实现精确采集。监测机的性能也会对数据的接收产生影响。硬盘的读取速度小于网络速度。如果内存做缓冲区时设的值太小,则会出现丢失数据情况。经检验,设成16M可以满足数据不丢失。
数据采集使用SNIFFERRPO软件。SNIFFERPRO软件主要用于网络报文分析;可以监测站点的数据、流量;监测网络的活动;分析并通过分析纠正网络响应缓慢,出现的异常情况。
利用灰理论建立预测模型[5]
二、模型选择与合理性分析
模型合理前提:此次采样的数据可以在很大的概率上反映CERNET西南网点电子科大通信学院主网正确的流量。
灰建模是基于灰因白果规律,差异信息原理,平射原理的建模。
网络流量预测符合灰因白果规律:采样的数据是实际得到的值,是白果;造成变化的因素是不确定的,隐藏在数据关系里,是灰因。差异信息原理是:凡是信息必有差异,差异既是信息。网络流量预测的信息即是所得数据,而这些数据的特征就是差异。
图2GM(1,1,D)方框图
由于采样值为等间隔,所以采用等间隔的GM模型。等间隔的模型大致分为定义型、白化型与几种派生型。这里只需要分析定义型与它衍生出来的白化型GM(1,1,D)就可以(见图2),分析派生型与分析定义型其实质是一样的。
灰建模可行性级比判断:
级比平滑检验:
级比区虽然不在界区内,但差距在10%控制范围内,落于可容区范围,可以接受。
灰预测大致分为数列灰预测,拓扑灰预测,异常值灰预测,季节灾变灰预测,系统灰预测。由于级比落于可容区内,所以,即使不能看作大惯性序列也绝不能当成小惯性序列。所以,异常值灰预测不符合。显而易见的,季节灾变与系统灰预测也不符合需要。拓扑灰预测相较于数列灰预测要复杂许多,并且它是主要用于数据落于可容区外的预测。所以,选用数列灰预测最符合网络流量预测的要求。
三、模型的建立
四、利用模型预测网络流量
在一个稳定运行的网络环境中,可以认为正常情况下,网络的流量状况是平稳变化的。现选取时刻3:10之后的网络流量建立预测模型,最后用预测值与当前时刻值的测量值进行比较。
原始序列为:x=(x(1),x(2),….,x(35)),限于篇幅这里不给出具体数值。
利用数列灰预测得到:
白化响应式的精度:
因为白化响应式是真正的微分方程(10)的解。通过灰微分方程得到的参数a与b代入真正的微分方程模型中可以获得精度达到96.268%,表明微分方程(9)比较接近真正的微分方程(10)。可见,我们用序列建立近似微分方程的初衷基本达到。因此,对于网络流量预测来说,此模型是有效可行的。
五、结束语
本文利用灰理论建立了网络流量预测模型,并利用CERNET西南网点电子科大通信学院主网流量做了预测。实验表明,该模型能够较好的对此网点网络流量进行预测。由于级比区不在界区内,数据的跳变虽然在平滑范围内,但还是有一定的强度。下一步工作可以利用拓扑灰预测的原理将非单调图F的基拓展成合适指数基做模型改进。因为事实上,数列灰预测实际上在是一种按等高线做的预测,而一般来说流量的走势大致是成指数曲线的[6]。另外,可以针对灰理论须用在变化速度不快的情况,利用马尔科夫预测法对此模型进行改进[7]。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了