公务员期刊网 论文中心 正文

蜂窝移动网络数据用量预测方法浅析

蜂窝移动网络数据用量预测方法浅析

摘要:目前,蜂窝移动网络数据用量预测技术与方法上,主要采用统计和深度学习方法,由于用户的蜂窝移动网络数据用量变异较大,所以将可能有较大的蜂窝移动网络数据用量估计误差。因此,本文研究提出一套蜂窝移动网络数据用量预测方法,分析目标客户前几个周期的蜂窝移动网络数据用量集合,预测目标客户下一周期的蜂窝移动网络数据用量,并可依估计的蜂窝移动网络数据用量提供营销信息予客户,增加客户对蜂窝移动网络数据用量的购买量,降低客户费率,增加移动网络运营商收入,建立双赢。在实验中,本研究取得7月份56万个用户记录进行分析,并与传统预测方法进行比较,证实此方法确实较为优越,且平均正确率可达87.97%。

关键词:蜂窝移动网络数据用量;账务计算;k个最近邻居算法

4G/5G蜂窝移动网络日益普及,分析和预测蜂窝移动网络用户的数据用量也越来越受到重视,其将有助于移动网络运营商进行网络策略部署和客户方案推荐。在目前蜂窝移动网络数据用量预测上,主要采用统计和深度学习方法来进行预测,需要进行大量统计,由于用户个人的通讯行为使蜂窝移动网络数据用量差异较大,且统计仅能得到同一资费方案中的平均值及趋势,若在同一资费方案中蜂窝移动网络数据用量变异大,则统计和深度学习方法将可能得到较大的蜂窝移动网络数据用量估计误差。因此,本研究提出蜂窝移动网络数据用量预测法,分析目标客户前几个周期的蜂窝移动网络数据用量集合,以预测目标客户下一周期的蜂窝移动网络数据用量,并可依此蜂窝移动网络数据预估用量提供营销信息予客户,增加客户对蜂窝移动网络数据用量的购买量,以增加企业收入。本研究提出蜂窝移动网络数据用量预测系统,包含手机端设备、核心网络端、账务计算服务器、数据库、预测服务器以及决策服务器。手机端设备进行蜂窝移动网络数据通信将通过核心网络端链接至因特网,并且该通信记录由核心网络端传送至账务计算服务器,由账务计算服务器统计每个用户每个周期的蜂窝移动网络数据用量,并将此用量储存于数据库。预测服务器将可运用蜂窝移动网络数据用量预测方法,分析目标客户前几个周期的蜂窝移动网络数据用量集合,并将此集合与数据库中相同资费方案的历史数据集合进行比对,找出最相似的几笔蜂窝移动网络数据用量集合,令最相似的数据权重最高,再将这几笔蜂窝移动网络数据用量集合进行加权平均,以取得目标客户下一周期的蜂窝移动网络数据预估用量,再传送至决策服务器。决策服务器将依据预测的蜂窝移动网络数据用量,经过决策运算产生相关的营销、预警、网络部署等策略,提供相关建议信息予企业主管和客户参考。此论文以下分为四个章节,在第二节中将说明蜂窝移动网络数据用量预测方法,各个步骤的作法和设计原理。第三节则针对本研究提出的蜂窝移动网络数据预测方法进行实证和分析。最后一节则说明此论文之结论与未来研究方向。

1蜂窝移动网络数据用量预测方法

本研究设计蜂窝移动网络数据用量预测方法,主要包含5个步骤:(1)设定相关参数值;(2)收集和统计每个用户每个周期的蜂窝移动网络数据用量;(3)取得前n个周期之蜂窝移动网络数据用量,并转换为向量集合;(4)与历史数据进行比对,取得最相似的k笔数据;(5)依每笔数据向量距离进行加权平均,估计蜂窝移动网络数据用量,分述如下。

1.1设定相关参数值

蜂窝移动网络数据用量预测方法将分析每个客户每个周期(m天)的蜂窝移动网络数据用量、每个客户前n个周期的蜂窝移动网络数据用量集合以及取得历史数据中最相似的k笔数据,在此步骤中将先设定m、n、k等参数值,以进行后续预测计算。其中,在本研究案例中,设定m值为5(即一个周期5天),n值为5(即分析前5个周期),以及k值为2(即取得数据库中最相似的2笔记录),以进行蜂窝移动网络数据用量预测方法说明。

1.2收集和统计每个用户每个周期的蜂窝移动网络数据用量

在此步骤中,由核心网络端实时收集和记录每个用户的蜂窝移动网络数据通信记录,并由账务计算服务器依设定之每5天为1个周期,计算每个用户每个周期的蜂窝移动网络数据用量,并将此数据储存至数据库。在本研究案例中,以封包数为蜂窝移动网络数据用量的单位,如表1,账务计算服务器统计使用者编号1在7月1日到7月5日这个周期共传收1,881,531个封包

1.3取得前n个周期之蜂窝移动网络数据用量,并转换为向量集合

在此步骤中,由预测服务器依参数值设定取出数据库中的数据,取得目标客户前5个周期的蜂窝移动网络数据用量集合,并将此集合作为该用户蜂窝移动网络上网行为的参考依据,依此进行后续的分析与判断使用。在本研究案例中,将预测使用者编号1在7月26日到7月31日这个周期(第i个周期)的蜂窝移动网络数据用量q1,i,故将取得其前5个周期的蜂窝移动网络数据用量集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即7月1日到7月25日期间的蜂窝移动网络数据用量),如公式(1)、(2)、以及表2所示。{}1,12,13,14,15,15,1,1,,,,−−−−−−−=iiiiiiiqqqqqQ(1){}1,1,51881531,5651084,1875929,3116748,1808503iiQ−−=(2)

1.4与历史数据进行比对,取得最相似的k笔数据

在此步骤中,将向数据库取出目标客户相同资费群组(使用者编号1的资费群组为Group1)的历史蜂窝移动网络数据用量数据,不同资费群组的客户蜂窝移动网络数据用量数据将不被考虑,如表3所示。例如,用户编号c的历史蜂窝移动网络数据用量数据集合为Qc,i-6,i-11={qc,i-11,qc,i-10,qc,i-9,qc,i-8,qc,i-7,qc,i-6}(即6月1日到6月30日期间的蜂窝移动网络数据用量),如公式(3)、(4)所示。{},6,,16,7,8,9,10,1,,,,,−−−−−−−−=iciciciciciciicqqqqqqQ(3){},6,111731307,4234143,2018105,3696109,2513784,3622136ciiQ−−=(4)预测服务器将目标客户前5个周期的蜂窝移动网络数据用量集合Q1,i-1,i-5与历史数据每笔蜂窝移动网络数据用量集合进行比对,而在本研究案例中,相似度权重计算主要采用欧几里德距离的倒数,例如,为使用者编号1与使用者编号j的欧几里德距离(),7,5,1,11,iijii−−−−QQd如公式(5),以及为使用者编号1与使用者编号j的相似度权重jw,1如公式(6)。其中,M为一个极大数,在本研究案例中,设定为1000000。依此可计算出使用者编号1前5个周期的蜂窝移动网络数据用量集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即7月1日到7月25日期间的蜂窝移动网络数据用量)与历史数据每笔蜂窝移动网络数据用量集合计算的相似度权重如表4所示。当与每一笔历史蜂窝移动网络数据用量数据集合比对得到权重jw,1后,取得权重最大的k笔(在本研究案例中k为2),其中权重最大值为f1和其对应的前第i-(n+1)个周期蜂窝移动网络数据用量为g1、权重第二大值为f2和其对应的前第i-(n+1)个周期蜂窝移动网络数据用量为g2,依此类推如公式(7)所示。jcjwf,111max≤≤=(7)

1.5依每笔数据向量距离进行加权平均,估计蜂窝移动网络数据用量

在此步骤中,分别将相似度最大的k笔数据所对应的前第i-(n+1)个周期蜂窝移动网络数据用量依权重进行加权平均,如公式(8)所示。在本研究案例中,与使用者编号1前5个周期的蜂窝移动网络数据用量集合Q1,i-1,i-5相似度最高的2笔分别为使用者编号c的历史蜂窝移动网络数据用量数据集合,7,iic−−1Q和用户编号1的历史蜂窝移动网络数据用量数据集合,7,1ii−−1Q,故f1为9770.00000048,1=cw、g1为36221366,=ic−q、f2为0740.000000201,1w=、g2为34235946,1=i−q。因此,使用者编号1于7月26日到7月31日这个周期(第i个周期)的蜂窝移动网络数据估计用量q1,i’为3,140,242,如公式(9)所示。∑∑==×=kbbkbbbifgfq11,1'(8)31402420740.000000209770.0000004834235940740.0000002036221369770.00000048',1=+×+×=iq(9)当预测服务器完成目标客户蜂窝移动网络数据用量预测后,可将此预测值传送至决策服务器,并依据预测的蜂窝移动网络数据用量,经过决策运算产生相关的营销、预警、网络部署等策略,并提供相关建议信息予企业和客户参考。在本研究案例中,使用者编号1的资费群组允许之封包数量为15,000,000,而目前使用者编号1已使用封包数量14,333,795,并且估计使用者编号1到7月31日时,将累计使用封包数量为17,474,037,故由决策服务器提供预警信息予用户编号1,并推荐使用者编号1其他资费方案以供参考。

2实验结果与讨论

本研究中主要收集7月份某地区北部用户不同资费方案,共涵盖565,606个用户记录,设定算法中的k值为10,并与传统预测方法(资费方案之用量平均值方法、深度神经网络)进行比较。由实验数据显示,本研究提出的方法正确率较其他算法高,正确率达87.97%,如表5所示。

3结语

本研究提出蜂窝移动网络数据用量预测方法,分析目标客户前几个周期的蜂窝移动网络数据用量集合,并将此集合与数据库中相同资费方案的历史数据集合进行比对,找出最相似的几笔蜂窝移动网络数据用量集合,令最相似的资料权重最高,再将这几笔蜂窝移动网络数据用量集合进行加权平均,以取得目标客户下一周期的蜂窝移动网络数据预估用量。实验中与传统预测方法进行比较,证实此方法确实较为优越,且平均正确率可达87.97%。未来可将此方法应用于4G/5G蜂窝移动网络数据用量预测,并依此蜂窝移动网络数据预估用量提供营销信息予客户,增加客户对蜂窝移动网络数据用量的购买量,同时,降低客户费率、增加移动网络运营商收入,达到双赢效果。

参考文献:

[1]倪志刚.一种网络指标数据预测的方法,电信科学,第29卷,第3期,第141-146页,2013.

[2]丁章,于德成.基于循环神经网络的无线通信指标预测应用研究,山东通信技术,第40卷,第1期,第18-20页,2020.

[3]丁尹,桑楠,李晓瑜,吴飞舟.基于循环神经网络的电信行业容量数据预测方法,计算机应用,第41卷,第8期,第2373-2378页,2021.

作者:陈志华 单位:福州大学计算机与大数据学院