公务员期刊网 论文中心 正文

大数据挖掘技术下的全国物流信息

大数据挖掘技术下的全国物流信息

摘要:科技信息技术的快速发展,为智慧物流兴起和发展提供了契机。本文利用大数据挖掘技术对全国物流网点,货源与车源信息进行分析,得到物流网点,货源与车源在全国的分布规律,以更好的进行资源配置,降本增效。

关键词:大数据;挖掘技术;全国物流信息

一、研究方法

利用python中数据挖掘模块[1]分别爬取中国物流网的物流网点名称和地址、货物始发地和需求地地址、货物名称、各地的车源信息,进行数据统计和分析。

二、全国物流信息数据爬取及分析

1、物流网点数据分析

按照省份爬取物流网点,共爬取1018个。广东、江苏、山东三省的物流网点最多,均为1000以上,其中广东省最多,为2728个。上海、浙江、北京、天津等中东部省市次之,东北、西北、西南的省份物流网点相对较少,河南在内陆地区的省份中物流网点数量居高位。通过数据爬取结果对物流网点数量分布的特点作出推断,位于东部沿海的省份经济发达,与国内外贸易往来密切,产生了大量物流需求,因此物流网点数量多;而位于东北,西北,西南的省份,经济发展缓慢,物流量较小[2];河南的物流网点数量领先内陆其他各省,究其原因,郑州是中部地区交通枢纽,铁路系统发达,交通极为便利,因此物流量大,对物流网点的需求多。

2、货物数据分析

按照省份爬取货源信息,共4021条,无论是货源还是其需求地,信息量大的地区依然是东部沿海省市及经济发达地区,东北、西北、西南地区的省份货源及需求量都比较少。将货源信息与货物需求地信息数量进行对比,每个省份的货物供给和需求在全国各省市中大致处于相同位次,供需比较平衡。

3、车源数据分析

按照省份爬取车源信息,共24699条。东南部沿海地区的省市车源信息量大,而内陆地区都保持较低的水平,但重庆市高居内陆榜首,结合原始数据来看,重庆市车源信息3732条,位列第三。此外值得一提的是广东省,其车源信息量高达11840条,而车源信息数量共24699条,可见仅广东一省便占据了半壁江山。

4、对比分析

将物流网点、货源、车源信息按照省份统计数量(如图1),三条线分别表示物流网点、货源、车源数据。可见物流网点、货源、车源之间大致表现为正相关。此外,广东、江苏、重庆三省的车源数据极为突出。广东省和江苏省都有雄厚的经济体量,同是沿海省份,对外贸易往来密切,区位优势明显。而重庆市身居内陆却可与沿海发达省份媲美,这与其地理位置有关,重庆市多山,铁路运营里程位居全国23,但对公路运输的需求较多,因此车源信息数量大。

三、总结

物流网点和货源数据都呈现东多西少的特点,即沿海、经济较发达的省市拥有较多物流网点和货物往来,内陆、经济欠发达的省份货物往来较少。交通是除经济因素之外对物流网点和货源分布影响较大的因素,交通便利的省份物流网点和货物信息较多。物流网点、货源、车源信息三者的地域分布大致呈现正相关,物流网点多的省市,其货源和车源信息数量也比较多。

参考文献

[1]安子建.基于Scrapy框架的网络爬虫实现与数据抓取分析[D].吉林大学,2017.

[2]郭茜,庄菁.我国物流业布局现状、问题与对策[J].中国物流与采购,2013(12):66-67.

作者:李姝铭 单位:北京交通大学

相关热门标签