随着我国旅游产业的蓬勃发展,旅游产品类型和游客类型不断增多,发表论文旅游数据统计的难度也日益加大,传统的旅游数据统计方法已无法满足我国大众旅游、全域旅游时代的旅游业发展要求。新时代旅游统计工作需要进一步创新统计思维,改进旅游统计方式和方法,尤其是需要充分认识大数据在旅游统计中的核心价值和意义,利用新的统计方法和技术手段,促进旅游统计体系的优化和完善。在旅游统计体系中,游客数量和旅游收入是最为核心的统计内容,旅游收入主要是基于游客数量和对游客抽样调查得到的平均消费额进行测算而得,旅游收入测算依赖于对游客数量的统计,准确而及时地测算游客规模就成了大数据旅游统计最为重要的课题,也是大数据旅游统计体系优化的关键所在。随着手机的普及,目前三大电信运营商的移动通信信令数据已经基本覆盖全量用户(只有少部分低龄儿童或高龄老人没有使用手机)全时段位置信息数据和行为数据。移动通信数据具有体量大、维度全、准确性高、连续且可追溯的特点,然而就旅游统计领域而言,当前对大数据挖掘等新兴旅游统计方法与手段的利用却还不够充分,大数据在旅游统计应用中还存在一系列亟待解决的问题。例如统计结果难以被大众认可和解读,统计数据“虚高”现象依然存在,统计数据“横向不可比、纵向不可加”等问题。部分学者尝试将地理尺度观引入大数据旅游统计工作,例如保继刚(2019)探讨了地理尺度观在大数据游客统计中的应用前景,高元衡等(2019)在其基础上提出在旅游统计工作中以县域空间尺度来区分旅游和休闲更具有操作性。另外,一些学者还提出采用大数据和小调查相结合的方式来弥补大数据旅游统计的不足,例如当无法采用大数据技术识别外地游客和本地游客时,可以在大数据分析的基础上结合传统的抽样调查来实现游客分类统计。还有一些学者采用“逐层剥离”的思想,尝试对大数据旅游的统计模型进行改进。总体来看,现有研究侧重于局部改进,还缺乏从大数据旅游统计体系优化的整体层面的考虑。本文针对大数据旅游统计中的现存问题,梳理了大数据旅游体系相关理论基础,并结合大数据旅游统计的实践,探讨了基于移动通信大数据旅游统计的数据处理规范和统计模型,最后给出了我国大数据旅游统计体系的优化建议。
1、论文发表我国大数据旅游统计体系的现存问题
1.1统计对象“游客”的界定依然不够明确
旅游统计的首要工作是对统计对象有清晰的定义和统一的界定标准,而当前对游客的定义相对比较宽泛。基于统计对象“游客”的界定问题具体表现在以下几个方面:
(1)对旅游目的尤其是以获取报酬为目的的出行行为缺乏界定;(2)对游客“惯常环境”存在多种不同形式的解读;
(3)“出行距离”规定与国际主流标准差异较大;(4)现有统计时段对“停留时间”的持续监测难度较大。因此,在基于大数据的旅游统计体系中,需要厘清旅游统计中“游客”的基本统计概念的内涵与外延。
1.2大数据处理环节缺少统一规范
目前,虽然大数据旅游统计实践方案大多以移动通信信令数据为主要数据源,但实际上不同主体发布的旅游大数据报告中对同一地理尺度下的游客统计结果并不相同,甚至差异巨大。当前,随着人们对大数据在旅游统计中应用前景的广泛认可,全国范围内出现了大量的旅游大数据中心,这些旅游大数据中心在大数据清洗和处理流程上常常按照各自的理解处理数据并发布相应的旅游大数据报告。
1.3不同层级旅游统计数据无法纵向衔接
根据我国现行的旅游统计调查制度,我国国内旅游统计总体上分为“国家层面”和“地区层面”,其中,地区层面又分为“省级“”市级”和“县级”这三个地理层级。不同层级的旅游统计数据之间无法满足相加性,这是传统旅游统计广受诟病的一个重要原因。这种不同层级数据“纵向不可加”的问题并没有随着大数据旅游统计方法的引入得以解决。从近年来各地区和国家层面发布的旅游大数据报告来看,地方汇总数据与国家数据依然差异较大,地方各个层级的旅游大数据统计结果之间依然无法做到纵向衔接。