学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 经管论文 基于 LDA 主题模型和情感分析的机场旅客出行体验研究论文

基于 LDA 主题模型和情感分析的机场旅客出行体验研究论文

2

2025-07-14 17:46:42    来源:    作者:xuling

摘要:不断提高机场旅客出行体验是现代化机场的发展方向。文中运用文本挖掘技术对机场旅客在线评论数据进行处理,旨在挖掘旅客对机场服务的真实体验和评价。

  【摘要】不断提高机场旅客出行体验是现代化机场的发展方向。文中运用文本挖掘技术对机场旅客在线评论数据进行处理,旨在挖掘旅客对机场服务的真实体验和评价。对大众点评网站上我国2023年旅客吞吐量排名前15机场的旅客评论进行了文本清洗和LDA主题模型,构建了10个主题,分别是机场交通、乘机手续、航班延误、总体感受、餐饮购物、环境设施、工作人员、提取行李、离港接机和航站楼设计。对每个机场和主题分别进行情感值的计算,应用IPA分析法进行分析,发现乘机手续、机场交通和航班延误是最需要优先改进的服务内容。研究结果有助于及时地发现民航机场旅客服务中存在的问题,改进和提升机场旅客服务质量。


  【关键词】机场服务;满意度评价;LDA主题模型;情感分析;IPA


  1引言


  机场是航空运输服务的重要场所,是整个民航运输服务中至关重要的一环,其服务质量很大程度上决定了机场的影响力,也影响了旅客的出行意愿、服务体验和满意度[1]。近年来,随着我国机场吞吐量的不断上升和旅客需求的多样化发展,服务质量不高所引发的旅客投诉问题较为突出[2]。国家层面出台了一系列政策文件促进机场服务质量的提升,2022年,民航局发布的《“十四五”航空运输旅客服务专项规划》中提出,应聚焦民航旅客服务痛点、难点,推进民航旅客服务智慧监管。2023年,国*院印发的《质量强国建设纲要》中提到,要推动航空公司和机场全面建立旅客服务质量管理体系,提高航空服务能力和品质。


  旅客的体验与评价是衡量机场服务质量的重要标准。随着各类社交媒体和在线评论网站的普及,越来越多的旅客愿意并乐于在网络上发表评论、心理感受和负面问题。这些评论成为机场服务质量评价的更可靠来源,其反映了乘客真实的心理感知意见,不会受到任何第三方的压力或引导,也没有传统问卷调查在问卷数量和问卷设计方面的局限性[3]。但这些评论数据过于庞大,且属于非结构化数据,包含大量旅客心情日记、情感抒发等无关内容,若使用人工处理方法则工作量巨大。


  基于此,本文运用文本挖掘技术对机场旅客在线评论数据进行处理。使用网络爬虫获取了大量机场旅客在线评论数据,对数据进行了有针对性的整理和清洗,运用LDA主题模型、文本情感分析和IPA分析方法,挖掘旅客对机场服务的真实体验和评价。本文的研究结果有助于及时地发现民航机场旅客服务中存在的问题,改进和提升机场旅客服务质量。


  2文献研究


  随着国内外学者对机场服务质量评价研究与实践应用的不断深入,各种评价模型被开发与验证。例如,刘玉敏、靳琳琳[4]将SERVQUAL或AIRQUAL量表与数学模型相结合,构建机场服务质量评价模型。Wiredja等[5]构建了以旅客为中心的机场服务质量评价模型。王琳琳等[6]基于模糊综合评价法对贵州机场服务质量进行了实证研究。张旭[7]基于修订的SERVQUAL模型,对某机场进行了实证研究。Allen等[8]研究了影响意大利周边机场服务质量的潜在因素。相关研究虽然丰富,但均以问卷调查为数据收集手段,问卷调查的质量在很大程度上影响结果的准确性和客观性。


  与传统问卷调查不同的是,在线评论以其真实性和客观性引起了国外学者的关注。旅客在Twitter、微博和Google地图评论等社交媒体或Skytrax、TripAdvisor、大众点评、携程网等相关平台发表了大量的意见和评价体验,这些评论具有来源广泛可靠、客观性强等特点。Gitto、Mancuso[9]应用Skytrax在线评论进行了文本分析,分析旅客对机场服务质量的看法。Bogicevic等[10]基于Skytrax在线评论确定了机场服务质量和旅客满意度的影响因素。H.Barakat等[11]构建深度学习模型并应用Twitter数据对机场服务质量进行评价。June Young Park等[12]对Google地图评论进行文本挖掘,研究新冠疫情对机场旅客体验的影响。而国内相关研究相对较少,马新云[13]基于CAPSE机场旅客服务质量测评,应用大众点评在线评论对上海虹桥机场进行了服务质量评价。赵桂红等[14]对TripAdvison在线评论进行分析,研究了旅客在航班延误后的满意度影响因素。


  文本挖掘技术是在线评论文本观点挖掘和情感分析的重要手段,主要的文本挖掘方法有两种:一是基于词典的分析方法[15],是指根据不同情感词典所提供的情感词的情感极性,来实现不同粒度下的情感极性划分,该方法情感分类效果比较准确,但是过于依赖情感词典的构建。Lingyao Li等[16]开发了一个专门的关键词主题本体集来研究新冠流行期间旅客对机场服务的态度。二是基于机器学习的分析方法[15],是一种通过给定的数据训练模型,通过模型预测结果的学习方法,包括SVM、KNN、MME、LDA等不同模型。Sena Kilic等[3]应用LDA主题模型和情感分析技术对Skytrax排名前十的机场进行了服务体验评价分析。从目前文本挖掘技术在机场服务评价方面的应用来看,主要基于英文文本,而中文文本在数据清洗、分词处理、停用词过滤等方面差异很大,缺乏相关应用研究。


  梳理现有的机场服务评价研究成果可以发现,我国的机场服务质量评价仍以传统问卷调查、构建评价模型的方法为主,该方法时间和经济成本较高,同时容易受到抽样范围、旅客配合程度等因素影响。国外学者在研究分析机场在线评论方面已有了诸多探索,研究数据大多来自Skytrax、Google地图、Twitter等,缺乏中文用户的相关研究。因此,如何应用中文在线评论数据挖掘我国旅客对机场服务的体验评价,是本文重点探讨的问题。


  3研究方法


  3.1数据收集


  本文通过网络爬虫技术从大众点评小程序获取机场评论数据。大众点评是我国最早建立的第三方评价平台,收录商户数量超过3000万家、App活跃用户数超过2.5亿人次/月。该网站允许用户自由地分享他们的感受、体验和意见建议,并进行打分,用户间也可以通过点赞、留言等方式互动,是国内学者研究在线评论最常应用的网站之一。与其他机场在线评论网站(例如Skytrax、高德地图、TripAdvisor等)相比,大众点评的中文用户更加活跃,点评数量更多,在分析我国旅客对机场服务的体验时更加可靠。


  本文选取了我国2023年旅客吞吐量排名前15的机场[17]作为研究对象。通过网络爬虫技术采集了2015-2024年共计51883条评论数据,每条数据包含了ID号、用户昵称、评论时间、打分、点赞和评论内容,如图1和图2所示。

  3.2文本清洗


  在进行文本分析和处理之前需进行文本清洗,通过删除、替代、转换文本中的无关信息来提高数据质量。文本清洗主要包含除去非中文字符、加载专用词典、同义词转换、去除停用词、文本分词等内容。


  ①去除非中文字符


  本文去除了评论中的英文、数字、表情符号和其他特殊字符,只保留了中文字符。


  ②去除停用词


  本文在百度停用词典、哈工大停用词典等常用停用词典的基础上,增加了与机场服务无关的高频词语,例如“机场”“中国”“坐飞机”“哈哈哈”等。


  ③同义词转换


  为了提高结果的正确性和准确性,本文设置了与机场服务相关的同义词转换列表,例如将“人员”“小姐姐”“乘务员”“空姐”等替换为“工作人员”,将“牛肉面”“凉皮”“火锅”“小面”“餐食”等替换为“餐饮”。


  ④文本分词


  本文采用Python的Jieba库的精确模式进行了文本分词。由于评论中包含大量地名、航空公司名称等对机场服务分析没有意义的词汇,因此在分词的过程中,将词性判断为“机构团体(nt)”“地名(ns)”的过滤掉。同时,过滤了字符长度为1的单个字,以提高文本分析的准确性。另外,为防止分词时将特定词语分开,本文增加了一些机场服务相关的专用词语,如“网约车”“高大上”“托运行李”等。

  在杭州唯一的一个的机场,机场设备还算不错,保洁的卫生打扫得也非常及时。机场使用的饮用水直饮水史密斯的,喝着很安心呀。今天是节后的第二天,所以人不是很多,整个机场看起来比较井然有序,就是交通需要坐机场大巴直达,不过到时候就没关系啦有直达的机场快线啦。


  唯一设备不错保洁卫生打扫饮用水直饮水史密斯安心节后第二天井然有序交通大巴直达到时候没关系直达经上述文本清洗步骤后,结果如表1所示,剩下共计49823条数据。图3是词云图,表现了文本中出现频率较高的词,其字体越大,说明词频越高。


  3.3 LDA主题模型


  主题模型是一种数据挖掘方法,可以自动地从大量文件或数据中提取潜在的主题,并将对应的数据分配到相应的主题中[18]。主题模型的理念和实现最早是基于统计学的数学公式。2003年,Blei等[19]首次提出潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)进行任务处理,LDA基于贝叶斯统计学理论,将每个群文档看作不同主题的多项式分布,将每个主题看作不同单词的多项式分布,通过统计推断结果得到文档和主题之间的关联。在本研究中,文档是大众点评小程序上的旅客评论,LDA主题模型可以揭示旅客评论中隐含的共性主题。


  LDA主题模型的第一步是确定主题数量,主题数量的选取至关重要,能够直接影响模型的识别结果。通常来说,判断最佳主题数有困惑度和主题一致性两种方式。困惑度是反映模型对新样本是否适用以及是否能正确区分主题划分,当主题数量越多时,困惑度值越小。困惑度值在下降的过程中存在一个拐点,即随着更多的主题数增加,困惑度的下降趋于平缓,这个拐点通常被认为是最佳主题数,但困惑度的评判往往存在一定争议。主题一致性是通过判断同一主题下词语的语义关联性是否紧密来确定主题数量,一致性越高,说明主题内的词语能够相互支撑,主题模型的识别效果越好。Chang等[20]认为将主题一致性作为确定最佳主题数的方法更好,因为这种方法高度模拟了人的判断方式。因此,本文采用主题一致性作为判断最优主题数的指标,通过Python的Gensim库计算一致性指标的数值,最高数值所对应的主题数即为最佳主题数。


  确定主题数后,通过Python的Gensim库构建LDA模型即可得到每个主题对应的特征词列表,以及每个特征词的权重。同时,可以得到每条旅客评论隐含主题中概率最高的主题。


  3.4情感分析


  情感分析是利用自然语言处理技术识别文本中的情感、观点和态度的方法。情感分析方法主要有基于机器学习的方法与基于情感词典的方法[15]。机场的旅客评论属于短文本,通常句子表达不规范,但情感词充足,因此本文选取基于情感词典的情感分析方法。本文采用Python的SnowNLP库进行情感分析,SnowNLP是专门针对中文文本数据开发的,其情感分析是基于情感词典实现的,返回值为情绪的概率,接近1为积极,接近0为消极。


  3.5 IPA


  IPA(Importance Performance Analysis)分析法是常用于评估产品或服务的质量和性能的工具,广泛应用于市场研究、满意度调查等领域。它从重要性和满意度两个维度出发,对各个指标的改善优先级进行可视化分析。IPA分析法以重要性和满意度分别为横轴、纵轴,由重要性均值和满意度均值两条直线将平面划分为四个象限。第一象限为继续保持区,重要性高,满意度高;第二象限为过度供给区,重要性低,满意度高;第三象限为较低优先区,重要性低,满意度低;第四象限为重点改进区,重要性高,满意度低。


  4结果分析


  4.1 LDA主题建模结果


  首先,通过Python的Gensim库计算LDA模型的最优主题数,当主题数为10时,一致性值最高,实现了最优模型,具体见图4。


  其次,设置LDA模型参数:主题数为10,训练次数为30,最终得到LDA模型结果如表2所示。其中列出了每个主题所对应的贡献度排名前10的特征词,可以看到聚类效果较为明显。经过人工分析,10个主题分别描述为机场交通、乘机手续、延误、总体感受、餐饮购物、环境设施、工作人员、提取行李、接机、航站楼设计。

  将LDA主题模型结果与目前应用较为广泛的机场服务质量评价指标体系相比,结果如表3所示。LDA主题模型结果与目前的机场服务评价指标重叠较多,基本涵盖主要的服务维度,如机场交通、乘机手续、延误服务、餐饮购物、环境设施等。由于各指标体系的评价目的有一定差异,指标体系的维度、评价方法各有不同,《中国民用机场服务质量评价指标体系》(MH/T 5114-2017)侧重于机场运营,中国民用机场协会每年发布的机场服务质量评价报告侧重于行业管理,CAPSE的机场服务测评侧重于旅客服务。与现有的机场服务评价指标相比,LDA主题模型结果完全来自旅客的在线评论,是最能体现旅客真实感受的。LDA主题模型结果显示,旅客对离港时提取行李和接机方面都有一定的关注,而目前的机场服务评价指标中并不重视离港服务的内容。另外,从LDA主题模型结果中也可以看到,航站楼设计也被旅客充分关注,而这部分内容不属于机场运营服务的范畴,所以在其他评价指标中均没有涉及。

  采用pyLDAvis对提取的主题结果进行可视化,如图5所示。左图中的圆圈代表不同主题,圆圈的大小代表涉及该主题的评论数量,圆圈的分布代表主题之间的差异性。右图中是主题的前30个特征词,浅色代表这个词在全部评论中的出现频率,深色代表这个词在该主题中的出现频率。在该结果中可以通过调节λ参数(0-1)来查看词与主题的相关性,λ接近于1时代表该主题下出现最频繁的词,λ接近于0时代表该主题下更独有的词,通过调节λ参数可以排除一些无实际意义的高频词,从而更好地归纳主题。

  例如,主题1机场交通的圆是最大的,16.2%的评论都涉及了该主题。它与主题3延误有一定的重叠,说明有一部分评论同时涉及主题1和主题3。在这个主题下,当λ=1时,出现频率最高的词依次为市区、地铁、大巴、交通等,与表2的特征词相一致;当λ=0时,出现频率最高的词依次为市区、地铁、交通、距离、直达等,更凸显这个主题是与机场交通相关。


  4.2情感分析结果


  本文通过Python的SnowNLP库对每条评论进行了情感值计算,并筛除了情感值与旅客评分值极其不符的情况,即旅客打分为好评但情感值小于0.2和旅客打分为差评但情感值大于0.9的情况,最终结果如图6所示。62.6%的评论情感值大于0.9,是非常积极的情绪;8.1%的评论情感值小于0.1,是非常消极的情绪;29.3%的评论情感值在0.1-0.9之间,基本上呈均匀分布。

  不同机场的平均情感值计算结果如图7所示,其中横坐标为2023年旅客吞吐量(人次)[17],纵坐标为旅客总体评分,气泡大小代表情感值高低。从图中可以看到,上海浦东国际机场和北京首都国际机场虽然年旅客吞吐量较高,但旅客总体评分和情绪值一般;南京禄口国际机场虽然年旅客吞吐量较低,但情绪值较高;广州白云国际机场和深圳宝安国际机场运营服务最为成功,既保持了较高的旅客吞吐量,旅客评分和情绪值均较高。

  将旅客情感分析得到的机场排名与2024年第二季度CAPSE机场服务测评的排名(源自CAPSE公布的测评报告[21])采用配对样本T检验进行差异性分析,结果如表4所示,P=0.631>0.01,旅客情感分析得到的机场排名与CAPSE机场服务测评的排名之间不存在显著性差异,其差异幅度Cohen,s d值为0.127,说明差异幅度非常小。

  不同主题的情绪值如图8所示。总体感受、提取行李、离港接机和航站楼设计4个主题均表现出明显的积极情绪,而对机场交通、乘机手续、航班延误、餐饮购物、环境设施和工作人员情感值相对偏低。


  4.3识别需要改进的服务


  本文采用IPA分析法对机场客运服务的重要性和旅客满意度进行分析,确定机场改进服务的策略。重要性指标的计算方法为涉及该主题的评论数的占比,旅客提及该主题的评论越多,说明该主题重要性越高。满意度指标的计算方法为该主题的平均情感值,情感值越高,说明旅客满意度越高。随后,对重要性指标和满意度指标进行归一化处理,具体结果如表5所示。

  IPA分析结果如图9所示,10个主题分别落在了三个象限中。在第二象限有航站楼设计、离港接机和提取行李三个主题,这些服务内容对旅客来说重要性较低,满意度较高,属于过度服务供给。航站楼设计是在很多旅客评论中涉及的内容,大多赞美航站楼建造气派、宽敞、明亮。由于本文选取的是我国旅客吞吐量排名前15的机场,航站楼的设计建造水平也是一流的,因此对于航站楼设计这方面旅客满意度均较高。


  在第一象限有总体感受和工作人员两个主题,此象限为重要性较高,满意度也较高,属于应当继续保持的服务内容。总体感受是LDA主题建模分析结果之一,旅客在发表评论时没有针对某一项服务内容,而是从整体上进行评价,但这并不属于机场客运服务的某项内容,因此仅具有一定参考性,但在识别需要改进的服务方面是无效的。工作人员这一主题主要涉及工作人员的服务态度,虽然位于第一象限,但其满意度只是略高于平均值,因此还是有持续改进的必要,而改进优先级低于第四象限的服务内容。


  在第四象限有乘机手续、机场交通、航班延误、餐饮购物和环境设施五个主题,这些服务内容对旅客来说重要性较高,满意度较低,属于应当重点改进的部分。机场交通和乘机手续是重要性最高的两个服务内容,每一个旅客来到机场都会经历其他交通方式的换乘衔接和乘机手续的办理,但满意度却没有达到平均值。从差评内容来看,旅客认为机场交通的主要问题包括缺乏轨道交通衔接,公共交通夜间服务不足,出租车管理不到位等。乘机手续的主要问题包括安检服务态度恶劣,排队秩序混乱,中转不够便利,引导不清晰等。航班延误是满意度最低的内容,当发生延误时,旅客情绪往往比较消极,延误后的补救服务会影响旅客的情绪,例如延误信息公布及时准确,补偿服务到位,工作人员是否及时安抚等。


  5结论


  本文对大众点评网站上我国2023年旅客吞吐量排名前15机场的旅客评论进行挖掘分析,通过文本清洗、LDA主题模型、情感分析和IPA分析等方法,从旅客视角对机场服务进行评价。研究结果显示,基于在线评论的机场客运服务评价结果与CAPSE机场服务测评结果差异很小,说明本文提出的机场客运服务评价方法是具有一定参考性的,未来可以将旅客在线评论的情感分析作为机场服务评价的一个补充。同时,本文识别了需要机场改进的服务,其中乘机手续、机场交通和航班延误是最需要关注和优先改进的服务,这些发现可以帮助机场及时地发现旅客服务中存在的问题,改进和提升机场旅客服务质量。


  通过在线评论对机场客运服务进行评价具有现实应用价值,在线评论数据具有真实性强、时效性强的特点,获取成本小,不受时间和人力的限制。LDA主题模型和情感分析等方法能快速、准确地处理海量数据。未来研究可以扩大数据来源,例如其他在线评论网站、微博数据等;还可以进一步挖掘旅客信息,了解不同旅客对机场服务的需求。

[参考文献]


  [1]雷凌航,杨省贵.我国区域航空枢纽构建:现状、模式及对策[J].改革与战略,2016,32(2):101-106.


  [2]杨省贵,杨蒙蒙,徐昶.我国民航机场旅客投诉分析及服务提升[J].重庆交通大学学报(社会科学版),2022,22(05):38-47.


  [3]Sena Kilic,Tugce Ozansoy Cadirci.An evaluation of airport service experience:An identification of service improvement opportunities based on topic modeling and sentiment analysis[J].Research in Transportation Business&Management,2022,43:100744.


  [4]刘玉敏,靳琳琳.基于改进服务质量模型的机场客运服务质量测评[J].经济经纬,2017,34(06):81-86.


  [5]Wiredja,D.,Popovic,V.,Blackler,A.A passenger-centred model in assessing airport service performance[J].Journal of Modelling in Management,2019(2):492-520.


  [6]王琳琳,郑晓杰,余孝军.基于模糊综合评价法的贵州机场服务质量研究[J].交通运输研究,2016,2(01):65-70.


  [7]张旭.基于SERVQUAL模型的机场服务质量研究[J].民航学报,2020,4(03):19-22+88.


  [8]Allen,J.,Bellizzi,M.G.,Eboli,L.,Forciniti,C.,Mazzulla,G.Latent factors on the assessment of service quality in an Italian peripheral airport[J].Transportation Research Procedia,2020,47:91-98.


  [9]Gitto,S.,Mancuso,P.Improving airport services using sentiment analysis of the websites[J].Tourism Management Perspectives,2017,22:132–136.


  [10]Bogicevic,V.,Yang,W.,Bilgihan,A.,Bujisic,M.Airport service quality drivers of passenger satisfaction[J].Tourism Review,2013,68(4),3-18.


  [11]H.Barakat,R.Yeniterzi,L.Martín-Domingo.Applying deep learning models to twitter data to detect airport service quality[J].Journal of Air Transport Management,2021,91:102003.


  [12]June Young Park,Evan Mistur,Donghwan Kim,Yunjeong Mo,Richard Hoefer.Toward humancentric urban infrastructure:Text mining for social media data to identify the public perception of COVID-19 policy in transportation hubs[J].Sustainable Cities and Society,2022,76:103524.


  [13]马新云.基于网络评论的上海虹桥机场旅客服务质量提升策略研究[D].上海:华东师范大学,2021.


  [14]赵桂红,宁慧慧.基于LDA主题模型的航班延误服务补救意见识别研究[J].经营与管理,2024(03):13-20.


  [15]王婷,杨文忠.文本情感分析方法研究综述[J].计算机工程与应用,2021,57(12):11-24.


  [16]Lingyao Li,Yujie Mao,Yu Wang,Zihui Ma.How has airport service quality changed in the context of COVID-19:A data-driven crowdsourcing approach based on sentiment analysis[J].Journal of Air Transport Management,2022,105:102298.


  [17]中国民用航空局.2023年全国民用运输机场生产统计公报[R/OL].


  [18]王振彪,徐贞顺,刘纳,等.监督式主题模型及其应用综述[J].计算机工程与应用,2024,60(08):56-68.


  [19]Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].Journal of Machine Learning Research,2003,3(1):993-1022.


  [20]Chang,J.,Gerrish,S.,Wang,C.,Boyd-Graber,J.,Blei,D.Reading tea leaves:How humans interpret topic models[J].Advances in Neural Information Processing Systems,2009,22:288–296.


  [21]CAPSE.2023年第四季度机场服务测评报告[R/OL].