基于在线评论的预制菜主题挖掘与情感倾向性分析
林子璇 查迎春 (安徽大学商学院,安徽 合肥 230601) 摘要:以天猫预制菜产品的在线评论为研究对象,运用八爪鱼对在线评论进行爬取,并利用Python对评价数据进行情感倾向性分析以及LDA主题挖掘。研究结果表明,根据LDA主题模型得出,消费者评论主题由产品品质、商家服务、物流及包装及品牌口碑及知名度四部分组成。情感分析方面,好评中,消费者对于网购预制菜的产品总体较为满意,但缺乏高度满意情感倾向;差评方面,轻度消极情绪占比较高,高度消极情绪较少。 关键词:预制菜;在线评论;LDA主题挖掘;情感倾向性分析 随着互联网经济的发展,以及年轻一代“懒人经济”的兴起抑或年轻人消费习惯的变化,叠加上三年疫情的影响,预制菜凭借只需简单加热即可食用的优势,成为网络经济的消费热点,同时也吸引了不少研究者的关注。 关于预制菜的发展,白舒婕(2023)[1]研究了农产品网络零售的新趋势,表示农产品上行能力持续增强,农产品电商创新发展,预制菜电商成为新热点,进入升级发展阶段;赵鑫(2023)[2]通过发放问卷的方法获取数据,并通过因子分析法、二元Logistic回归模型实证分析消费者对于预制菜的购买意愿和影响因素,研究结果表明,消费者的性别、年龄、受教育程度、对预制菜的了解程度和产品保健因素和宣传因素对消费者的预制菜购买意愿有显著影响。 另外,不少研究者在文本分析方面,利用在线文本评论挖掘的方法研究网络消费者购买行为影响因素及满意度。杨铮等(2022)[3]通过八爪鱼对在线评论进行爬取后,结合LDA主题聚类和词频统计分析方法提取消费者满意度因素,并通过情感分析和TF-IDF权重来测评消费者情感倾向性,分析消费者网购地理标志农产品满意度;徐萌等(2022)[4]利用在线健康社群的评论文本,综合运用R语言、VOS Viewer,使用词频、词云和主题图谱分析方法挖掘患者关注重点,并使用和ROST CM软件对患者情感倾向进行计算从而进行患者满意度分析;雷聪等(2023)[5]利用Python对京东商城在线评论进行爬取、情感分析以及LDA主题挖掘,分析消费者对临期食品的倾向性 目前针对消费者网购预制菜满意度的研究还较少,大多基于问卷调查展开[2],具有一定程度的主观性,数据量也较为有限,可靠性随着调查项目波动存在一定风险[3]。相比于调查文件的研究方式,在线评论中蕴含着客户使用产品的真实体验、喜好及购买欲望,可以更好地对产品进行全方位、系统的精益化评估[6]。因此本文采用在线评论文本挖掘的方式分析消费者网购预制菜的影响因素及情感倾向性,分析消费者网购预制菜过程中关注的重点,为卖家提供参考。 一、预制菜的发展与趋势分析
根据德勤对中国预制菜企业和市场的访谈[7],中国预制菜市场从2017年的3000亿元升至2021年的5500亿元,年复合增长率约为16.36%。2022年,中国预制菜市场增至6199亿元;艾媒咨询(iiMedia Research)研究数据显示[8],中国预制菜市场规模预计保持20%以上的增速;根据百度指数(图11),2020-2021年底,“预制菜”一词出现在百度相关新闻头条的频次处于较低水平,普遍在200次以下,2021年5月23日前后关注度有小幅度上涨,在2021年年末热度开始增长。 图1 2020-2023.5.29“预制菜”在百度的相关新闻头条频次(单位:次) 探迹大数据在2022年中国预制菜行业报告中提及[9],目前中国各个电商平台共有10137家预制菜相关网店。其中由于疫情爆发,2020Q1当季新增数量减少,但C端预制菜因疫情受到关注,网店数量开始爆发式增长,同时随着消费者对预制菜的接受程度的提升,预制菜在2021年春节期间爆火,相关网店注册量于2021Q2迎来激增(图),并且根据天猫数据显示,速食材在内的预制菜销售火爆,成交额同比增长约2倍[2]。 图2 全量网店数量增量 从发展趋势看,预制菜越来越具有高度产业化的特点,同时受到国家政策的大力支持,是解决我国农村产品低端化销售的重要抓手,也是解决传统生鲜电商发展难以持续的新手段。由于传统农产品以及生鲜产品销售的大多是未经深度加工的以及非标准化产品,导致客单价过低、产品在运输过程中货损过大、产品容易腐烂变质、消费者难以了解农产品的质量等问题,使得我国农产品和生鲜产品的网络销售一直存在顽疾,也是导致我国农产品电商和生鲜电商虽然被市场看好,但仍未发展成熟的重要原因。预制菜的发展可能会成为解决这一顽疾的重要手段。2021年8月,在《农业农村部关于加快农业全产业链培育发展的指导意见》中,中国将大力发展以预制菜为代表的新型餐饮业,大力发展“原料基地+中央厨房+物流配送”、“中央厨房+餐厅”等新型餐饮服务模式,并对其进行了深入研究。地方政府也响应中央的号召针对当地预制菜产业制定出相应方针政策。 为了研究和更好的促进预制菜的发展,本文利用天猫平台的用户评论,进行收集和预处理后,利用词频分析、LDA主题挖掘等,进行评论的情感分析,从而找出影响消费者满意度的相关因素,从而有针对性的提出发展建议和对策。 二、研究方法和思路
本文的研究框架和思路如图所示,具体步骤如下: 步骤1:数据采集。通过天猫电商平台,以“预制菜”为关键词进行产品评论采集。利用八爪鱼进行自动更换产品、抓取评论,最后存储到数据库。 步骤2:数据预处理。将抓取到的数据导出,在Excel中对无用词直接进行替换删除,后再利用Python进行评论去重及去除非中文字符。使用“jieba”分词对评论数据进行分词操作,去除停用词。 步骤3:词频分析。将处理好的规范性数据利用Python统计词频并绘制词云图。 步骤4:LDA主题挖掘。基于相似度自适应最优LDA模型选择方法来确定主题数并进行主题挖掘分析,得出潜在主题。 步骤5:情感分析。计算每条评论的情感值,按照分值将评论区分为三个档次,并对好、差评进一步细分。 图3 本文的研究框架和思路导图 三、基于天猫店铺的预制菜在线评论数据收集和分析
1.基于天猫店铺的预制菜在线评论数据采集
天猫目前是我国最大的综合性电商平台之一,至今天猫平台月活用户高达9.39亿,用户分布广泛。2023年5月按照销量从高到低选取120家店铺利用八爪鱼采集器进行预制菜产品评论数据的采集。为了保证信息的时效性,每件商品爬取评论时间一年前的评论,共爬取6595条在线评论数据,采集到的数据包括商品名、月销量、评论时间、评论人及评论内容,如图所示。通过以上方法爬取了如咸萝卜、梅菜扣肉、牛蛙、水煮鱼等天猫商品的在线评论数据。 图4 天猫店预制菜的在线评论数据样例 2.预制菜在线评论数据去重及数据清洗 由于未经过处理的数据存在较多噪音,例如电商平台在用户超过规定时间内没有做出评价时,系统会自动为客户发表默认好评,此类数据显然没有任何分析价值。所以要对获得的文本进行预处理,包括去除无用评论、重复评论等处理方式。并且经过爬取的在线评论数据往往夹杂着数字、字母、表情及标点符号,这些数据对于分析过程没有实质性帮助。另外,在线文本数据主要围绕着预制菜本身进行评价,但随着外婆菜等一些地方名菜纷纷加入预制菜行列,在选取高销量商品中外婆菜等名词占据了较大的比例,导致“预制菜”“外婆菜”“梅菜”“扣肉”等类型的词出现的频数很大,但该类词对于分析目的没有任何帮助,因此可以对其进行删除。 本文先利用Excel对无用词直接进行替换删除,后再利用Python针对评论去重及去除非中文字符,最终获得6249条经过处理后的数据。 3.预制菜在线评论的词频分析与词云图 高频词是指文档中经常出现的词,基于在线评论中的高频词即为消费者较为重视的因素,一定程度上反映了消费者对于产品某些特征或服务的关注程度。 由于中文词不能使用空格进行区分,因此在进行词频分析之前需要进行分词处理,利用Python中“jieba”包进行中文分词,保证分词的准确性。停用词是在一些自然语言处理中被过滤掉的常见的词语,可以使得在信息检索中节省存储空间和提高搜索效率。本文汇集四大主流停词中文库:哈工大停用词表、百度停用词表、中文停用词表(中国人民大学)及四川大学机器职能实验室停用词,利用该停词表集合进行去除全局停用词,最终获得想要的分词结果,最终利用Collections库进行词频统计,并选取出现次数前40的高频词,如表1所示。 表1 预制菜在线评论词频统计前40名 绘制词云图使得分析结果可视化,可以直观展示消费者对预制菜产品特征和服务的关注程度,如图所示。从词频统计来看“味道”占据第一名,与预制菜产品本身品质相关的集中在“好吃”“口感”“新鲜”“品质”等词,可见消费者对于产品品质要求较高;从销售方来看,“商家”“服务”“态度”等次可以表达出消费者对于商家服务的要求;对于物流环节,“物流”“发货”“速度”“很快”等次反应了消费者对物流方面服务的重视;在包装方面,“冰袋”“泡沫”等词体现了消费者对于物流过程中保证食品新鲜度和口感有一定的要求;除此之外,“实惠”“性价比”等词体现出消费者对于产品价格较为关注,“肖战”“代言”“粉丝”等词体现了明星代言效应对于消费者购买此产品有一定影响。 图5 预制菜的消费者评价云图 4.预制菜消费者评论的LDA主题挖掘 为了更深入了解消费者对于网购预制菜关注的重点因素,本文利用LDA主题模型进行研究。通过Gensim库对评论文本进行LDA主题聚类计算,将主题下最独有的词语作为主题聚类结果,主题抽取的效果和潜在主题数目有直接关系[3]。基于相似度自适应最优LDA模型选择方法来确定主题数并进行主题分析,实验证明该方法可以在不需要人工调试主题数目的情况下,用相对少的迭代找到最优主题结构。
如图所示,根据实验结果:主题数为4时效果最佳,选取排名靠前的10个特征词为例,根据这些特征词对主题进行概括,结果如表所示,可知消费者对于网购预制菜的关注重点集中在产品品质及口味、商家的服务态度、物流速度和包装完好程度及品牌口碑和知名度。 图6 预制菜消费者在线评论LAD主题数寻优图 表2 预制菜消费者在线评论LDA主题聚类结果表 5.预制菜在线评论的情感分析
利用武汉大学开发的ROST CM 6软件中的“情感分析”功能计算6249条消费者在线评论情感得分,根据量化结果将情感倾向设置为好评、中立和差评3个程度,并统计出各情感倾向所占的比例。如表所示,消费者对于网购预制菜的体验总体满意度良好。78.86%的消费者给予了好评,好评率较高,10.24%的消费者保持中立,10.90%消费者给出了差评。 表3 预制菜消费者在线评论情感倾向性所占比例表 根据情感值得分可以发现分数由-100~+100不等,为了进一步针对情感倾向进行分析,现将好评和差评进一步细分为3个维度。如表所示,对于好评情感倾向的评论数来说,其细分情感倾向较为均衡,占比在26.28%上下浮动,说明消费者对于网购预制菜满意度较高,但是好评倾向并没有特别强烈,所以对于商家及供货商来说,仍然有较大的进步空间。在差评情感倾向数据中,轻度消极倾向占比最高,中度和高度情感倾向所占比例较小,可以反映出虽然存在一定数量的差评,但总体程度较轻,这要求商家需要及时关注消费者的需求,提高产品品质、物流速度、包装完整度以及服务态度等因素。 表4 预制菜消费者在线评论细分情感倾向占比表 6.结论及建议
根据以上分析,可以得到如下结论: (1)基于词频统计和词云图分析,初步判断消费者对于预制菜的关注热点集中于味道、物流、包装、服务等方面。 (2)依据LDA主题模型,消费者评论主题主要涉及四个方面:产品品质、商家服务、物流及包装及品牌口碑及知名度。可见消费者除了基本的产品口味外还更加关注食品的品质,例如肉质及新鲜度;同时除了物流的速度以外更加关注包装情况,例如是否有冰袋保证新鲜和口感;另外商家的服务态度和品牌口碑也成了消费者选择产品的重要影响因素,也说明了在食品方面,明星代言也具有一定的影响力。 (3)消费者对于网购预制菜的产品总体较为满意,但缺乏高度满意情感倾向,充分说明该产品及商家仍然有较大的进步空间;差评方面轻度消极情绪占比较高,高度消极情绪较少,说明虽然存在部分差评但总体问题并不是特别严重。总的来说该领域仍然需要通过不断完善来满足消费者的需求,比如可以从挖掘出的主题模型角度出发。 基于以上结论,本文针对卖家提出如下发展预制菜的建议: 1、注重产品口感,提升产品品质。预制菜主要分为五大菜系:东南亚预制菜、韩式预制菜、西式预制菜、日式预制菜和中式预制菜,还可以进一步细分。为了满足消费者对预制菜的多样化需要,企业应在多个细分领域加强产品的开发。由于一些预制菜的特殊之处,企业还需要兴建冷链物流基础设施、改进液氮速冻等食品加工技术,以保证最大程度地还原产品的味道。此外,还可以与优质的物流企业进行合作,确保运输的时效性,为客户提供高质量的上门配送服务,将商品存放在快递点的时间降到最低。在包装上,更多的用泡沫缓冲减震,用冰袋及真空包装来保持新鲜。总体而言,通过加快配送速度,优化配送流程,缩短配送时间,从而保障预制菜的最佳味道。 2、改善服务质量,密切客户关系。加大对客服的培训力度,提升客服的响应速度,充实对店内产品的介绍,并训练一群优秀的客户服务人员,及时处理与顾客之间的消费纠纷;扩大店铺的活动数量和规模,既能确保自己的收入,又能提升商品的性价比,更好地为消费者提供利益;同时加快发货速度,快递选择方面可根据客户需求选择自己满意的物流进行发货;产品选择方面,可以设置产品组合套餐,采用关联营销的方法,在盈利的同时,消费者也可以按照自己的偏好自由组合产品,享受套餐优惠服务;建立VIP会员制度,会员制度适合维系老客户,从而最大化用户生命周期价值。 3、完善推广策略,提升品牌知名度。在店内推广方面,通过店铺装修提高品牌识别度,提升消费者浏览体验,同时新增自定义活动页面,引导消费者更好了解店铺的活动内容;在站内推广方面,可以通过微淘、平台活动、直通车、提升自然流量等手段进行推广,增加产品的曝光度;站外推广方面,将互联网宣传途径充分利用起来,例如小红书、抖音等自媒体平台,开通官方账号实现引流推广,还可以通过明星代言、网红直播带货等方式提高知名度。 四、结束语
本文首先总结分析了我国预制菜发展的前景和发展趋势,可以看出无论是资本市场还是相关政策层面上,预制菜的未来发展都是大势所趋。以天猫店铺为研究对象,收集了部分店铺预制菜的在线评论,采用LDA主题模型和情感分析方法,分析总结了影响消费者满意度的一些因素,从而提出了一些针对性建议。 由于预制菜的网络零售依旧处于快速增长期,本文选择的样本店铺和产品品类有限;同时,在线评论的选取量也较小,有可能会对本文的结论有一定的影响。同时,本文选择的预制菜没有进行分类讨论,而预制菜的品类极其丰富,消费者的满意度影响因素可能也有些不同,这也是后续研究可以拓展的方向。 参考文献: [1]白舒婕. 农产品电商将进入中高速发展期[N].国际商报,2023-03-22(002). [2]赵鑫.消费者对预制菜购买意愿及其影响因素研究[J].中国集体经济,2023(5):73-76. [3]杨铮,牟元苇.基于在线评论的消费者网购地理标志农产品满意度测评研究[J].情报探索,2022(9):103-110. [4]徐萌,张思文,肖文.基于患者评论的在线健康社区主题挖掘与情感倾向分析——以好大夫在线为例[J].现代商贸工业,2022,43(20):238-240. [5]雷聪,罗翔,熊颖,鄢华.基于在线评论的临期食品主题挖掘与情感倾向性分析——以京东临期牛奶为例[J].现代食品,2023,29(3):20-22. [6]侯海青,龚雅静.网络口碑对消费者购买意愿影响研究综述[J].西安石油大学学报(社会科学版),2019,28(3):52-57. [7]前瞻产业研究院.2023年中国预制菜产业白皮书[EB/OL].(2023-03-15)[2023-06-03]. bg.qianzhan.com/report/detail/2303151615020839.html#read. [8]艾媒咨询.2023年中国预制菜行业发展趋势研究报告[EB/OL].(2023-03-10)[2023-06-03]. www.iimedia.cn/c400/83927.html. [9]探迹.2022年中国预制菜产业洞察报告[EB/OL].(2022-10-26)[2023-06-04]. www.tungee.com/support/business-share/detail/63574f15205d57413e645772.html |