基于文本挖掘的生鲜电商客户满意度研究
——以京东生鲜为例 李芳1 黄颖茜2 1.广东科贸职业学院管理学院 广东清远 511518 2.广东科贸职业学院信息学院 广东清远 511518 摘要:互联网的快速发展和人们消费方式的转变,给生鲜电商的发展带来了新机遇。本文以京东生鲜客户的在线评论为数据源,利用网络语义分析和情感分析等文本挖掘技术,分析自建物流模式下的京东生鲜会给客户的购物体验带来那些影响。研究结果表明,京东生鲜客户对于该购物体验总体表示满意和赞赏,特别是服务体验获得了最高的满意度,但是对新鲜程度、味道、包装等影响因素却表达了较多的消极情绪,说明平台还是需要不断改进以获取更多的客户满意度。 关键词:生鲜电商;客户满意度;文本挖掘 一、引言
随着当今科学技术的日新月异,生鲜的销售模式也从菜市场直接搬上了网络。自2020年初新冠疫情爆发以来,由于封锁管理、居家隔离等政策,消费者对电商生鲜类产品需求猛增,但是生鲜电商和传统的综合性电商有着本质的区别,生鲜产品对配送时间、配送条件要求苛刻,甚至在配送区域上也有所局限。这些都极大的影响了生鲜电商用户的体验。而物联网技术的出现,大大提升了冷链物流系统自动化和信息化进程,物联网与冷链物流的智能结合能保证生鲜产品在生产、运输、贮藏、销售,以及最终到达消费者手中这一过程的环境温度都能符合规定条件。本文通过文本挖掘技术,分析京东生鲜电商客户的在线评论,挖掘影响客户满意度的影响因素,以给生鲜电商企业的发展提供参考价值。 二、国内外研究现状
关于本文的现有文献可以分为3大类:(1)生鲜电商平台研究(2)客户满意度研究(3)在线评论文本挖掘研究。 (一)生鲜电商平台 对于生鲜电商平台的研究,大多数集中在生鲜电商现状以及发展模式上,如冯薏璇、郭传好(2020)[1]分析了电子商务在生鲜领域的发展过程,深度解析了如今的发展现状。张小玲(2020)[2]总结了目前我国生鲜电商行业的商业模式的特色。Wang和Cao(2021)[3]研究在价格折扣条件下生鲜电商冷链物流合作配送路径优化问题。 (二)客户的满意度 客户满意度的影响研究大多数采用的是问卷调查的方法,石胜贵、梁鑫(2021)[4]使用问卷调查的方式,并采用卡诺模型中的直接标度法研究消费者线上购物中,不同因素对顾客满意度的影响情况,并且从不同角度对提升顾客满意度提出建议。范雨琛、陈嘉欣(2021)[5]通过调查消费者相关数据,采用交叉分析和多元相应分析,来研究消费者对生鲜电商满意度情况以及购买行为的影响,并从多方面提出相关建议。Chen(2020)[6]利用问卷调查的方法研究生鲜电商物流配送服务对消费者满意度的影响,发现在物流配送服务质量中,交付服务质量、时间性、信息服务质量和便利性对顾客满意度有直接正向影响。 (三)文本挖掘技术 文本挖掘技术的研究大多数结合各行各业,从不同角度进行,主要目的是为了获取文本信息挖掘用户满意度影响,Chen WenKuo(2020)[6]等人使用文本挖掘的方法,研究顾客对线上快餐行业的声音。Li和 Song(2021)[7]采用文本挖掘的方法探索冷链物流顾客满意度,发现速度、价格、运输和产品质量显著影响顾客正面情绪,错误处理和服务人员分别是影响顾客中性和负面情绪的显著因素。Xun(2022)[8]通过酒店在线顾客评论,考察了时间与顾客满意度之间的关系。 基于以上,我们发现生鲜领域在这几年受到资本家的追逐,但是发展时间并不长,还处于不断摸索阶段,大多数研究关注的是生鲜电商的发展方向和前景。在客户满意度上的研究大多数基于问卷调查的方式去挖掘用户的满意度,获取的数据真实性难以保证。总的来说,基于文本挖掘技术去探索生鲜电商在线评论的研究还相对较少,本文以客户在京东生鲜平台上的在线评论为数据源,结合词频统计和网络语义分析,对客户进行情感分析,然后通过TF-IDF模型提取客户关注的属性,发现影响客户满意度的消极和积极因素。 三、研究思路
近年来,生鲜领域市场角逐不断,其中京东利用自建物流的优势,在生鲜市场领域占据着一定的霸主地位,其冷链物流结合物联网技术、大数据与人工智能等新兴技术,打造全流程可视化的智能温控平台,确保全程温度可视、品质可控,不断突破冷链行业的技术瓶颈,让消费者可以在更短时间收到新鲜商品。 本文通过抓取京东生鲜电商平台的客户在线评论,利用文本挖掘技术分析京东自建物流模式下给客户带来的不同体验,深入挖掘客户的满意度影响因素。 (一)数据获取 本文使用八爪鱼采集器进行数据获取,通过在八爪鱼打开目标网页链接,然后设定数据采集规则和流程,最后从页面源代码中提取想要的信息,保存为想要的数据格式。通过以上的流程分别抓取京东生鲜五大类别的产品,抓取评论的商品类别和商品名称如表1所示。此次一共爬取19818条评论文本,并将数据保存为Excel格式,截取部分评论内容如图1所示。 表1 商品选取列表 图1 采集的数据集样例 (二)数据预处理 数据处理第一步是文件的合并,将在京东生鲜抓取到的评论数根据需要进行合并。由于顾客的评论具有随意性,数据会出现冗余和乱码,所以我们需要对抓取到的数据进行数据清洗、集成和消减,也就是分别进行删除重复值、去除空格和脱敏字符、分词、删除停用词等操作。最终获得京东生鲜 17774 条有效评论。处理后的评论数据如图2所示: 图2 京东生鲜评论预处理后的分词数据 (三)词频统计 通过在python中导入词云生成库wordcloud和matplotlib库屮的相关函数,对分词后的评论数据,绘制词云图。在词云图中,词频的高低和重要程度通过词语的大小和颜色深浅来呈现,词语大说明在评论中出现的频率较高,颜色深说明客户的重视程度高,评论生成结果如图3所示: 图3 京东生鲜评论词云图 (四)基于词云图的特征分析 通过图3,我们发现 “不错”“很好”“好吃”“新鲜”“喜欢”是评论文本里出现频率较高的特征词,说明京东生鲜客户对京东生鲜的购物体验总体是好的。同时,我们发现客户的关注度倾向于新鲜、包装、物流、味道、口感、快递、速度、便宜等。 总的来说,消费者首要关注的是到手的产品新鲜度和口感,并且会对包装、快递送货服务、价格也有一定的要求,而要保证生鲜产品的新鲜度和口感,需要做好源头品质把控的同时,还需要提高冷链物流的配送速度以及保鲜能力。而包装的完整度和价格也体现在物流环节是否能够实现物流员工的整体高素质和物流成本的最小化。 (五)网络语义分析 通过词云图的特征分析,可以从顾客评论里找到他们的关注因素,但无法发现不同因素之间的关系。所以需要通过ROSTCM6文本挖掘软件对京东生鲜的评论文本进行“社会网络和语义网络分析”,以便得出主要特征词之间、特征与评价词之间的关联关系,分析网络图中的中心节点,进一步分析评论特征。 图4 京东生鲜评论语义关联词频 图5 京东生鲜评论语义关系网络 图 5中,“京东”“包装”“物流” “新鲜”这几个词是京东生鲜整个网络图中的重要节点。结合图4进一步分析发现这几个词出现的频率也很高,是客户重视的核心词汇。 与“京东”密切关联的评价词有“很快”“新鲜” “方便”“放心”表现了总体上客户对京东生鲜的评价是正面的。除了一些情感评价词外,还有一些展现客户关注因素的词,也体现了客户对“物流”“快递”“包装”“送货”的关注度。 与“包装”密切关联的评价词有“物流”“新鲜” “购买”表现了包装设计的好坏在一定程度上对产品的新鲜度也会有影响,并且也会影响客户的再次购买欲望以及对京东物流的品牌满意度。 与“物流”密切关联的评价词有“京东”“新鲜”“很快” “包装”“购买”,表现了京东物流在客户心目中的品牌认可度。 (六)评论文本情感倾向性分析 利用 ROSTCM6 对京东生鲜的评论文本分别进行情感分析,详细结果如表2所示,客户体验的积极情绪占据绝大部分,为67.54%,表明大多数客户对于此次消费体验表示满意;中性情绪和消极情绪京东生鲜共占 32.46%,表明部分客户对此次消费体验感到不满意,平台还有需要改进的地方。 表2 京东生鲜评论整体情感分析结果
(七)TF-IDF模型提取属性 通过情感分析,我们获取到京东生鲜平台的客户积极情绪和消级情绪评论,并把不同的情绪评论另存为txt文件,部分消极情绪评论信息如图6所示,结合词频统计以及网络语义挖掘,我们提取出新鲜、味道、物流、包装、快递、服务、价格这七大影响因素,并基于TF-IDF和改进的TF-IDF算法,使用ROSTCM6工具分别计算京东生鲜平台的积极和消极评论数据的TF-IDF值,得到客户消极情绪和积极情绪在这七大影响因素的体现,结果如图7所示: 图7 客户满意度7大影响因素对比图 通过图7,我们发现京东生鲜客户评论满意度里,服务的消极情绪占比是最低的,说明消费者对京东生鲜平台的服务体验满意度最高,但是新鲜的消极情绪占比最高,且新鲜、味道、包装这三个影响因素的消极情绪占比都超过了10%,极大的影响了消费者的整体体验,是需要重点改进的地方。 (八)改进策略与建议 消费者关注的7大影响因素里,积极情绪占比全部都高达80%以上,这成绩在要求苛刻的生鲜市场领域已属不易,客户能获得如此高的消费体验得益于京东的智能供应链服务能力以及不断完善的冷链物流。但是,生鲜领域越加激烈的竞争以及消费者需求体验的不断升级,决定了消费者的体验没有最好,只有更好。企业想要长期发展,就需要不断挖掘出影响消费者满意度的痛点,不断完善以获取更多的消费者满意。 (1)除了关注自建物流的速度优势外,还需要注意的是生鲜品质把控的首要关键是在选品上,即要从源头产地严把生鲜质量关,对不新鲜和味道不好的生鲜产品严格排除在外。 (2)依托京东社会化数字供应链能力,不断与更多品质生鲜产业带达成合作,在满足消费者多元化消费需求的同时,切实帮助更多品牌及地方农户增收,并推动中国生鲜产业不断升级,实现高质量发展。 (3)为了缩减物流成本,往往会在包装上做文章,但是包装的太过随意和简陋可能会导致无法实现对产品的安全保护,最终到消费者手中就是一个变形的包裹,这在很大程度上影响消费者的体验,可以采用质量好的循环包装,能够保证运输产品安全的同时,达到循环、绿色、降本的目的。 四、结语
本文通过网络语义分析和情感分析相结合的方法对京东生鲜消费者评论数据进行文本挖掘与分析,获取京东生鲜消费者的关注评论词与情感倾向,该方法能够有效挖掘生鲜消费者评论中隐含的深层信息,为生鲜电商平台建设提供建议和帮助。但是文中对于生鲜电商平台的评论研究还可以有很大的进步空间,比如: (1)本文只挖掘了京东生鲜的评论文本,缺少对比分析,可以通过不同平台的不同模式的对比,进行更为全面的综合评价,会更有意义。 (2)本文所用的情感分析方法依赖于已有软件,导致情感分类并不能实现百分百的精准性,后期可以尝试运用基于机器学习的方法对评论文本进行聚类以及情感分析,进一步提高实验结果的准确性。 参考文献: [1]冯薏璇,郭传好.国内生鲜电商的平台模式及其发展趋势研究[J].商业经济,2020(9):59-62+72. [2]张小玲.基于多案例研究的中国生鲜电商商业模式分析[J].安徽农业科学,2020,48(18):224-227. [3]Wang Xinxin,Cao Wujun. Research on optimization of distribution route for cold chain logistics cooperative distribution of fresh e-commerce based on price discount[J].Journal of Physics: Conference Series,2021,1732(1). [4]石胜贵,梁鑫.顾客网络购物满意度分析[J].物流科技,2021,44(2):53-55. [5]范雨琛,陈嘉欣,龚佳旻,罗嘉濠,张焕宇.消费者网上购买生鲜农产品行为研究[J].安徽农学通报,2021,27(2):135-137. [6]Chen WenKuo,Riantama Dalianus,Chen LongSheng. Using a Text Mining Approach to Hear Voices of Customers from Social Media toward the Fast-Food Restaurant Industry[J]. Sustainability,2020,13(1). [7]Ming K. Lim,Yan Li,Xinyu Song. Exploring customer satisfaction in cold chain logistics using a text mining approach[J].Industrial Management & Data Systems,2021,121(12). [8]Xu Xun. A growing or depreciating love? Linking time with customer satisfaction through online reviews[J].Information & Management,2022,59(2). |