卢米雪 王睿 邹林希 李善美 董泽江 赵星麟 湖北经济学院信息管理与统计学院
摘要:近年来,自热食品中作为主食的自热米饭以其方便快捷等优点快速占据速食产品市场。从消费者视角出发,通过电商平台评论数据和问卷调查数据,对自热米饭消费者群体的消费方式、消费偏好等基本特征进行分析,并基于有序Logistic模型实现了对消费群体的画像,最后通过自热米饭精准推荐模型的构建完成了对消费者的产品推荐。研究不仅是对现有文献的有益补充,同时对于提高消费者体验、促进自热食品行业发展具有重要的现实意义。
关键词:自热米饭;消费群体画像;产品精准推荐
一、引言
近年来,在以方便面、挂面、速冻食品为典范的速食产品市场中,自热食品因其不用火,不用电,食品自己就可加热,受到人们尤其是疫情期间居家人群的热捧。其中作为主食的自热米饭以其“一人食”场景、健康时尚、方便快捷等优点呈现出井喷式增长。据中研研究院《2021-2026年中国自热米饭行业市场发展深度调研与趋势预测研究报告》指出,2015-2018年,自热米饭市场规模由2.3亿元增至44.9亿元,年度增长169.3%,2020年市场规模预计将近70亿元,并有望在未来继续保持较快增长态势。与此同时,作为一款新兴产品,自热米饭的市场潜力还未完全激发和释放,正处于“承前启后”的发展阶段。因此如何增强用户粘性,扩大用户数量,成为促进自热米饭产业发展的重中之重,同时对于自热食品行业发展也具有一定的参考和启发意义。
李建婷认为自热米饭作为一种新型式的方便食品,富有营养、绿色健康,符合大多数国人饮食习惯,也推动了方便食品更深入的研究和发展[1]。对加工和包装工艺的研究,康东方等人认为可以利用组合干燥技术等先进技术及设备,来提高自热米饭的干燥效果和食用品质[2]。朱丹实,刘贺,李君等提出从包装结构设计入手,在饭盒外侧壁设计弧形的凸起,提高热对流的强度从而保证米饭的口感[3]。对于自热米饭的现阶段发展,袁依湄认为对于自热米饭产品本身,用户体验和成本不易达成平衡[4]。自热米饭在国内市场销售之初就以群众难以接受的较高价位切入市场,这种做法不易撬动消费动机[5]。对于自热米饭安全问题,吴晓娟等人认为建立安全生产关键监管数据化方法,推进食品安全大数据共享和应用,有利于食品安全的社会共治[6]。蔡红亮表示,自热食品要成为中国标准化餐饮,且向全世界推出标准的“中国料理”[7];克里斯·安德森认为,现如今社会经济富饶,消费者的选择面增多,成为“挑剔”的鉴赏者,我们需差异化定位以满足消费者的胃口[8]。Chen X等提出用冷冻干燥,热风干燥等技术提高方面米饭的食用品质[9]。Kumalasari R等提出对米饭杂粮原料的有效筛选,保证自热米饭的良好口感 [10]。德勤在关于中国零售市场方面提出“零时差消费”的概念,自热米饭产品的下一步增长点应该在创新口味的同时,从现有市场模式下从产品,地点,渠道转向24小时市场,以求获得更大的市场分额[11]。
可以看出,当前关于自热米饭的研究尚处于起步阶段,且研究主要集中于对自热米饭的加工工艺、加热方式、发展前景等方面进行探讨。事实上,作为新兴产业的自热米饭,市场潜力还有待挖掘,不仅要关注于“产品”,同时还要密切关注产业发展的另一核心要素即“消费者”。据此,研究从消费者视角出发,基于网络爬取数据和问卷调查数据,不仅对消费者群体的消费特征进行分析,实现了对消费者群体的画像,还构建出自热米饭的精准推荐模型,多角度提升用户的消费体验、增强用户粘性。这不仅是对现有文献的有益补充,同时对于促进自热米饭产业发展具有重要的现实意义。
二、数据来源和自热米饭消费者基本特征分析
(一)数据来源
1.网络爬取数据
考虑到当前电商平台网络购物已成为人们生活中普遍的消费方式。因此,以三全自热米饭为例,首先基于京东平台评论数据进行文本挖掘,共爬取8084条评论数据,经过数据预处理后进行关键词分析,利用LDA主题模型实现对文本评论数据的情感倾向性判断以及所隐藏信息的挖掘与分析,以有效、准确的从互联网电商评论数据中分析出消费者对自热米饭的好评、关注点以及抱怨点,对自热米饭的优缺点有了初步的认识,为线下问卷调查提供方向和思路。
2.调查问卷数据
采用问卷调查法,以武汉市常住居民为调查对象,采用分层抽样和三阶段抽样相结合的概率抽样调查方式,最终发放问卷1286份,回收1122份,有效回收率87.26%。对有效问卷进行信度检验,发现问卷中两个量表的Cronbach’s α系数分别为0.813和0.792,表明问卷具有较高的信度。再对问卷的结构效度进行KMO统计量检验,KMO统计量为0.979,表明问卷具有较高的效度。调查数据的信度检验、效度检验、独立性检验均通过,调查结果真实可信。
(二)自热米饭消费者基本特征分析
根据问卷调查数据,自热米饭消费者中,女性所占比例为59%,明显高于男性,可以看出女性对自热米饭的购买欲望及需求比率略大于男性。从年龄上看,20-39岁消费者所占比例达到58.31%,结合“职业”的调查,发现这部分消费者多为在校大学生或步入社会的年轻白领,他们对于自热米饭这一新鲜事物接受度较高,且出于学业或工作原因更为偏好自热米饭这一方便、快捷、时尚的方便食品。拥有专科及以上学历的用户所占比例为68%,表明接受过高等教育的用户是自热米饭的主要消费群体。从收入上看,被调查的消费者中月收入在3000-5000元占比最高,8000以上占比最少,说明自热米饭作为速食食品价格较为实在,可以满足大部分用户对食品“物美价廉”的需求。
从购物方式上看,消费者主要通过传统的超市购物和电商平台进行购买,分别占比49%和37%。在线下购物中,消费者购买自热米饭较为关注的因素主要包括商品质量、商品价格、商品保质期和商品安全性,比例分别达到57.99%、47.46%、44.37%、42.16%。线上购物中,消费者较为关注的因素主要为商品的评价、售后保障服务、商品店铺口碑,比例分别达到63.36%、41.50%、33.77%。
消费者选择自热米饭的主要原因为 “出门在外,吃饭不易”和对于新产品的“尝鲜”心理。在自热米饭的品牌形象调查中,无论是什么品牌,消费者印象最深的都是使用方便和宣传力度大,说明自热米饭作为速食产品,方便快捷是其最吸引消费者的特点。其中,海底捞的知名度更高,且消费者的认可度也较高;三全的性价比更高,自嗨锅的米饭和配菜更受消费者青睐。在自热米饭的口味选择上,消费者更偏爱辣味,占比为44.74%;喜欢搭配的产品为咸菜和饮品,占比依次为44.21%,33.68%。
图3 自热米饭的品牌调研结果
三、基于电商平台评论数据的文本挖掘
(一)词云分析及情感倾向分析
选取目前自热米饭市场销量较高品牌之一的三全,通过抓取京东平台上对于三全自热米饭的评论数据,使用关键词词云分析、文本情感倾向分析与LDA 主题模型等文本挖掘方法,实现对文本评论数据的情感倾向性判断以及所隐藏信息的挖掘与分析,以期有效、准确的从互联网电商评论数据中分析出消费者对三全自热米饭的好评度、关注点以及抱怨点,从而对三全自热米饭的优缺点进行初步的评价,优化实地调查环节中的调查问卷,改进实地调查方案。
图4 三全自热米饭相关文本词云 图5 文本情感分析结果
从词云图中可以看出,三全、方便、味道、自热、不错、好吃等词的频率较高,这些词语都是自热米饭的主观定位词语,说明大众对于自热米饭的定位及其优势还是比较看重的。“方便”作为最显眼的关键词说明方便是自热米饭的重要特征之一,消费者对于自热米饭的方便特性关注较多。在口味方面,“味道”、“红烧”、“好吃”等关键词说明自热米饭要持续提升产品口感,抓住消费者的胃。应用场景是自热米饭的一大诉求,从进餐地点来看,“出去玩”等外出场景使用较多,表明“出门在外,吃饭不易”是人们选择自热米饭的主要原因。从情感倾向图中可知,积极评论1863条,约占80.41%,中性评论265条,约占11.44%,消极评论189条,约占8.15%,表明绝大多数消费者对于三全自热米饭持有积极态度,对三全自热米饭的满意度较高。
(二)LDA 主题分析
进一步的,为了得到不同情感倾向下用户对自热米饭的反馈情况,在情感分类结果的基础上,对不同情感倾向下的潜在主题分别进行挖掘分析。经过LDA主题分析后,评论文本被聚成3个主题,每个主题下生成10个最有可能出现的词语,其中积极情感主题词列于表1,消极情感主题词列于表2。
表1 积极情感主题词 表2 消极情感主题词
从积极评论主题词可以看出,主题1主要反映了自热米饭的应用场景和产品优点,自热米饭在大家外出游玩、野餐时,由于打开即食的便利性最为消费者青睐。主题2反映出消费者对于京东商城提供的同城配送、送货上门、当日达等服务十分满意,在当前网络购物盛行的环境下,商家服务的质量、物流配送效率也会影响到消费者对自热米饭的满意度。主题3表明自热米饭的口味鲜美,随时随地使用方便这些优点让它得到了消费者的一致好评。
从消极评论主题词可以看出,主题1反映出消费者对于自热米饭不满主要来自于口感不佳、难吃以及分量不足。主题2反映出部分商家的发货慢、与店家的沟通不畅等问题是另一抱怨点。主题3表明还有部分消费者对自热米饭的包装以及安全性存在顾虑。
综合消费者的积极和消极评价,自热米饭作为食品类产品,消费者最为关注的是其口味、规格、营养以及安全性。其次与商家的沟通情况、物流运输效率也会影响到消费者对自热米饭的满意和购买情况。在使用场景上,“出门在外”比如野餐、景区游玩等是其最常用场景,此时方便快捷的自热米饭能够很好地满足用户“随时随地,好好吃饭”的需求,因此尤其受到用户喜爱。
四、自热米饭消费群体画像
为了更加深入的分析用户的基本信息与关注因素对自热米饭购买意愿的影响,运用有序logistic回归模型对自热米饭的消费者信息及关注因素进行分类,以此来得到自热米饭消费者群体画像。这里,为了探究自热米饭的购买意愿的影响因素,首先对用户基本信息、购物关注点与购买意愿进行列联表独立性检验,结果列于表3。
表3 用户基本信息和购物关注因素对自热米饭购买意愿的列联表分析
根据列联表独立性分析结果,在检验显著性水平取0.05时,消费者基本信息包括性别、年龄、收入、购买方式对购买意愿存在显著影响;在消费者购物关注因素方面,商品关注程度、促销关注程度、服务关注程度对消费者购物意愿存在显著影响。接下来,以消费者的购买意愿为因变量,构建有序Logistic回归模型:
表4 模型各变量拟合结果
从拟合结果可以看出,男性的回归系数小于0,Exp(β)=0.25表明男性对自热米饭的购买意愿约为女性的0.25倍,女性更愿意为自热米饭消费,是自热米饭消费的主力军。从年龄上看,Exp(β)先随着变量年龄上升而增大,后逐渐减小,表明处于20-29岁年龄段的人群购买意愿最高,大学生等年轻群体对于自热米饭等速食产品更感兴趣,自热米饭方便快捷的特性能够满足年轻群体的生活需求。收入在3000元以下和3000-5000元的低收入人群购买意愿更高,购买意愿均约为对照组的3倍,结合对应收入群体的年龄和职业,发现主要集中于大学生、职员等年轻群体,他们的收入普遍不高,因此物美价廉而又新奇时尚的自热米饭受到他们的喜爱。购物方式为超市、便利店以及传统电商的人群购买意愿更高,均约为对照组的两倍,造成此现象的可能原因是这两种方式是目前购买自热米饭的主要方式,同时这两种方式分别是线上与线下较为便捷的购物方式。同时,商品、促销、服务的关注度都对购买意愿有着正向影响,随着人们对商品品质、促销方式、服务质量关注程度的提升,人们会更加愿意购买自热米饭,其中,促销和服务对消费者的购买意愿有着更为显著的影响。因此商家在未来发展中,不仅要准确识别自热米饭的易用人群,精准地找到消费者,同时在持续提升商品品质时,还要特别关注商品的宣传、销售方式和商家服务质量,多举措并举促进自热米饭产业发展。
五、自热米饭品牌的精准推荐
针对自热米饭消费者群体,进一步的基于BP神经网络和随机森林模型对其进行自热米饭品牌的精准推荐,以此来提高用户体验,增强用户粘性。
(一)特征变量筛选
在构建精准推荐模型之前,首先基于随机森林算法对于变量进行重要性筛选,函数输出每个变量的重要性结果呈现于图6。
图6 模型特征重要性筛选
仍然以显著性水平0.05位标准,筛选出重要性大于0.05的变量,即剔除职业,信息关注得分,服务关注度得分,运输关注度得分这四个变量,将月收入、购物频率等其余9个变量带入后续模型进行分析。再将样本数据分为训练集和测试集训练集,训练集与测试集比例为7:3。
(二)BP神经网络模型的建立与优化
分别利用LM法、贝叶斯正则化算法、量化共轭梯度法对模型进行拟合,输出其拟合结果,通过比较测试集、测试集的拟合效果和预测的标准误差MSE来比较三种算法拟合结果的好坏,以选择出模型拟合效果好、预测标准误差小的算法来拟合模型。三种算法拟合结果列于表5。
表5 三种算法的拟合结果比较
由三种算法的输出结果可以看出,量化共轭梯度法整体拟合效果最差,LM法虽然预测标准误差最小,但由于其在训练集上的训练效果很差所以导致模型整体拟合效果不佳,因此最终选择贝叶斯正则化算法来拟合神经网络。
(三)随机森林模型的建立与优化
首先,利用分类器将各个参数设定为默认值,进行初次建模,来看模型本身在数据集上的效果,以此检验模型是否适合此数据集。输出的模型的预测准确率为0.829,由此可以看到随机森林在此数据集上的预测能力还是非常不错的,但还需通过对模型参数的调整来进行进一步的优化。
其次,调整随机森林中树个数的参数。为了确定参数对模型整体准确率的变化趋势,通过从0到200每10个数为一个阶段绘制学习曲线,从图中可以看出参数最佳的范围在[25,35]。根据更加精确后的范围,进一步优化学习曲线,结果呈现于图7。
图7 参数调整优化的学习曲线
从图7中可以确定参数的最优值32,此时预测准确率为0.825,虽然在预测准确率上没有很大改变,但在模型复杂度与运行效率上有了一定提升。
同理,以此调整最大树深度参数、最小子节点样本参数、最小节点样本数参数、最大特征个数参数,绘制其限制范围后优化的学习曲线,同时输出最佳参数值和模型调参优化后的预测准确率。将上述各最佳参数带入得到最终模型,输出其预测准确率为0.8416,预测标准误差为0.0316。
(四)模型比较
将BP神经网络模型和随机森林模型的预测准确率和预测标准误差进行比较,发现随机森林在预测的准确率上比BP神经网络明显要高,且从运行效率上来看,随机森林的训练与预测速度都比BP神经网络要快。因此尽管在预测的标准误差上随机森林的误差要略大于BP神经网络,但综合比较后,最终选择应用随机森林模型作为最终的品牌精准推荐模型。
表6 BP神经网络模型和随机森林模型的结果比较
将随机森林模型在实地调查中进行精准推荐的试应用:例如某被调查者信息为男性,30-39岁,本科,普通职员,月收入5000-8000元,主要购物方式为淘宝、京东等电商方式,购物频率为一周一次。根据这些信息,根据随机森林精准推荐模型,认为该用户适合海底捞品牌的自热米饭。
六、结论与建议
根据前文的研究,可以得出以下结论:
(1)在消费者特征方面,消费者对自热米饭的总体满意度较高,达到80.41%。消费者通过电商平台购买自热米饭时对其便利性与口味表示满意,对于物流方式与运输时效性不满意,对使用安全性仍存在顾虑。相比线上购物更关注商品评价和售后保障服务,线下购物则主要关注商品质量和价格。消费者的购买动机主要在于“出门在外,吃饭不易”和“尝鲜”心理。品牌上,海底捞的知名度和消费者认可度更高,三全性价比更高,自嗨锅的米饭和配菜更受消费者青睐。
(2)在自热米饭的群体画像方面,自热米饭的主要目标群体为年龄在20-39岁、收入在3000元-5000元、女性消费群体。超市、便利店购物和传统电商购物如京东购物是他们购买自热米饭的主要渠道,同时相对于对商品的关注,他们对促销活动、服务质量的关注程度更高。
以提升消费者的购买意愿和消费体验,提高用户粘性为目标,根据研究结论,提出以下建议以促进自热米饭行业发展:
(1)针对消费者的关注点和抱怨点进行产品“有的放矢”的宣传和质量提升。在进行广告宣传时强调自热米饭“随时随地,好好吃饭”的便捷、美味、健康特性,同时努力提升产品口感。在产品的安全使用上,除了传统的“说明书”以外,建议结合更形象直观的“视频说明”比如可在产品包装上设置二维码,扫码即可观看产品安全使用指南,从而打消消费者关于安全性的顾虑。
(2)结合自热米饭消费者群体画像,给出针对性的服务和营销策略。针对购买意愿较高的目标人群,听取其对自热米饭产品口味、促销方式、服务模式等方面的看法与观点,总结用户对自热米饭商品的需求,对已有类型产品进行升级创新,根据用户需求完善营销策略和服务模式,让消费者享受更好的产品体验感,以增加产品销售量。
(3)对消费群体建立“自热米饭精准推荐模型”,实现对其品牌的精准推荐,提高用户体验。自热米饭作为食用产品,在不同的人群中有着不同的评价,受到收入、性别、口味、购物方式等多种因素的影响,所以根据用户特征对其进行精准推荐就十分必要,通过个性化定制,不仅能更好地契合消费者需求,激发购买欲望,同时还能减少消费者购买、尝试的时间,更好地配置饮食资源,这将是自热米饭未来的发展方向之一。
参考文献:
[1]李建婷,陈慧,秦丹.我国方便米饭研究现状及发展前景[J].农产品加工,2016(16):64-67.
[2]康东方,何锦风,王锡昌.我国方便米饭的生产现状和研究前景[J].粮食加工,2007(01):40-42.
[3]朱丹实,刘贺,李君,等.用于自热方便米饭的饭盒[P].辽宁:CN204561223U,2015-08-19.
[4]袁怡湄.方便食品进入“多元”消费时代,自热米饭还“香”吗?[J].新食品,2020(07):80-81.
[5]姚飞.康师傅公司是否进入方便米饭市场[J].管理案例研究与评论,2010,3(06):489-496.
[6]吴晓娟,许东,董界,吴伟.方便米饭安全生产关键监管数据标准化方法的研究[J].食品与机械,2020,36(09):91-96+107.
[7]周永刚.“自嗨锅”:市场火爆中的品质坚守者[J].营销界,2019(25):49-50.
[8]克里斯·安德森.长尾理论[J].人民法治,2018(11):105.
[9]CHEN X, QIAN P, ZHANG XJ, et al. Improving instant rice quality by novel combined drying[J]. Drying Technology,2014,32(12):1448-1456.
[10]KUMALASARI R, EKAFITRI R, INDRIANTI N.Quality Assessment of Physical and Organoleptic Instant Conference Series, 2017, 901 (1) :12-41.
[11]德勤.零时差消费重塑网络零售新格局暨网络零售百强报告[R/OL] https://www2.deloitte.com/cn/zh/pages/about-deloitte/articles/pr-cb-digital-leading-retail-channels-integration.html
|