TAG标签 | 网站地图 现代商业杂志社-国内统一刊号:CN11-5392/F,国际标准刊号:ISSN1673-5889,全国中文流通经济类核心期刊
热门搜索:跨境电商 构建 存在的问题及对策 大学生 互联网 财务管理 信息化 目录 大数据 现代商业杂志

商业流通

当前位置:主页 > 文章导读 > 商业流通 >

基于社群用户评论的生鲜冷链溯源需求的挖掘

2019-10-12 22:34 来源:www.xdsyzzs.com 发布:现代商业 阅读:

李勇  管慧  陈钰欣  谭小玲 长沙学院经济与管理学院

摘要:频发的生鲜安全事件,导致消费者对商家和产品失去信心,制约了生鲜市场的发展。感知消费者的需求,提供消费者满意的生鲜冷链溯源服务,将有利于生鲜市场的发展。通过Python获取数据和分析社群用户需求,并利用可视化工具展示消费者需求画像,据此分析消费者需要的生鲜冷链溯源服务。研究发现,消费者对于生鲜冷链溯源服务的要求在安全性、全程性、便捷性三个方面。据此研究结果,提出了生鲜冷链溯源系统构建的相关建议。

关键词:需求挖掘;消费者画像;冷链溯源;社群

中图分类号:F322     文献识别码:A   文章编号:1673-5889201926-0000-04

一、引言

近年来,经济发展和居民生活水平的提高促使生鲜的消费比重不断增加,也为生鲜冷链物流的发展提供了契机。然而,生鲜的安全事件频发,如“毒豇豆”、“问题黄瓜”和“漂亮豆芽”等恶性事件,导致民众对一些商家失去了信心。伴随移动互联网的发展,越来越多的社群用户选择在社交平台上发表自己不满与需求。目前,已有许多企业利用文本挖掘技术感知互联网上的用户需求,从而针对性的推出满足消费者需求的产品。Netflix公司就通过文本挖掘技术分析收集的大量会员数据,以得到电影播放质量和效果提高的方向[1]。因此,冷链物流企业若要扩大市场份额,就需要满足客户对于生鲜冷链溯源服务的需求。

国内外近几年展开了针对生鲜冷链溯源的研究。Feng等通过采用RFID数据采集技术获取并构建牛肉冷链物流过程中的温度关键质量控制参数信息溯源系统模型,实现了对牛肉冷链品质的实时监控与可追溯[2]Mainetti等构建了一种面向生鲜果蔬冷链过程的新型低成本追溯模型与系统,在提高冷链过程透明性效率的同时节约冷链成本[3]。姚蓉从政府、企业、消费者的视角,以西安市蔬菜供应链主要模式作为出发点,构建适用本市的蔬菜供应链追溯系统[4]。张雅燕以猪肉为例,分析其质量安全可追溯体系的运行机制,她认为 4 个因素制约了猪肉质量安全可追溯体系的发展推广,分别是运行成本、养殖户规模及人员素质程度、对可追溯猪肉的认知度及统一的农产品质量追溯平台[5]

针对社群用户需求挖掘的相关研究。刘宇涵等探讨网络舆论、消费体验与顾客共创价值之间的关系,并提出根据社群成员各自不同的诉求点设计群活动满足社群成员的多元化需求[6]Helm提出在当今移动社群中,网络舆论的形成速度更快,消费者共创价值的体现更显著[7]Ghose提出负面的网络舆论会大大降低消费者的购买欲望,影响消费者的情感信任[8]。雷宇提出拥有相同消费观、消费偏好的群体整合在一起,形成新的消费市场,商家可挖掘该市场的消费潜力[9]

目前,国内外的学者对于生鲜冷链的研究主要集中在供应链上的质量保证,针对的对象为政府企业,以消费者的角度进行的研究较少,利用数据挖掘技术感知消费者需求的研究更少。本文的研究试图解决以下三个方面的问题:1.利用数据挖掘分析消费者的生鲜安全需求。2.利用用户画像展示消费者的生鲜安全需求。3.结合消费者的需求提出生鲜冷链溯源的发展方向。

二、相关理论和工具

(一)文本挖掘

文本挖掘是指从文本中抽取有价值的信息和知识的计算机处理技术。目前,文本挖掘主要应用于商业,涵盖企业竞争情报、CRM、电子商务网站、搜索引擎、医疗、保险及咨询等领域。文本挖掘的方法可以分为文本分类、文本聚类、信息抽取、摘要及压缩五类。文本挖掘需从数据提取至文本预处理,再至文本挖掘分析,最后至可视化。

本文对消费者在网上发布的消费体验进行文本挖掘,了解消费者对于生鲜冷鲜溯源服务的需求。1.首先采用Python爬虫获取关于生鲜安全话题的百度贴吧、知乎数据。2.将采集到的消费者需求数据进行文本预处理,进行分词、词性标注、去停用词等操作,使得采集到的非结构化的用户需求数据转化为易于计算机处理的机构化数据。3.对预处理后的消费者需求数据进行统计分析、深度挖掘分析。4.对分析得出的消费者需求进行可视化展示[10]

(二)用户画像

用户画像的概念最早源于交互设计之父Alan Cooper,他指出用户画像是真实用户的虚拟代表,是建立在真实数据上的目标用户模型[11]。目前,用户画像演化为一种勾画目标用户、联系用户诉求与设计方向的有效工具。其最初应用于电商领域,目前已广泛应用于各个领域。

本文以海量的消费者需求数据,构造能反映消费者的虚拟形象。1.首先对获取的数据进行统计分析,了解消费者的基本概况如年龄、性别等。2.进一步展示分析文本挖掘的消费者需求,得出消费者对当下生鲜安全的看法。3.由目前的消费者需求现状对未来的需求画像进行预测,得出企业及政府在生鲜冷链溯源服务上的着力点。

本文采用信息抽取的文本挖掘法,利用Python采集海量的消费者需求数据,细致刻画消费者对于生鲜冷链溯源的需求,并由用户画像预测模型得出生鲜冷链溯源的发展方向。

三、数据来源与研究方法

本文采用数据挖掘的办法获取消费者对表生鲜安全的需求。互联网普及率的提高,使越来越多的国民在社交平台上发表自己的观点成为可能。百度贴吧、知乎作为当下热门的两大社交平台,在国民的生活中扮演了重要的角色,人们更愿意将自己的经历及需求发布在社交平台上。因此,本文利用Python爬虫,获取百度贴吧、知乎两大平台上消费者的发布有关生鲜安全的内容,并运用Python进行中文文本分析,从而全面了解消费者对生鲜产品安全需求。

(一)数据来源及预处理

近年来,随着城乡居民生活水平的提高与人民消费习惯的改变,生鲜逐步成为人民消费的潮流。而生鲜安全无法保证、冷链的断链、溯源的缺失等因素限制了生鲜的发展速度。

为感知消费者对生鲜的安全需求,本文以百度贴吧、知乎作为数据采集对象,以百度贴吧搜索、知乎搜索作为搜索工具,以“生鲜安全”作为搜索关键词,利用Python爬虫采集所有相关数据。最终获取36925条百度贴吧帖文,14358条知乎帖文,并保存至Excel表格中,本文共采集了6个字段,字段详细情况如表1所示。

1  数据采集字段表

表1  数据采集字段表

  

1中第二列包含6个字段,涉及用户名、用户主页、发布方式、发布标题、发布标题、发布内容、发布时间,主要用来进行情感分析、语义分析和用户特征分析,Excel存储界面,如图1所示。

图1(a)生鲜安全数据Excel存储界面

1a)生鲜安全数据Excel存储界面 

图1(b)生鲜安全数据Excel存储界面

1b)生鲜安全数据Excel存储界面

将获取的51283条数据进行清洗,通过筛选与人工手动去重、去除广告和无关内容,最终得到32721条百度贴吧帖文,11798条知乎帖文。

(二)文本分析流程

将预处理后得到的44519条数据进行文本分析。首先利用SnowNLP对爬取的数据进行情感分析,得到消费者对现在的生鲜安全持什么样的情感态度。再利用JieBa对发帖内容进行词频统计,得到大多数消费者对生鲜产品安全的关注点。最后利用NLPIR对发帖内容进行语义分析,了解消费者对生鲜产品安全的关注内容。

1.情感分析

现行的情感分析方法主要有基于词典和基于机器学习两类。基于词典的方法是通过制定一系列的情感词典和规则,对文本进行段落拆借、句法分析,计算情感值,最后通过情感值来作为文本的情感倾向依据。基于机器学习的方法大多将这个问题转化为一个分类问题来看待,对于情感极性的判断,将目标情感分类2类:正、负。对训练文本进行人工标标注,然后进行有监督的机器学习过程。

本文主要采取基于词典的方法对消费者的发帖内容进行情感分析。采用的BosonNLPde的情感词典,对得到的44519条数据进行情感打分,如图2所示。图中横坐标代表情感值,越靠近0负性情绪越高,越靠近1正性情绪越高,越靠近0.5中性情绪越高。纵坐标代表数量,柱形越高代表数量越多。

图2(a)百度贴吧贴文情感分析图

2a)百度贴吧贴文情感分析图 

 

图2(b)知乎贴文情感分析图

2b)知乎贴文情感分析图

如图2所示,百度贴吧有86.7%的消费者负性情绪很高,不满食品安全现状处于极端负性情绪状态;有5.8%的消费者没有带有任何情感色彩的发帖,只是表达自己所经历的事情;有7.5%的消费者发表了积极的情感的帖子。知乎有86.9%的消费者是负性情绪很高;有3.2%的消费者没有带有任何情感色彩的发帖;有9.9%的消费者发表了积极的情感的帖子。综上,大多数的消费者并不满当下的食品安全现状,为解决这一问题,需要进一步挖掘消费者的需求。

2.词频统计

中文分词是文本分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理中的关键技术及难点,也是情感词提取的基础性工作之一。本文采用PythonJieBa库作为分词工具。

本文选取百度贴吧、知乎作为分析对象,采集与生鲜产品有关的所有发帖数据,利用JieBa库对44519条文本进行分词处理,对单个字或没有表达具体含义的字词,进行人工浏览及上下文对比,不断合并为新词,尽量保持分词的准确性。对分词后的文本进行词语统计,最终得到17836个字词。

文本中包含的词语较多,难以将所有词语都用可视化的方式展现出来,但有必要对有代表性意义的词语进行展示。本文对分词后的词语进行词频统计后,利用Tagxedo可视化工具进行处理,得到高频词(频次500以上)可视化如图3所示。词语的大小反映了词语出现的频次,字越大表示该词出现的频率越高,同时,频次越高的词越趋向于分布在图形的中部。如图3所示,百度贴吧的文本中“消费者”、“质量”、“蔬菜”、“追溯”、“农产品”、“微生物”、“管理”、“过程”等词为高频词;知乎的文本中“农产品”、“生鲜”、“超市”、“消费者”、“管理”、“监管”、“调查”、“质量”等词为高频词。

图3(a) 百度贴吧频次500以上的高频词云

3a) 百度贴吧频次500以上的高频词云 

图3(b)知乎频次500以上的高频词云

3b)知乎频次500以上的高频词云

3.语义分析

从上部分的词频分析,我们可以看出消费者的大致需求。为更深入的了解消费者需求,本文利用NLPIR系统作为语义分析工具,对来自百度贴吧、知乎两大平台的每一条数据进行语义分析,了解消费者的具体需求内容,并对强度大于300的需求相关词语进行展示,如图4所示。

图4(a)百度贴吧语义网络分析图

4a)百度贴吧语义网络分析图

图4(b)百度贴吧语义网络分析比重图

4b)百度贴吧语义网络分析比重图

如图4a)所示,大多数发帖内容主要对“食品”、“安全”、“企业”、“追溯”、“使用”、“消费者”等六大方面关系。如图4b)所示,在整个文本数据中31.18%的消费者关注“食品”方向,其中“食品安全”占比3% 、“食品问题”占比1.78%、“食品平台”占比1.53%、“食品消费者”占比1.5%、“食品追溯”占比1.41%;有7.31%的消费者关注“安全”方向,其中“安全问题”占比1.7%、“安全技术”占比1.19%;有7.02%的消费者关注“企业”方向,其中“企业食品”占比1.52%、“企业安全”占比1.36%、“企业问题”占比1%;有6.03%的消费者关注“追溯”方向,其中“追溯平台”占比1.25%

图4(c)知乎语义网络分析图

4c)知乎语义网络分析图 

图4(d)知乎语义网络分析比重图

4d)知乎语义网络分析比重图

如图4c)所示,大多数发帖内容主要对“部门”、“食品”、“食用”、“安全”、“健康”、“人员”等六大方面关系。如图4d)所示,在整个文本数据中8.42%的消费者关注“部门”方向,其中“部门监管”占比0.97% 、“部门人员”占比0.95%、“部门健康”占比0.93%、“部门卫生”占比0.98%;有7.69%的消费者关注“食品”方向,其中“食品安全”占比2.24%、“食品问题”占比1.64%;有7.67%的消费者关注“食用”方向,其中“食用危害”占比0.98%、“食用食物”占比0.97%、“食用健康”占比0.97%;有7.45%的消费者关注“安全”方向,其中“安全问题”占比1.51%

结合情感分析、词频分析和语义分析,可以得出消费者对食品安全的态度是消极的,有一定的负性情绪。其理智地分析了食品安全问题,以食品安全本身出发点,找出相关的影响因素,认为需要企业和国家两者共同监管食品安全问题。

四、结果分析

(一)消费者画像

将在百度贴吧、知乎上采集到的51283条数据,进行用户ID可视化分析、发帖内容情感值分析、消费者需求可视化分析、消费者发帖时间分析,如图5a)、5b)所示。

1.用户ID可视化分析

一些普通的消费者发帖的次数比较少,例如“隋隋”、“宏萌LIVE”、“刘华起”、“豫AS”等,而一些官方平台发帖的次数比较多,例如“农产品流通资讯”、“检测联”、“食恪网”、“地理标志等”,如图图5a)所示。

2.发帖内容情感值分析

对所有发帖内容进行打分,分值区间为[01],其中值在区间[00.4]为负性情感、在区间(0.40.6]为中性情感、在区间(0.61]为正性情感,得到26.41%的消费者是正性情感,18.73%的消费者是中性情感,54.86%的消费者是负性情感,如图5a)所示。

3.消费者需求可视化分析

对消费者所有发帖内容进行需求词频分析,并对词频超过1000频次的词语进行可视化展示,得到消费者的主要需求是“问题”、“检测”、“追溯”、“使用”、“企业”、“技术”等,如图5a)所示。

4.消费者发帖时间分析

对采集到的所有数据进行时序分析,以每小时为单位,得到在区间[7时,8]、区间[11时,12]和区间[17时,19]三个时间段是消费者发帖的高峰时期,均超过4000条帖子,18时更是达到了一天之中的最高峰,为7977条。在区间[0时,5]时间段是消费者发帖的低峰时期,如图5b)所示。

图5(a)消费者对生鲜安全需求的用户画像

5a)消费者对生鲜安全需求的用户画像  

图5(b)消费者对生鲜安全需求的时间序列图

5b)消费者对生鲜安全需求的时间序列图

线上消费者对生鲜安全需求有较为明显的情感特征,普通消费者对自己接触到的不安全生鲜是愤怒的,负性情感占较大比重;而官方平台是以客观的角度发布对生鲜现状的看法,持有中性情感;也有小部分消费者表达自己接触到安全的生鲜,持有正性情感。线上消费者发帖集中在三个用餐时间段,及时发表带有自己感情色彩的生鲜安全事件,其中晚餐时间段更是一天之中的最高峰。消费者及时地发布出自己接触到的不安全生鲜,并表达强烈的意愿,希望相关部门进行检测,相关企业提高技术,可以对生鲜进行追溯,保证生鲜质量安全。

(二)消费者安全需求

通过挖掘消费者发帖内容数据,发现多数消费者的生鲜安全需求主要表现在以下三个方面。

1.大部分消费者对市面上现有的生鲜质量持担心态度,希望可以通过一定措施提高生鲜质量。在消费者需求挖掘中,有88.6%的消费者是对生鲜质量持负性情绪,急切希望生鲜质量可以得到保证。

2.消费者在生鲜价格涨幅不大时是愿意接受可追溯生鲜,希望可以通过此保证食用到安全的生鲜。在消费者需求挖掘中,消费者需求词频需求TOP10均出现“追溯”、“溯源”,消费者希望可以通过可追溯的方式保证生鲜的质量安全。

3.当遇到不安全的生鲜时,大部分消费者会选择向相关政府部门举报销售该生鲜的企业,并不会再光顾该企业。在消费者需求挖掘中,消费者对部门监管需求均排在文本TOP10内,希望通过投诉举报销售不安全的生鲜企业保障自身权益。

综上所述,消费者迫切地希望有溯源平台可以保障生鲜在生产、运输、销售全程中的质量安全。

五、研究结论与建议

(一)研究结论

1.生鲜的安全性是影响消费者购买的一大重要因素

通过市场调研,发现生鲜的需求逐年上涨使生鲜市场扩增,但其增速较慢。通过对消费者需求数据的发掘,发现50%的消费者对购买的生鲜的安全情况最关注,对生鲜的物流配送情况关注度达18.8%,如图6所示。因此,企业需要满足消费者的安全需求,以扩大生鲜的市场。

图6  顾客购买生鲜的各类因素占比

6  顾客购买生鲜的各类因素占比

2.生鲜供应链信息不对称、权责不明

通过挖掘百度贴吧与知乎上消费者的贴文内容,发现大多数消费者在遭遇生鲜安全事故时,生产商、供应商、分销商、物流园之间相互推诿,无法及时解决生鲜安全事故。同时,消费者无法得知购买的生鲜在各个环节的情况,整条供应链上的信息封闭,供应链上每一方仅保留自己的信息,阻碍消费者维权。

3.已有的生鲜冷链溯源服务并不完善

通过挖掘消费者的贴文,发现已有很多消费者接触到了生鲜冷链溯源服务,但大多数消费者并不满意现存的服务系统(平台)。在深入地研究中发现,现存的大多数冷链溯源平台没有达到规定标准,溯源系统展示的信息仅是生鲜的基本属性,而不是消费者关心的详细过程信息。此外,这些溯源系统大多数面向的对象不是消费者,消费者要了解溯源信息的门槛较高,如下载新的APP等。

(二)建议与对策

通过上述研究发现,我国的生鲜市场广阔,但企业提供的服务与消费者的需求不匹配。解决该问题的关键在于建立一个满足消费者需求生鲜冷链溯源系统。

1.建立安全可靠的生鲜冷链溯源系统

安全可靠是生鲜冷链溯源系统的核心,也是推动生鲜市场发展的关键。在系统平台中,将生鲜从生产到销售的全程保存至数据库,管理人员只能将系统得到的数据展示出来,不能篡改其中的数据。保证消费者看到的安全生鲜是真的安全。

2.建立协同集成的生鲜冷链溯源系统

协同集成是生鲜冷链溯源系统的前提。通过系统,企业可以与上下游协同,形成整个生鲜链的贯通,提高了供应链上企业的工作效率,也保证了生鲜的全程溯源。从而解决了溯源断链、消费者维权难等问题。

3.建立方便快捷的生鲜冷链溯源系统

方便快捷是生鲜冷链溯源系统推广的一大优势。通过快捷的QR扫码让消费者即刻了解生鲜的相关信息,满足当下消费者方便快捷的消费理念。同时,以人性化的扫码设计将提高了消费者的溯源体验感,增加消费者粘性。

参考文献:

[1]Harris L., Netflix uses data for a lot more than just recommendations[EB/OL],2014,https://gigaom.com/2014/06/12/netflix-uses-data-for-a-lot-more-than-just-recommendations/.

[2]Feng, Jianying, Fu, et al. Development and evaluation on a RFID-based traceability system for;cattle/beef quality safety in China[J]. Food Control, 2013, 31(2):314-325.

[3]Mainetti L, Patrono L, Stefanizzi M L, et al. An innovative and low-cost gapless traceability system of fresh vegetable products using RF technologies and EPCglobal standard[J]. Computers & Electronics in Agriculture, 2013, 98(7):146-157.

[4]姚蓉.基于物联网技术的西安市蔬菜供应链追溯系统研究[D].长安大学,2013.

[5]张雅燕.食品质量安全可追溯体系的运行机制及发展路径研究——以猪肉为例[J].黑龙江畜牧兽医,201410.

[6]刘宇涵,于苗.移动社群中网络舆论对顾客共创价值的作用[J].中国流通经济,20192.

[7]HELM S.Viral marketingestablshing customer relaitionship by word-of-mouse[J].Electronic markets2000103):159-160.

[8] GHOSE AIPEIROTIS P.Estimating the helpfulness andeconomic impact of product reviewsmining text and reviewer characteristics[J].IEEE transactions on knowledgeand data engineering2011231 498-1 512.

[9]雷宇.基于微信社群的湖北特色农产品电商模式研究[J].农村经济与科技,2018(24).

[10]郭立秀.基于文本挖掘的生鲜电商顾客满意度研究[D].西南交通大学,2018.

[11]陈慧香,邵波.国外图书馆领域用户画像的研究现状及启示[J].图书馆学研究,2017(20).

相关内容
发表评论