基于在线评论的产品开发研究综述
任恒鑫 重庆工商大学管理科学与工程学院 摘要:随着在线评论受到研究人员和企业研发人员的关注,针对基于在线评论的产品开发的相关文献进行梳理和分析,从基于在线评论的信息挖掘和将在线评论信息与传统管理模型相结合这两个方面进行了总结,并分析了基于在线评论的产品开发所具备的优势和劣势以及未来可能遇到的机遇与威胁,最后进行了总结。 关键词:在线评论;产品开发;文献综述 一、引言
随着人们更多地通过网络平台来表达对产品的感受和产品之间技术差异的变小、产品同质化的影响[1],企业必须深入分析客户需求,快速适应动态市场的变化,提高产品竞争力。产品开发逐渐由以往的技术导向型转变为需求导向型[1],如何从在线评论中提取对产品开发有用的信息受到企业设计人员和学术界研究人员的关注。互联网的兴起只有半个多世纪的时间,基于在线评论的产品开发研究也在近十年才受到广泛关注,目前的研究一方面集中在在线评论的非结构性处理和信息挖掘等大数据分析上,另一方面集中在将挖掘的信息与传统管理模型的结合上。据我所知,目前国内外还没有相关研究的文献综述,因此有必要系统地将以往的研究文献进行归类和总结。 二、在线评论信息挖掘
“在线评论”在文献中有多个同义词:如电子口碑,在线口碑,在线客户评论,消费者生成的内容,在线意见,用户评论等等[2],其一般指的是人们发表在网络平台上完全开放的参差不齐的内容。接下来,本节将围绕在线评论的信息挖掘方面进行归纳总结。 (一)在线评论的获取方法与数据类型 在大数据时代,数据象征着互联网企业的核心竞争力,单条在线评论信息可能没什么价值,但当在线评论达到一定数量级时,这些信息就具有了商业价值。在线评论是海量的,无法逐条收集,研究人员通常利用专业的数据采集软件,如八爪鱼采集器[3]来批量获取在线评论信息。另外,为了实现定制化获取数据,研究人员可以通过Python编程来获取在线评论信息,如Liu等人[4]利用爬虫软件工具收集电商平台的智能产品的在线评论,Qi等人[5]利用爬虫软件获取京东上77部手机的在线评论。 在线评论狭义上指用户发表的文本评论,在广义上指包括文本评论、数字评分、评价者的基本信息和一些元组标签(如浏览量,点赞数)等在内的数据类型。研究人员依据研究目的的不同会选择不同的数据类型,当研究人员侧重基于在线评论的数据挖掘方法创新时会选择采集大量的文本评论,如Wang等人[6]从京东在线网站爬取60多款智能手机的文本评论用于分析;当研究人员侧重指导企业的产品开发时会考虑更多可利用的信息,如Yang等人[7]收集特定汽车产品的所有在线评论,每条评论包括:总体产品评分、详细的文本评论以及评论的发布日期。Xiao等人[8]收集的每个在线产品评论都包括评论的标题、详细的自由文本评论、评论的发布日期和整体产品评分。 (二)在线评论的有用性 以前的研究发现,在线评论比从其他来源获得的信息更可靠[9]。但由于在线评论的质量差异很大,存在一些水贴和虚假的帖子,因此我们需要衡量在线评论质量的高低。现有研究使用了很多方法来衡量在线评论的质量,目前有用性是评估在线评论质量高低的最广泛使用的衡量标准。Forman等人[10]从消费者对的角度来评估电子商务背景下的在线评论的有用性,他们将评论者的专业知识和吸引力两个维度作为衡量在线评论有用性的可信度来源。Ku等人[11]发现了四个变量成功地将信誉良好的评论者与其他人区分开来,并成功应用在Epinions.com上。Liu等人[12]基于对评论者的专业知识、评论的写作风格和评论的及时性三个因素的分析,提出一个非线性回归模型来评估评论的有用性。Kim等人[13]对Amazon中在线评论的各种特征使用SVM回归来评估评论的有用性。 大多数研究以在线评论的支持数、支持率作为判定在线评论有用性的标准。但以上研究都是从帮助消费者做购买决策的角度分析的,很少从产品开发人员的视角来进行分析。一般来说,消费者会通过在线评论来进一步了解产品的信息,判断该用户看看购买过的人对产品的态度;而产品开发人员必须专注于发现在线评论所隐含的产品缺陷和客户需求,并尝试以适当的成本优化产品质量。因此二者对在线评论有用性的理解是不同的。Liu等人[14]将来自Amazon的有用投票率与设计师评分进行比较时发现二者之间的相关性较弱。通过对设计师的访谈,他们提出了四类特征用来从设计师的角度评估评论是否有用。Qi等人[5]进一步完善了上述特征,提出了五类特征来评估在线评论的有用性。 (三)产品特征(属性)的提取 产品特征是指产品吸引客户注意的属性。提取产品特征是从在线评论中获取客户需求的关键步骤。近年来,自动化产品特征提取技术引起了研究人员的关注[15]。产品特性在在线评论中通常以名词或名词短语的形式出现,然后在剔除噪声词后可以将最常用的词(名词和名词短语)视为潜在的产品特征。目前,词性标记方法(POS)已被广泛用于提取产品特征[16],一些研究使用无监督方法从在线评论中提取产品特征,例如潜在狄利克雷分配(LDA)。LDA方法效率很高,因为它可以用来处理大数据[17]。另外也有学者利用词频分析方法绘制词语映射图,计算词频,然后采用KJ方法对高频词进行总结和组织,提取客户需求[1]。另外,随着现有技术的发展,自然语言处理技术已经可以较为成熟地用于词性标注和句法分析,如斯坦福NLP小组创建的Core NLP是目前最常用的自然语言分析工具之一[18]。 (四)情绪分析与编码 情感分析是文本评论挖掘中的一项重要任务,因为这有助于研发人员增强对客户需求的理解。产品特征的情感极性是根据上下文信息确定的[19]。通常,根据情感词的词典,可以通过计算正面和负面的词或短语的数量来识别产品特征的情感极性[18]。此外情感词典也可以根据应用场景,以大量具有情感极性的句子作为训练数据,自行构建一个包含积极情感词和消极情感词的情感词典,用于识别针对相关产品特征的情感极性[6]。目前也有相关工具可以简化情绪分析的过程,如Bi等人[20]利用支持向量机(SVM)对抽取的顾客满意维度的情感倾向进行识别,Yang等人[7]应用情绪分析工具TextBlob来计算表达用户情绪的个人评论的情绪分数,结果表示个体满意度。 在计算出情绪极性后,需要将其转化为可运算的符号。在线评论的文本情绪一般分为三种情况:积极,中性和消极,所以编码会以三分制来衡量:+1分代表积极,-1分代表消极,0分代表中性[5]。另外也有研究将一条在线评论中存在特征词的情绪极性编码为1,否则编码为0[6]。这些研究为了简化处理,采用了具有绝对性的情绪极性,但其实消费者的情绪并不是分布在极性两端,而是在这个区间内。Yang等人[7]利用情绪分析软件处理的结果的取值范围为[-1,1],-1为极度不满意,1为极度满意。另外,由于模糊数在处理语言信息方面的优势,Liu等人[4]提出了一种基于情感词典的识别算法,针对产品特征所识别的正面、中性和负面情感倾向的数量,构造了一个直觉模糊数,用于表示其性能表现。这些都是在进一步准确地刻画在线评论中的情绪倾向。 三、产品开发的方法与模型
产品开发定义为企业改进老产品或开发新产品,使其具有新的特征或用途,以满足市场的需求的流程。企业一般需要通过调查或实验来收集消费者对产品的反馈信息,这需要严格的设计和适当的程序,以确保受访者的回馈质量。毫无疑问,这种数据收集方法既耗时又昂贵。相比之下,大规模在线评论的可用性为收集消费者的反馈信息提供了一种替代手段[8]。基于在线评论的产品开发研究通常关注消费者偏好的测量和消费者满意度的分析。目前,大多数学者选择将在线评论与经典管理模型相结合进行研究。研究中常用的经典管理模型有计量经济学模型、卡诺(Kano)模型和重要性-绩效分析(IPA)模型,其中计量经济学模型主要用于测量消费者偏好,并常与另外两种模型结合使用。 (一)消费者需求偏好测量 消费者偏好表明了产品特征对顾客满意度的重要性,这对于产品设计和开发的市场成功至关重要。为了从在线评论中得出客户偏好,以前的研究已经利用计量经济学模型(例如联合分析模型和有序选择模型)来将在线评论中讨论的一些可测量属性(例如产品特征和情感极性)与数字产品评级相关联,然后这些可测量的属性被有效地转化为客户对产品特征的偏好[6]。 联合分析法是用于评估不同属性对消费者的相对重要性,以及不同属性水平给消费者带来的效用的统计分析方法。联合分析法中有三种偏好模型:向量模型、理想点模型和部分价值函数模型。在向量模型中,偏好随性能线性变化;在理想点模型中,偏好随性能的增大而增大,当性能超过理想点时偏好减小;部分值函数模型提供了最大灵活性,允许沿着每个属性的偏好函数有不同的形状。在快速变化的市场环境下,确定理想的产品是不合适的,而且偏好也不会随性能下线性变化,因此研究一般选择部分价值模型作为衡量消费者偏好的方法[5]。Green等人[21]首先引入了联合分析来衡量消费者偏好。自引入以来,消费者偏好衡量通常与联合分析联系在一起[6]。传统的联合分析法很大程度上依赖于调查数据,直到Qi等人[5]提出了一种基于联合分析的产品属性权重确定方法,该方法通过属性识别和情感分析确定产品属性的权重。通过与现有的基于支持向量机的方法进行比较,验证了该模型的鲁棒性和有效性。 有序选择模型(OCM)是一种分析非定量选择的方法。由于该模型具有处理有序数据的能力,因此很多研究利用OCM作为建立客户偏好度量模型的基础。Xiao等人[8]提出了一种新的计量经济学偏好度量模型(简称修正有序选择模型,MOCM),用于从在线产品评论中提取消费者的总体偏好。Wang等人[6]考虑到数字产品评级和文本产品评论之间存在的不一致性,他们扩展了有序选择模型来衡量顾客偏好,建立了不一致有序选择模型(IOCM)作为衡量顾客偏好的一种手段,并通过对比分析证明IOCM模型优于现有模型。 (二)在线评论与其他经典管理学模型的结合 Kano模型是以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意度之间的非线性关系。IPA模型的基本思想是顾客对产品/服务的满意度源自其对于该产品/服务各属性的重视程度,以及对各属性绩效表现程度的评价。迄今为止,IPA模型已广泛应用于各个领域的产品或服务改进策略。 无论是Kano模型还是IPA模型,产品特征的相关数据都是通过问卷调查来实现,但随着在线评论受到研究人员的重视,很多研究从在线评论中挖掘消费者偏好和满意度等信息。Qi等人[5]提出了一种自动过滤模型,从产品设计者的角度预测在线评论的有用性。并在经典联合分析模型的基础上,创新性地将Kano方法应用于在线评论分析,以制定合适的产品开发策略。为了根据MOCM模型估计的总体消费者偏好对顾客需求进行分类,Xiao等人[8]对Kano模型进行了扩展,提出了基于边际效应的Kano模型(MEKM),通过实证表明提出的MEKM模型的实用性。Wu等人[18]在IPA模型的基础上提出一种新方法,通过在线客户评论的动态重要性-绩效分析来发现产品/服务的改进优先顺序。Wang等人[6]的研究丰富了IPA模型,提出的SIPA模型通过在IPA模型中引入情感重要性,将二维空间替换为三维空间,重要性维度分为积极重要性和消极重要性。情绪极性(包括正面和负面)的重要性有助于制造商理解客户需求。 四、讨论:优势、劣势、机遇和风险
(一)优势 随着互联网的发展,消费者更倾向在各种网络平台上表达自己对产品的意见,在线评论以易收集、成本低等优点受到研究人员和企业的关注。先前的研究表明,在线产品评论中表达的消费者意见可以很好地反映所讨论产品的整体口碑。在线评论是消费者自愿生成的,相比企业被动式调查的反馈信息,在线评论是以消费者的视角生成的反馈信息,大多数在线评论都具有较好的利用价值。 另外,有研究表明消费者更相信在线评论而不是个人推荐,在线评论已经成为企业了解消费者偏好和品牌形象的重要信息来源。因此企业进行产品开发时有必要关注在线评论,基于在线评论的产品开发研究是目前帮助企业进行产品开发的一个新方向。 (二)劣势 在线评论虽然相比传统调查得到的反馈信息有效,但是企业所需的信息并不能完全从在线评论中获得。如从在线评论中可以获得现有产品特征在特定性能下的满意度,但却无法得知消费者对其他性能情况下的满意度。如果考虑时间维度,可以利用历代产品的改进数据来弥补这一缺陷,或者与传统调查方式结合使用。 由于企业认识到口碑的重要性,因此在线评论中可能包括虚假好评和竞争对手的恶意评论。目前如何分辨这些在线评论还是学术界的一个问题,幸运的是,随着在线评论数量的增加,这些在线评论对整体口碑的影响并不大。 (三)机遇 网站口碑界面的细分化:很多网站会引导引导消费者做出更加全面的评价,如选择该产品的原因,最满意的点和最不满意的点,还有针对产品特征的评价。这增加了可用信息的数量,而且对后续处理更加方便。 各种数据挖掘技术的完善:目前大数据分析的许多技术,如以神经网络为主要模型的深度学习,一开始用来解决机器学习中的表示学习问题,由于其强大的能力,深度学习越来越多地用来解决一些通用人工智能问题,比如推理、决策等。目前,深度学习技术在学术界和工业界取得了广泛的成功,受到高度重视。 (四)风险 基于在线评论的产品开发将目光集中在市场中消费者的反馈,但产品开发仍然需要企业视角,如考虑成本的复杂性、企业创新性等问题。 虽然现有技术在不断完善,但针对产品开发中信息收集与处理流程还缺少一个系统性、自动化的框架或应用。目前理论研究多数只是利用案例分析来论证模型的可行性,缺乏这一自动化框架可能会增加企业研发人员的学习成本,不利于该研究的实际应用。 五、总结
总的来说,基于在线评论的产品开发研究既有优势也存在不足,外部环境也是机遇与风险并存。利用优势与机遇,解决现有劣势和风险是有必要的。 对于研究人员来说:对在线评论中涉及到的信息挖掘技术的研究是一个值得关注的方向。尤其是对在线评论的筛选上,判断在线评论的有用性,剔除无效数据是大数据分析的重要一步。另外,考虑产品开发中各方的反馈信息,如消费者偏好、企业成本、技术可行性等,从更符合实际开发流程的决策角度进行产品开发也是一个不错的方向。 对于企业开发人员来说:和科研团队合作,主动拥抱新理论、新技术,不仅有利于企业收集和处理在线评论信息,而且对研究人员的研究也有重要的反馈,以便其后续方法与框架的完善。 参考文献: [1]Liu H, Ren Z, Li Y. Research on the Evaluation of Customer requirement Importance of Smart Products Based on Online Comments and Improved Quantitative Kano Model[J]. CONVERTER, 2021: 382-392. [2]Verma S, Yadav N. Past, present, and future of electronic word of mouth (EWOM)[J]. Journal of Interactive Marketing, 2021, 53: 111-128. [3]Zhang H, Rao H, Feng J. Product innovation based on online review data mining: a case study of Huawei phones[J]. Electronic Commerce Research, 2018, 18(1): 3-22. [4]Liu Y, Bi J W, Fan Z P. Ranking products through online reviews: A method based on sentiment analysis technique and intuitionistic fuzzy set theory[J]. Information Fusion, 2017, 36: 149-161. [5]Qi J, Zhang Z, Jeon S, et al. Mining customer requirements from online reviews: A product improvement perspective[J]. Information & Management, 2016, 53(8): 951-963. [6]Wang A, Zhang Q, Zhao S, et al. A review-driven customer preference measurement model for product improvement: sentiment-based importance–performance analysis[J]. Information Systems and e-Business Management, 2020, 18(1): 61-88. [7]Yang C, Wu L, Tan K, et al. Online user review analysis for product evaluation and improvement[J]. Journal of Theoretical and Applied Electronic Commerce Research, 2021, 16(5): 1598-1611. [8]Xiao S, Wei C P, Dong M. Crowd intelligence: Analyzing online product reviews for preference measurement[J]. Information & Management, 2016, 53(2): 169-182. [9]Sher P J, Lee S H. Consumer skepticism and online reviews: An elaboration likelihood model perspective[J]. Social Behavior and Personality: an international journal, 2009, 37(1): 137-143. [10]Forman C, Ghose A, Wiesenfeld B. Examining the relationship between reviews and sales: The role of reviewer identity disclosure in electronic markets[J]. Information systems research, 2008, 19(3): 291-313. [11]Ku Y C, Wei C P, Hsiao H W. To whom should I listen? Finding reputable reviewers in opinion-sharing communities[J]. Decision Support Systems, 2012, 53(3): 534-542. [12]Liu Y, Huang X, An A, et al. Modeling and predicting the helpfulness of online reviews[C]//2008 Eighth IEEE international conference on data mining. IEEE, 2008: 443-452. [13]Kim S M, Pantel P, Chklovski T, et al. Automatically assessing review helpfulness[C]//Proceedings of the 2006 Conference on empirical methods in natural language processing. 2006: 423-430. [14]Liu Y, Jin J, Ji P, et al. Identifying helpful online reviews: a product designer’s perspective[J]. Computer-Aided Design, 2013, 45(2): 180-194. [15]Archak N, Ghose A, Ipeirotis P G. Deriving the pricing power of product features by mining consumer reviews[J]. Management science, 2011, 57(8): 1485-1509. [16]Jin J, Ji P, Kwong C K. What makes consumers unsatisfied with your products: Review analysis at a fine-grained level[J]. Engineering Applications of Artificial Intelligence, 2016, 47: 38-48. [17]Lee A J T, Yang F C, Chen C H, et al. Mining perceptual maps from consumer reviews[J]. Decision Support Systems, 2016, 82: 12-25. [18]Wu J, Wang Y, Zhang R, et al. An approach to discovering product/service improvement priorities: Using dynamic importance-performance analysis[J]. Sustainability, 2018, 10(10): 3564. [19]Fink L, Rosenfeld L, Ravid G. Longer online reviews are not necessarily better[J]. International Journal of Information Management, 2018, 39: 30-37. [20]Bi J W, Liu Y, Fan Z P, et al. Modelling customer satisfaction from online reviews using ensemble neural network and effect-based Kano model[J]. International Journal of Production Research, 2019, 57(22): 7068-7088. [21]Green P E, Rao V R. Conjoint measurement-for quantifying judgmental data[J]. Journal of Marketing research, 1971, 8(3): 355-363. |