(3)根据品牌优势提炼品牌手机的卖点。
(2)对获得的数据进行基本处理,包括数据预处理、中文分词、停用词过滤等。
目前,中国有许多国内手机品牌。根据中关村在线手机排名,国内品牌OPPO排名第二,品牌综合评分为96.1,品牌份额13.7%,具体见下图2中关村在线手机品牌排行榜。
通过上图2数据显示,OPPO品牌手机在中国市场树立了良好的品牌形象。因此,选择OPPO手机品牌作为分析对象意义重大,本文选择OPPO手机品牌是研究对象。
步骤如下:
(2)为语义网络的(好评)和负面(差评),构建和分析语义网络
本文将引入ROSTCM6文本挖掘软件可以快速高效地删除与所需信息无关的内容,筛选文本中的高频词汇。
(2)拍照、手感、快、服务、速度等词出现频率也很高,可作为二级词汇,代表OPPO手机产品的特点展现了买家心目中的OPPO手机的整体形象。
(3)以快字为节点,周围的速度、物流字与之形成网络语义关系,表明买家对OPPO手机产品发货快,物流快,评价快。
LDA虽然可以直接分析文本的主题,但文本的积极评价与消极评价混淆,由于单词粒度的影响)消极单词或程度单词等。),可能会在一个主题下产生一些令人困惑的单词。因此,文本分为两个文本:积极评价和消极评价,然后分别进行LDA主题分析是比较好的。
文本主要分为正面评价和负面评价ROSTCM6软件可自动生成三类:正面情绪结果、负面情绪结果和中性情绪结果。本文仅对正面情绪结果和负面情绪结果文本进行LDA主题分析,挖掘商品的优缺点。
由于ROSTCM6结果还有评分前缀,需要删除评分前缀。
根据对OPPO手机好评的3个潜在主题的特征词提取,可以得到如下信息:
主题1的高频特征词,即喜欢,拍照、速度、不错、清晰、满意、充电、手感、流畅等,主要反映的是OPPO手机的性能各方面都让人满意;
主题2的高频特征词,即不错、喜欢,客服、物流、拍照等,主要反映的是OPPO手机的像素好,天猫商城的服务好以及物流比较快;
主题3的高频特征词,即不错、物流、喜欢、第二天、下单等,主要还是反映物流速度比较快。
综合OPPO手机差评的3个潜在主题的特征词,可以提取得到以下特征词,即垃圾、不好、卡、主要反映出部分用户对于OPPO手机不太满意,手机容易出现卡顿现象。
可能由于分词获取前面正负情感结果的文本语料库不太好,对于负面情感结果的LDA主题并不是很聚焦,结果并不是很好。
综合以上对主题以及其中的高频特征词进行提取可以看出,OPPO手机的优势有以下几个方面:像素高、手感好、物流快、服务好,但相对而言,也有部分用户觉得这款手机容易死机、卡机等。
因此,用户购买此款手机的原因可以总结为以下几个方面:价格实惠、性价比好、像素高、服务态度好等。
根据对天猫商城上的OPPO手机的用户评价情况进行LDA主题分析,可以对OPPO手机提出以下建议。
注:这是我2017年(大三)做的一个小项目,当时是在上“商务智能与应用软件”那门课所做的,第一次接触到数据挖掘与数据,做的比较粗糙,也删减了很多内容,衔接上如有问题的地方希望大家可以指出来呀,帮助我一起进步呀!