数据分析机器人情感分析配对提取的思路
来源:CPDA数据分析师网 / 作者:wyjqrqgfx / 时间:2020-01-29
机器人在对一篇文章进行情感分析时,怎样判断出这篇文章作者写作所表达的情感是怎样的,作者是积极情感或是消极情感,要想分析出作者是怎样想的,机器人具体应用主要会针对文章的评论来进行关键字提取及分析。
举个简单的例子:比如说苹果台式一体机
下面有5条评论
1、 苹果台式机屏幕很大
2、 苹果台式机散热不好
3、 苹果台式机性价比不如联想台式一体机
4、 苹果台式机配置太低了
这几条信息对于商家来说关注的就是它的情感,因为情感里面能告诉他们有几条重要的信息。
1、 评论者对商家的这个产品是否满意,满意哪些地方。
2、 这些评论者对这件商品哪里不满意为后续的改进提供有很大的帮助。
3、 能让商家知道和自己的产品存在竞争的对手有哪些,以及自己产品与其他产品对比后哪些地方需要改进哪里存在不足,之后进行改进提供了很大的改进意见。
对于这个小例子机器人怎样来识别出对于这个产品的满意或是不满意,这就要在这些评论里面来提取关键词来进行匹配。
个评论:苹果台式机屏幕很大,机器人在进行数据分析时就会提取屏幕在这条评论中这个词就是它的特征也就是名词,很大就是作为形容词。
第二个评论:苹果台式机散热不好。散热作为一个名词的出现,讲的是散热不好做为一个形容词。
第三条评论:苹果台式机性价比不如联想台式一体机,从这段评论中提炼出性价比,性价比就是价格方面的词,它周边的形容词是不如联想。
第四条评论:苹果台式机配置太低了,这句中主要提炼出配置作为名词对配置的形容是太低了。
从以上评论中所提取的关键词有:屏幕很大、散热不好、不如联想、配置低,对于这些词进行情感分析。
首先条大这个词属于形容词,但是大的褒义词或是贬义词的成分不能十分的确定,对于句来说需要连接上下文来进行数据分析,如果说句讲的是苹果台式机屏幕很大,在看网页以及文章字体看着很清楚,这种前后文联系逻辑清楚的评论,机器人就会认为它是一条正面的情感分析。而很字又属于程度词,很为大这个词加上一个程度表示增加了一个层面的意思。条评论得出的结论以打分的方式的话就是+2分,而第二条评论说的是散热不好得分的话就是-1,第三条评论是不如联想,这里讲的就是苹果与华为这两个词作为比较,不如作为比较词说的就是和联想比较是不如,这里得分就是-1,第四条评论讲的是配置低这里就是-1的得分,进行层层的提取对每条评论做一个配对,主要以特征情感做为提取的方式进行对比。
这样就能给我们传达出来一个信息,客户对我们的产品哪些满意,哪些不满意,我们的竞争对手有哪些联想是一个等等,以此来进行数据分析的话通过评论就能总结出我们想要知道的一些问题我们哪里好哪里不好,竞争对手是谁。