正想准备做一个情感分析,结果在网上搜了一些资料,然后发现了一个专门用来做英文情感分析的包,再说一遍是做英文情感分析的包——RSentiment。

了解之后发现这个包比较简单,只有6个函数,每个函数的参数也都特别少,至少一个,最多才三个。这六个函数的作用都一样,只是返回值和参数略有不同罢了,先来说说每个函数的返回值,再来详细介绍两个函数。

函数

返回值类型

calculate_custom_score

每行返回一个行的结果,为数字

calculate_custom_sentiment

返回每行句子的情感分析结果,为单词

calculate_custom_total_presence_sentiment  

返回对应情感以及对应的数值

calculate_score

每行返回一个行的结果,为数字

calculate_sentiment

返回每行句子的情感分析结果,为单词

calculate_total_presence_sentiment

返回正篇文章的结果,为数字

calculate_total_presence_sentiment(text)

参数

作用

text

为一个英语句子,段落也是可以的,是英文的。

这个函数,它是分析完整个英语段落,然后返回6个值,分别为:  “Sarcasm", "Negative" , "Very  Negative" ,"Neutral", "Positive" , "Very  Positive

至于其他函数和这两个函数的使用方法几乎完全一样的。

接下来我们就开始我们的正文,通过分析特朗普的就职演讲来简单预测一下美国政治在他任期的一个走向。

install.packages("RSentiment")  #没有按照的话需要先安装这个包 library(RSentiment)  #加载包

首先,我们先来通过特朗普的就职演讲来对他进行的情感分析。

Trump<-scan("Trump.txt",what = "",sep="\n",encoding = "UTF-8") #读取文件Trump_score<-calculate_total_presence_sentiment(Trump)

这是对特朗普就职演讲的分析结果。这个函数直接给出了各个情绪指标的数值。


calculate_total_presence_sentiment(text)

参数

作用

text

为一个英语句子,段落也是可以的,是英文的。

这个函数,它是分析完整个英语段落,然后返回6个值,分别为:  “Sarcasm", "Negative" , "Very  Negative" ,"Neutral", "Positive" , "Very  Positive

至于其他函数和这两个函数的使用方法几乎完全一样的。

接下来我们就开始我们的正文,通过分析特朗普的就职演讲来简单预测一下美国政治在他任期的一个走向。

install.packages("RSentiment")  #没有按照的话需要先安装这个包 library(RSentiment)  #加载包

首先,我们先来通过特朗普的就职演讲来对他进行的情感分析。

Trump<-scan("Trump.txt",what = "",sep="\n",encoding = "UTF-8") #读取文件 Trump_score<-calculate_total_presence_sentiment(Trump)

这是对特朗普就职演讲的分析结果。这个函数直接给出了各个情绪指标的数值。


从这张图中,我们可以看到,特朗普在就职演讲中表现的态度非常积极,但同时表现的稍微消极。

说起奥巴马,2008年他竞选总统,新罕布什尔的一篇演讲《yes,we can》,不知道燃起了多少人对实现美国梦的希望,也是这篇演讲,让奥巴马成功击败对手罗姆尼,成为第44任美国总统,也是美国历史上第一位非裔美国人总统。

2008年2月,是由嘻哈乐团“黑眼豆豆(Black Eyed Peas)”主唱Will.i.am根据奥巴马在《yes,we can》,创作的单曲《Yes We Can》。

在这里,我们就不分析这篇演讲了,因为演讲都是积极向上的,带有鼓动性和煽动性的,这就是美国总统的竞选方式。在这里我还是分析奥巴马就职演讲。

Obama <-scan("Obama.txt",what = "",sep="\n",encoding = "UTF-8")Obama_score<-calculate_total_presence_sentiment(Obama)


我们可以发现奥巴马表现的比较中肯,比较积极但也略带消极。这种表现还是比较客观的,正反都有。这就跟我们对一个客观实际的评价,不能只说好,也不能说都是坏的,因此我们需要客观评价,正反观点都有。说到这,你还记得小时候有这么一篇语文作文——谈谈你认为互联网对小学生是利大于弊还是弊大于利。自己想,我就不说了。

现在我们将奥巴马和特朗普的进行一个比较。


从图中,我们可以清楚的发现,奥巴马的图形状像山一样,中间高,两边低,而特朗普的图就像波浪一样,此起彼伏。我们可以很明显的发现,特朗普表现的是非常的积极,积极的好像有点过火。可以看到特朗普的消极程度差不多是奥巴马的四倍,朗普对奥巴马在任期间的政绩有多么消极和不满,因此在竞选期间特朗普公然挑衅奥巴马,也爆料称,该出生证“系伪造”。

同时他有表现的非常积极,这里的积极我认为源于他的自信,但是他的自信恐怕是盲目的,自信的让人有点不敢相信。我不知道用夜郎自大,自命不凡来形容对不对。我觉得他有点像“P子”,看谁不顺眼,就盆谁。

他曾评价奥巴马主推的伊核协议为“美国签订的最槽糕和最单方面的协议之一”,是“美国的难堪”,话间表露出将会废除伊核协议的态度。怒斥联合国为无用之地。

准备废除奥巴马的医保案,“童年抵美者暂缓遣返”计划,退出巴黎协议,在联合国大会中,特朗普,表示一旦美国没有选择余地,美国将完全地摧毁朝鲜,他并且戏称朝鲜领导人金正恩为“火箭人”,当时朝鲜代表全部离席。

下来我们再来看看他在推特上面都怼过谁。

  1. ***NBC节目《周六夜现场》

  2. 讽刺美国一线明星

  3. 呛声好莱坞女演员梅丽尔·斯特里普

  4. 威胁烧国旗民众

  5. 取消“空军一号”订单

  6. 污蔑中国“操纵”货币

  7. .....

最近美国拉斯×××发生美国史上死亡人数最多的枪击案,已造成58人死亡,515人送医治疗。这个时候总统怎么能闲下来,这不,又来发推特了。


这是因为特朗普签署的禁穆令,而奥巴马任内启动的在美重新安置叙难民计划遭无限期中止。

正是因为特朗普的推特治国引起人们的不满,美国中情局前特工瓦莱丽·普莱姆(Valerie Plame)正在众筹网站上募资10亿美元,计划买下推特的大量股份,然后关掉特朗普的推特账号。


因此我认为我特朗普会继续废除奥巴马以及之前总统建立的某些制度,这个数量并不会少,同时,特朗普会以自己为中心,建立更多民众并不是很赞同的各项制度,由于个人色彩浓烈,身边的人才也会渐渐流失,自上任200多天以来,被解职或离职的要员总共14人。同时连任的可能性不大,除非背后有贵人相助,你懂得。(个人观点,无需在意)

但历史上还真有一位总统在就职演讲时表现的特朗普一样的积极。他就是美国历史上唯一一位连任四届总统的——罗斯福。

Roosevelt<-scan("Roosevelt.txt",what = "",sep="\n",encoding = "UTF-8")Roosevelt_score<-calculate_total_presence_sentiment(Roosevelt)

现在,我们将特朗普和罗斯福进行比较。

在图中,我们可以发现这些指数都是递增的。如果有人问我那特朗普能和罗斯福相比吗?这结果能信吗?但如果我们和历史背景结合起来的,那你就相信了。

罗斯福首次履任总统是在1933年初,正值经济大萧条的风暴席卷美国的时候,到处是失业、破产、倒闭、暴跌,到处可见美国的痛苦、恐惧和绝望。罗斯福却表现出一种压倒一切的自信,他在宣誓就职时发表了一篇富有激情的演说,告诉人们:我们惟一害怕的就是恐惧本身。身为总统,他需要立马解决这些问题。在演讲中,他当然需要表现的十分积极,鼓励人民群众不要气馁,美国还是有希望,他有能力带领大家走出困境,大家一定要相信我。结果罗斯福真的做到了。

罗斯福把保持国民经济的正常运行和保证公民就业以工代赈的形式修建的一大批工程项目,如田纳西河流域工程,不仅大大缓解了失业困难,刺激了经济的早日复苏,而且许多基础设施建设使美国经济受益无穷。新政留下了大量防止再次发生大萧条的措施和政策,为美国投入二次大战及战后的快速崛起奠定了坚实的基础,罗斯福也因此成为自亚伯拉罕·林肯以来最受美国和世界公众欢迎的总统而永载史册。

好了,今天就给大家说这么多,限于个人水平有限,分析不到位的地方还望大家谅解,欢迎批评指正。本文主要目的是介绍如何使用该包进行情感分析,其余关于三位总统评价纯属丰富文章内容。

如果想要获取就职演讲数据请点击阅读原文提取码dghe。如果你想尝试使用词典的方法来分析的话,后台回复:知网情感词库 即可获取下载链接。

温馨提示

  1. 如果在运行程序中出现错误提示: Java heap space 解决方法就是再试着运行一次或关闭R重新打开再运行。

  2. 如果使用我提供的知网情感词库,使用之前如图请把前面这两行删掉,以免出错。使用词典和不使用词典分析出来的结果差别比较大。)


转载请注明:

作者:王亨

公众号:跟着菜鸟一起学R语言

原文链接:http://blog.csdn.net/wzgl__wh