大数据心理学研究的主要议题
论文作者:同为论文网 论文来源:caogentz.com 发布时间:2017年09月22日

(一)一般性个体情绪变化规律    

情绪变化是一个动态的、主观的过程,正负性情绪对身心健康有重要影响,但是情绪波动规律并不容易捕捉到。已有研究表明,情绪状态与睡眠时间相关,但都是实验室研究得出的结论,由于选取同质性较高的大学生样本,结论代表性与有效性受到质疑。此外,对情绪的测量主要是通过回顾性自我报告,这种方法会受到时间间隔和报告者记忆偏差的影响。尽管研究者已经认识到这种方法的局限性,但是没有适切方法在文化多样性的大群体中实时观测个体情绪变化。    

Golder和Macy使用大数据很好地解决这一问题,社交媒体信息使学者可以在任何时刻测量全球个体的情绪状态。这项研究主要是从推特网上获取数据,推特的会话交谈字符数限制在140个以内,采用语言查询和词汇库(Linguistic Inquiry andWord Count, LIWC)分析文本内容,这是一个成熟的文本分析工具,它列举了一系列测量64种行为和心理维度的词汇和词干,包括积极情绪和消极情绪[mo。研究对象来自84个国家,收集样本中每一个用户信息多达400条,少于25条信息的用户被排除.数据监测时间从2008年2月到2010年1月.由此产生的语料库包含了来自全球的大约240万用户的5亿条信息。对数据的处理采用均值中心化,结果显示一天内个人的积极情绪会在两个时间点达到峰值,分别是清晨和午夜时分,而周六和周日任何时候的积极情绪水平高于工作日任意时间节点。负性情绪在清晨达到最低点,白天一直上升至夜间达到最高峰开始下降,这表明睡眠可以使情绪恢复。此外,通过对比四组国家数据,虽然这些地区情绪变化规律没有统计学上的显著区别,但是正负性情绪会因为不同地区工作日设置而产生不同变化。这项研究说明睡眠对情绪的重要影响,个体可以通过增加睡眠时长和调整睡眠时间改变心情。    

我国学者汪静莹等人在中国环境下进一步延伸该研究,将数据源的获取从推特变成微博,加入别变量进行群体情绪差异比较。研究对象选取2011年9月之前注册的活跃私人账户,通过新浪微博应用程序接口,在设备允许的运行承载范围内,分时段的爬取数据,最终选取195万有效微博用户,删除其中非原创微博信息。数据分析采用“中文心理分析系统”,积极情绪和消极情绪的计算分别通过统计词汇库中的积极情绪词类和消极情绪词类在文本中出现的频率加以实现。结果显示,人们综合情绪的2个高峰分别在中午和晚上8点,虽然人们在周末的积极情绪与工作日无异,但消极情绪在周末明显低于工作日。季节对情绪也有影响,人们在夏季的积极情绪和消极情绪最高,在秋季的积极情绪和消极情绪最低。在性别情绪比较上,女表现得更情绪化,有更多的情绪表达。    

(二)特大事件社会情绪变化    

特大社会事件除了造成政治、经济等方而的影响外,社会情绪也会受到波动,这种余波持续时间长短不一,受到波及的个体可能会在短时间内恢复,也可能会持续相当长时间。过去也有学者试图论证它可能造成的社会情绪影响,如大量研究探讨911事件发生后美国社会民众反应。但是社会创伤事件的心理影响较难研究,研究者需要采用纵向设计进行干预测量事件发生后即刻反应以及长期心理反应,因而这类研究必然而临一系列挑战。首先数据收集只能在创伤事件发生以后,任何人都无法预测特大事件发生,这意味着没有办法获取事件发生前的前测数据。更重要的是,研究者很难在事件发生的第一时间收集信息,无法快速获取信息意味着某些重要数据可能会被遗漏,因为存在受害者可能会忘记的心理症状[l5]。此外,相关信息的收集也需要考虑到伦理影响.此类研究不易得到伦理委员会批准或者资金赞助,即使获得许可和资金支持,当地组织也会严格限制研究者接近潜在的受访者,而大数据为这类研究提供新的可能。    

Jones , Wojcik , Sweetin}和Silver的伊斯拉案例详尽说明如何利用大数据克服以往心理学研究挑战。在美国国家调查数据中,两个地区被选择作为研究对象,一是连环杀案发生的圣塔巴巴拉地区,一个是在人口经济特征相似的弗拉格斯塔夫。因为推特地理追踪只能搜索三天以内的信息,为了保证样本代表性,推特用户分为社区用户和校园用户,研究者列出当地机构账号,关注这些账号主要是当地居民,通过这种方式获得两个地区居民账号;其次直接从当地学校账号提取学生的推特用户名,为了进一步确保样本准确性,研究者对获取数据进行再次筛选,通过推特地理位置的检索删除非当地用户。采用这两种方式,当地的推特用户信息被全而覆盖收集。对数据的处理主要是采用文本分析,词汇库、语言辞典列出了负性情绪词汇,在事件发生后的第一天,推特信息出现的事件常用描述词汇22个。将含有负性情绪表达或者事件相关词汇的推特信息编码为1,否之编码为0。对数据分析主要是采用stata分段回归分析,结果显示,无论是社区还是校园用户,圣巴巴拉地区在事件发生后的6周内负性情绪的表达比例更高,负性情绪在1周之内表现最为显著,即6-7天之内波动是最剧烈的,两周以后基本回到基线水平。    

我国也有学者进行类似研究,叶勇豪等人提取"7.23动车事故”后微博数据,分析网民对一系列衍生社会事件道德情绪特点以及在不同群体中表现的差异[。研究者列出事件及衍生事件发生轴,并根据时间轴对微博数据进行持续爬取。事件热点维持时间为40天左右,研究截取数据时间段为2011年7月23号到2011年9月1号。为了将无关微博信息清洗,根据事件相关词汇提取有效微博信息。此外,为了对比性别对情绪表达影响,需要进一步追踪微博用户的基本信息,采用“结巴分词工具”对文本内容进行分析。值得注意的是,该研究从总数据中抽取十分之一数据作为测试数据集,用于测量模型预测能力。分析表3个事件分别与几种道德基础相对应,违反3种道德基础将分别诱发鄙视、同情和愤怒,这3种不同的道德情绪因性别产生差异,女性的情绪表达强度更大。    


相关推荐
联系我们

代写咨询
 362716231

发表咨询
 958663267


咨询电话

18030199209

查稿电话

18060958908


扫码加微信

1495607219137675.png


支付宝交易

ali.jpg