大会逐字稿系列 | 大数据视角下的自杀干预与舆情分析(上)
2020/10/30
2751

第十四届中国心理学家大会逐字稿系列陆续发布中,后续内容欢迎扫描文末二维码进入大会社群等候发布,还有更多精彩内容等你免费拿!

 

 

伴随科学的发展和科技的进步,计算机在各个领域的深耕发展都带来了很大的成效,如今在心理学领域也有了大数据和人工智能的加入,来自中科院心理所大数据实验室的负责人朱廷劭老师,将带来详细的分享,剖析在大数据人工智能的视角下对于自杀干预以及舆情分析的应用和思考。

 

张冉先生:

 

 

这里是第十四届中国心理学家大会心理会客厅的直播现场。

 

今天请到的嘉宾是中科院心理所的朱廷劭教授,朱老师是中科院心理所大数据实验室的负责人,这个大数据实验室是中国心理学唯一的一个中科院重点实验室。

 

今天的主题也是基于朱廷劭老师的研究领域,即大数据视角下的自杀干预与舆情分析。

 

今天邀请到的对谈嘉宾是中国心理学会监事会副主席,复旦大学的孙时进教授,欢迎两位老师。

 

首先有请朱廷劭老师为大家带来今天的主题分享。

 

朱廷劭教授:

 

 

大家好,我今天主要是给大家介绍一下我们在大数据和社会心态、心理危机、自杀干预方面的一些工作,希望能够给大家一些启示。

 

我来自中科院心理所,我的背景其实是计算机,我的本科、硕士、博士全都是有计算机背景的,所以我今天的报告可能更偏向计算一些。

 

从我们的理解来讲,其实社会心理服务的对象最简单的划分是分为个体和群体,也就是最大规模的人群。

 

针对个体主要是心理健康的识别和干预,针对群体主要是了解群体的心态感知和引导,去了解群众是怎么想的,然后有针对性地去引导他们,能够给他们提供一些更好的政策建议。

 

现在传统心理服务的主要方式可能就是在线的问卷调查,或者是资料发放,或者是入户,或者是讲座,或者是简单、直接的心理咨询,这些方式对于人力资源的要求比较多,特别需要大量的人力投入。

 

我们就在想有没有可能利用现在所谓的大数据和人工智能结合的方式,来实现普惠化的服务,比如现在中国几乎每人都有手机,大家都可以上网,尤其现在中国上网的人数占全世界最多,如果我们可以通过这种人工智能加大数据的方法,就可以把心理服务普及到各个地方,让各个阶层的人都可以接受到心理服务。

 

除此之外,使用大数据加人工智能结合的方法,还有一致性比较高的服务品质,这一点主要是因为常规的做法主要依赖心理咨询师和心理服务人员,如果他们的专业素质不一样,服务会受到很大影响,而计算机做服务的话能保证一致性的品质。

 

同时还有高时效性,以及有可能针对个人不同的特点提供一些个性化的服务,这是我们觉得结合技术方法,针对社会心理服务,能够提供的更好的技术支撑。

 

下面给大家介绍一下,这是我们一直在做的项目,我们称其为“生态化识别”,它的主要对标是常规对心理测量的对标。

 

大家可能都知道常规的心理测量很多时候采用填问卷的方式,但是填问卷很有可能出现很多问题,比如社会治安属性,或者是有刻意作假的动机,我们想利用对一个人自然状态下生态行为的分析,比如一个人讲话的语音或者语调、说话的自我介绍、自我报告时候的面部变化,以及走路时步态的分析。

 

利用这些很自然的、很生态化的行为数据,结合机器学习就是人工智能的方法,我们就可以实现对这个人的心理素质以及心理指标的自动识别,如果能够建立好这样的模型,可以根据这个人的一些新的用户行为,直接去做他的各种心理指标的识别,就不需要他填写问卷了。

 

并且采用这样的方式,可以是一对多的行为指标,可以把多个新的指标同时预测出来,这样对用户的要求就比较低了,不需要他去读懂问卷,也不需要他去做很多的量表,只要有一次性的、自然的、生态化的行为就可以。

 

当然这样的方法也有它的流程,这个流程就是典型的机器学习的人工智能的所有流程,首先需要有行为特征作为输入,然后这个人的心理指标作为输入,然后通过学习这个人的映射模型,就是两个输入到输出的自动映射。

 

映射模型学好之后,对于新的用户数据,我们只要调用这个模型就可以直接算出来了,所以大家可以把它看成是一个计算机的“他评专家”。

 

计算机可以通过对这个人以往大量数据的学习,找出来这个人的行为细节跟心理指标之间的相互关系,这种关系学好之后,对一个用户的自动行为分析就可以识别出他的心理了。

 

通过这种办法,我们可以克服掉传统的心理量表测量的局限性。

 

下面跟大家分享这种方法在个体的心理危机,以及群体的社会心态方面的应用。

 

自杀其实是一个比较复杂的社会问题,到目前为止,其实针对自杀的研究,都并没有真的搞清楚人为什么会自杀,也就是说自杀模型这个部分一直没有弄清楚。

 

但自杀是一个很严重的社会问题,在中国,自杀在年轻人中是第二大死因,第一大死因是交通事故,但随着国家对交通法的严厉执行,这个比例可能会降低。

 

除此之外,常见的是喝农药、上吊以及其他方法,而且自杀死亡率其实比战争和凶杀还要高,可能我们的周围都会遇到自杀的案例。

 

自杀最大的一个问题是主动求助率比较低,很多人在自杀之前,其实并没有真正地主动去求助,在中国自杀的主动求助率几乎少于7%,但是主动求助率低并不代表他们真的不想求助,确实有20%的人可能是不想求助的,我们觉得可以理解,但是还有接近80%的人,因为各种各样的原因,没有去主动求助,所以我们想有没有可能帮助到那些人。

 

目前面对心理危机,很多的做法是开通热线,各个地方都有热线,打个热线进去之后可以求助,但是很多时候打通热线其实已经晚了,很多人是一边割腕一边打电话的。

 

从我们做研究的角度来讲,如果这个人已经开始实施自杀行为,基本上很难再把他拉回来,因为自杀尝试一次之后,再次自杀的成功可能性非常高,也就说如果这个人跳过一次楼之后,即使救了回来,第二次这个人成功跳楼的可能性更高,并且他有可能会实施更加决绝的方式,可能就根本找不到他了。

 

我们希望把干预尽量前移,也就是说在这个人还没有采取这种非常极端的自杀行为之前,就可以去帮助他们解决他们的问题。

 

自杀的过程一般会认为一个人有自杀意念,有自杀尝试,然后采取自杀行为并死亡这三个阶段。

 

基本自杀意念的阶段就可以开始介入,我们可以利用网络的办法,因为现在很多人在网上发表言论,比如像社会媒体,尤其是论坛、贴吧或者各种各样的网站上,人们都会有各自的表达,如果我们通过网络爬虫可以自动抓取这些信息,然后再用机器学习模型识别出来,有哪些人的表达里带有自杀意念,那么我们就可以识别出自杀风险人群,就可以去跟这个人去建立关系和保持联系,这样时效性是最好的,因为一个人如果有自杀表达,在长时间没有得到回应的话,他就可能采取自杀行为,如果我们能够提供时效性很好的服务,就可以把他挽救回来。

 

这是整个的流程,首先通过计算机的方法去自动获取数据,然后加上计算机器学习的自动识别,最后再进行人工的确认,之后再跟这个人建立联系。

 

整个一套流程下来,我们把它称之为“主动的自杀防御”,跟常规的被动等待不太一样,以前我们只能等着自杀风险人群主动打电话进来,其实那个时候已经比较危险了,而这样的做法只要我们在网上能够发现这个人有自杀的想法,就可以主动出击,主动去联系他们,这样可能会减少他们自杀的风险,这就是我们讲的对不同的自杀表达的意思,一个是有意念、有计划,另一个就是已经实施了行为。

 

很多人其实被发现有实施自杀行为时已经比较晚了,所以我们希望能够尽快、尽早地在一个人刚刚有自杀意念的时候,就能够去识别出来。

 

用计算机智能来做识别的工作,是因为这个工作量比较大,如果完全由人工识别的话,耗费的时间太长,对人的影响也不太好,而计算机是没问题的,这样的话我们就可以通过计算机去自动识别出有自杀意念的模型,现在识别率达到84%,也就是说如果我们预测出来有100条微博是带有自杀意念的话,最后发现确实有84条是真的有自杀意念的,虽然有16%的偏差,但是对于大规模的筛查是很有用的,因为我们可以大规模地减少人工的工作量。

 

找到这个人群之后,我们建立的方式一个是热线转接,可以向这些人提供全国各地的自杀心理危机干预热线,同时可以提供在线的自助服务,除此之外,也有志愿者的参与,跟这些人直接进行一对一的交流。

 

从2017年的4月份,我们开始试运行这个项目,到2017年的7月份正式上线,一直到现在还在运行中。

 

我们统计了2017年的7月份到2019年的4月份这段时间内,有多少是跟我们的志愿者有过交流的人,因为大概有40%的人其实是不太愿意跟人交流的,所以我们也提供了在线的系统服务,就是在线的一个心理测量,还有心理自助服务,因为很多人其实更愿意跟机器打交道。

 

但是在跟我们的志愿者交流的人当中,我们发现有77%的人是持有比较积极的态度的,其实这对我们来讲是一个很大的鼓励,因为我们一开始很担心通过这种网络的方法,主动找到他们会不会引起反感,但是从这些反应来看,其实77%的人是比较支持这种做法的,使得他们能够获得一定程度的社会支持。

 

除此之外还有一些内容主题,从我们的统计来看,确实是有相当一部分是有精神疾病的,但是这些精神疾病跟国外的不太一样,因为从研究角度来讲,国外的自杀比例大概有90%都是长期精神疾病导致的,但是因为文化的差异,其实国内并没有达到一个指标,中国基本上是一半的比例,也就是说国内的自杀人群里面有一半的人是我们常规理解上的精神健康的人,因为各种原因而选择自杀。

 

除此之外,还有比如工作问题、婚恋问题、学业问题,总之就是各种问题,其实很多自杀人群是在生活中遇到问题不好解决的情况下,采取了极端的行为,并且有的时候因为认知方面的偏差,一些人并不知道这种自杀行为会带来如此严重的后果。

 

另外,确实在因精神疾病而自杀的人群中里抑郁症是占比最多的,达到80%的比例,但是并不代表自杀的人都有抑郁症,这样的说法是不对的,其实有接近一半的人群是心理健康的。

 

在这种情况下,中国的自杀干预需要跟国外采取不同的方法,除了利用网络数据之外,我们也希望能够利用一些更自然的数据、更常规的数据,比如手机、可穿戴设备、手环或者眼镜,还有各地的音频、视频,因为音频、视频可以采集到一个人最自然状态下的行为表现,这种行为表现的差异可以映射到他的心理指标上。

 

比如拍一个人走路的步态,可以提取出这个人步态中各个关键点的位置变化,通过在这种自然状态下生态化的行为,我们可以了解到这个人的行为特征,通过细微的行为特征的差异,可以把这些差异映射到这个人的心理指标当中。

 

相当于我们经常讲的,如果这个人精神非常抖擞的话,他走路是不一样的;如果这个人精神萎靡不振,他走路也是不一样的,这种精神的好坏表现出来的行为上的差异,可以利用计算机将其识别出来。

 

以后如果再有这种行为数据,我们就可以识别出这个人的心理指标,这是基本的一个思路。

利用步态的识别,我们可以实现对抑郁和焦虑的主要心理健康指标的识别,基本上可以达到类似的强相关,也就是说基本上可以利用这些步态的数据实现对一个人的抑郁和焦虑的筛查过程,就可以实现人群的大规模筛查。

 

一般来讲让一个人自然地走几圈,提取出这些数据后,就可以对他的各种心理健康指标有一个大概的了解。

 

除此之外,我们也对语音做抑郁症的分类识别,抑郁症的分类识别主要针对的是辅助诊断,因为目前对精神疾病的诊断主要是依靠医生的主观诊断为主,也会结合其他一些指标。

 

我们想通过对病人访谈过程的语音数据分析去了解,看能不能对他的抑郁症提供辅助诊断,这个结果我们觉得也还是比较好的。

 

我们也一直在思考,实现了这种自动识别之后,有没有可能利用一些计算机的办法提供自助的心理服务,让病人自己去做自我干预。

 

我们现在是用CBT的做法,就是认知行为疗法,但是认知行为疗法在国内有一个问题就是时间比较长,首先它作为一个治疗的辅助是比较好的,但是如果真正自助的话,可能还需要开发符合中国特点的自助服务,比如短时程的,可以帮来访者解决问题的,这样就能够对很多人很有价值。

 

我们了解到的是,很多人是在上班坐地铁的过程中阅读心理干预相关的信息,需要在20分钟之内给他一个具体方案,他才可以执行,人们不会有这么多时间听别人讲心理的问题,所以如果我们能够提前发现心理健康问题,并且及时提供这种自助心理服务的话,就可以把很多心理问题提前解决掉,这样不会使一个人的心理问题越积越多。

 

当然这不是专业服务,如果真的有了病症,就需要专业人员去介入,但是对于相当一部分的人,其实他们主要的是心理健康问题,还没到病症的程度,所以我们觉得结合行为数据,结合机器学习,去识别他的心理健康问题,再加上计算机自动调节,希望能够形成一种闭环,从识别到干预,逐渐形成一个计算机支持的闭环,可以作为人工专家心理干预的一个辅助手段。

 

由于现在每个人都有手机,都能上网,这样很多人都能够去使用这些服务,可能对个体来讲,能够提高普惠价值;对于群体,以疫情期间的社会心态为例,主要是对武汉2020年年初的疫情,我们做了几次分析。

 

 

第一次分析是在1月20日国家发布“新型冠状病毒感染的肺炎纳入法定传染病乙类管理当中,采用甲类传染病的预防控制措施”的公告时。

 

我们想了解的问题是,其实从人类有史以来,1000多万人口的大城市第一次实现这样严厉的管控,或者是出现这种情况时对民众的心理会造成什么影响?

 

所以我们就做了一个在新冠肺炎定性前后,民众的心理变化受到哪些影响的数据分析,我们大概是从100多万用户里提取了1万多微博用户,然后下载这些人的微博数据,通过这些数据的分析,我们可以计算出他们的语言表达特点,把他们的语言表达特点和心理指标做映射的对应,看看在整个定性前后对他们的心理影响是怎样的。

 

通过前一周的数据和后一周的数据进行比较,看看有哪些表达上出现了变化,同时也利用预测模型识别出他们的心理指标和情绪指标会出现哪些变化。

 

分析的结果是情绪在定性之后正向、负向和交流形成显著升高,除此之外在认为认知方面,健康、家庭、死亡和宗教用词显著增高,也就是说对于定性前后的影响,其实民众在语言表达上是有差异的,是能够体现出来的。

 

而在心理指标上带来的影响,包括焦虑、抑郁、压力以及愤怒情绪等,这个影响是焦虑和抑郁的升高,同时幸福感降低,公告公布之后使得民众比较恐惧,社会风险明显提高,生活满意度降低。

 

我们通过这些数据的分析,了解到了新冠肺炎的定性对民众哪些心理指标产生了怎样的影响。

 

再进一步到1月23日武汉封城,这是人类有史以来第一个1000万以上人口的大城市实现如此严厉的管控措施,这种管控的实施到底对民众会产生怎样的影响,谁都不知道。

 

当然也可以做一些问卷,但是问卷没法做到这样的结果,所以我们利用这些数据,从中筛选出来在武汉地区的这些微博用户,通过对他们在1月23日之前和之后的数据的分析,了解武汉封城这个事件对武汉民众的心理影响。

 

最后得到了前后的语言表达变化,还有心理变化,然后对这些指标再进一步分析,就可以看出这些指标在1月23日新冠肺炎定性之后,是怎么变化的,哪些事件对民众影响比较大,有哪些时间节点对民众产生的影响较大。由于网上一直都有数据,计算机就可以做到时效性很长,而常规的做法可能没法去做这么长时间的问卷调查,因为数据每天都在更新。

 

结合这些,我们当时也提了政策建议,就是提高民众的控制感,包括对环境的控制感增强,会比较能够缓解压力,如果觉得没有控制感,可能就比较麻烦一些。

 

比如封城之后的应对措施,当时的宣传经常会出现前后不一致的情况,其实也会影响民众的愤怒和失望情绪,对一些压力的负面应对效果要提前布局,有时候出台一种措施没有考虑到可能带来的负面影响,会发现实施之后可能效果不是特别好。

 

还有就是重大措施和疫情产生的心理影响,我们在疫情期间会产生一些其他的事情,这些事情会叠加到疫情之上,对民众的影响非常大,所以需要及时的信息支持。

 

除此之外可以把这个方法纳入国家信息管理体系,这样能够帮助国家真正很快速地知道,在疫情过程中到底民众的心里怎么想的,一方面可能要防控,另一方面还要保证民众的心态能够在一个正常范围内。

 

我们也做了武汉和伦巴第的对比,一个是国内的城市,一个是国外的城市,国内采用的是微博的数据,国外采用的是推特的数据,这两个数据都是社会媒体数据,我们可以通过社会媒体数据的分析,针对不同地区的人,了解他们在面对同样的封城情况下有什么差异?

 

这个区别就是社会词、家庭词和忧郁词都增加了,忧郁词主要是由于加工,想的更多了,这是两个相反的差异,我们发现休闲词在武汉是减少的,在伦巴第是增加的,焦虑词在武汉是增加的,伦巴第是减少的。

 

这是体现在两个不同文化的地区的差异,他们的文化背景以及文化习惯的差异,使得他们在面对同样问题的时候,会有不同的表现。

 

另外我们也做了驻马店地区的数据分析,是从1月1日到6月1日期间民众的心理压力变化。

 

之所以选择从今年的1月1日开始,是因为2019年12月31日是第一个案例被报告出来的时间,所以一般是从2019年12月31日或者从2020年1月1日开始算起,其实到4月8日武汉解封之后基本上就停止了,一直到现在已经成为了常态,所以选择到2020年6月1日截止。

 

我们可以看出来,在整个过程中民众心理压力的变化,其实在2020年2月12日的时候,有一个比较升高的指标,那时候政府宣布了一些问题,之后指标逐渐降低,再后面有疫情的反复,还有复学的压力。

 

所以通过这些数据我们可以了解到各个不同地区的民众,他们在疫情不同的阶段里心态怎么变化的,心理是怎么变化的,这样我们就可以有针对性地设计比较合理的措施或者政策。

 

总的来讲,我们其实是希望能够利用大数据和人工智能的办法,实现对人的心理指标的自动识别,在此基础上,通过对个体心理的识别和干预,可以做到普惠化的服务,不一定是要取代专家,但是可以让更多的人在更早期的时候去帮他们发现问题,及早解决问题。

 

群体是需要政府的支持,需要政策支持的,我们能做的是可以提供一些政策建议,通过数据分析,我们可以了解民众在不同状态下或者不同情况下,他的心态是怎么变化的,受到哪些因素的影响,基于这些数据,我们可以向政府提供一些政策建议,这样可以使政策的制定更具有数据支持和数据依据。

 

我们希望能够利用信息技术去夯实社会心理服务的基础设施,比如说通过这种基础设施,可以覆盖到更多的人,同时能够向更多的人提供心理服务,更好、更及时地了解民众的心理变化。

 

我的报告先到这里,谢谢大家。

 

老师的高度决定你的视野,想让学界一线大咖带你学完热门心理流派,走上正确的心理学道路吗?扫码进入大会社群,永久浸泡学习;各流派专家不定时空降,帮你知其然更知其所以然,眼界高人一等,技术胜人一筹!

 

 

本文经过音频整理而成,未经嘉宾审核

关注我们
一生很长,有些路要一起走。 关注我们,了解中国心理学家大会最新动态。…
关注大会微博
关注大会微信
微信关注
手机打开微信 > 发现 > 扫一扫
微博关注
手机打开微博 > 扫一扫
中国心理学家大会——中国应用心理学工作者的年度专业盛会。
立即咨询
立即参会