大数据视角下,家暴受害者的心理图鉴
2021/04/09
2402

本文内容来自朱廷劭教授在全国家庭心理建设高峰论坛上的演讲《大数据视角下,家暴受害者的心理图鉴》。

 

大家好,我叫朱廷劭,来自中科院心理所。虽然我在心理所,但我是全计算机背景,所以我今天的介绍和计算机相关的内容更多一些,主要从大数据的角度去研究,家庭暴力对受害者的心理影响。

 

我对家暴最初的了解,来自一个以家暴为题材的连续剧,叫《不要和陌生人说话》,是中国第一部以家暴为主题的电视剧。后来从我的研究来看,家庭暴力是一个长期存在的严重的社会问题,并不是因为连续剧的出现,才开始存在的。

 

图片

图片

 

家庭暴力的现状

 

图片

图片


根据2020年早期的统计,大概百分之三十的家庭存在着家庭暴力的问题,并且有很多的家庭暴力受害者在家暴处理过程中遇害。所以家庭暴力是一个很严重的社会问题,涉及到方方面面,不管是受害者、家庭还是小孩都会受影响。 2016年我国正式开始实施反家暴法,对家庭暴力给出了法律上的定义:指家庭成员之间以殴打、捆绑、残害、限制人身自由以及经常性谩骂、恐吓等方式实施的身体、精神等侵害行为。 

家庭暴力带来的影响

图片

图片


·我们从定性的角度看,家庭暴力带来的最直接的影响就是对身体健康的伤害。由于男性和女性身体结构的差异,家庭暴力中男性受害者的比例特别少,女性受害者居多。 ·受害者长期在家庭暴力中会受到环境的影响,造成长期的精神紧张与忧虑。 ·因无法得到一个很安全的家庭环境,导致人格尊严受损害,人格扭曲。我们都知道人格是一个最基本的心理变量。如果人格发生变化,更可能会影响终生。 ·我们都说父母是小孩最好的老师,如果小孩在家庭暴力的环境下成长的话,小孩就会把家庭暴力看作是解决家庭问题的一个手段,并且会去实施它。这对他以后的婚姻和家庭都会带来很大的影响。 ·家庭暴力也会造成家庭成员观念上的误区,夫妻之间的平等尊重不能得到保障。在国内,家庭是最重要、最基础的社会细胞。如果家庭得不到稳定,就会影响到整个社会的稳定与和谐。 

传统方法在家暴影响研究方面的困难

 对家庭暴力影响的研究有一个最大的问题,就是每一个家庭暴力事件发生的时间和地点都不一样。一般做研究时,都是通过街道、社区找家庭,去做家庭随访、回访来得知家庭暴力的影响。 但其实比较好的办法应该是做家庭暴力事件的前后测。比如说家庭暴力之前测一次,家庭暴力之后再去测量一次。通过这两次前后测的差异,看家庭暴力在哪些方面对一个人的产生了影响,影响为何。 但是我们没办法控制家庭暴力发生的时间,很难做到今天所有人测了一次,第二天就发生了家庭暴力,第三天再测一次。这从实验控制的角度来讲是做不到的。 

图片

图片


而且,我们很多这类的心理学研究都是基于问卷进行的。而问卷,也就是自我报告,首先是要依赖用户的配合,这是比较难的。因为在国内,大家还是认为家庭暴力是“家丑不可外扬”,总认为这是自己的家务事,能自己解决就尽量自己解决。 其次,自我报告的时效性不好保障。因为家庭暴力的发生只有当事者知道,如果等事情过了之后再去回溯,很难再去回忆家庭暴力前后的心理变化,因为存在记忆误差。 

如何建立行为心理映射模型

 我们知道任何行为的背后,或多或少都有心理因素,那么行为和心理之间就能够存在一个比较强的映射关系或者对应关系。 我们把这个对应关系模型化,就可以把一个人的行为做成输入值或者叫自变量,而心理作为输出或者因变量。这个映射模型,使我们可以通过对一个人的行为分析,自动计算心理指标。 这就是利用大数据,加上人工智能的方法,去做人的心理识别的一个基本思路。 

图片

图片


这个模型的建立过程,其实我们日常生活中都有在用,比如大家用Excel的趋势图,建立趋势线的过程,就是建立训练模型的过程。 我们先通过一定量的数据来训练模型,然后利用这些模型对任何的新数据做预测。预测过程也是在机器学习里面用的比较多的两个阶段的过程:训练和应用的过程。 具体的训练和预测过程是,比如我们用1000个用户作为训练样本,每一个用户的行为数据都作为输入值,同时把通过心理测量得到的心理指标作为 因变量,那么自变量和因变量之间的映射关系就可以通过机器学习的方法得到。 在模型学习出来后,对于大量的新用户,可能是10万个,我们就可以对这10万个用户的心理指标做预测,代替用户的自我报告。 这个过程类似于一个专家根据自己的经验,通过对用户的行为观察,给用户做他评。只不过这是通过计算机学习的方法,由计算机给人做他评。当然他评过程也需要一些新的测量方法和信效度检验,并不是建了模型就可以。 

生态化识别过程

图片

图片


生态化的识别过程,是采集自然状态下的生态化的行为数据,再利用机器学习的方法训练出一个预测模型,来实现对心理指标的自动识别。这个过程就是生态化识别过程。 这使得很多我们在以前依赖于用户配合的研究,可以通过智能化的过程,对大规模用户进行研究。因为网络上的所有数据都是有时间戳信息的,所以生态化识别的好处是我们可以回溯到任意时间点去做各种各样的分析;坏处是它可以实现对一个人的纵向全时长跟踪,从研究角度来讲是个好事情,但对于隐私保护来讲是个问题。 有了这样的方法,我们首先要考虑的是如何去找到这些数据。方法有很多,比如说微信、微博或者是论坛、贴吧之类的。现在比较公开的数据源是社会媒体数据,国内的是微博,国外的是推特。 Facebook其实是一个社交网络,国内对应的是人人网——以前的校内网,与微博、推特不太一样。微博是媒体属性,你可以把它看成是一个大字报,我发了帖子之后希望更多的人能看到,而且媒体平台的活跃用户量比较大。 

图片

图片


这些活跃用户为我们带来大量的数据,他们的日常行为都被社会媒体记录了下来,帮我们实现数据的电子化记录。 当人们在网上报告自己正在经历家庭暴力,根据每一个事件的时间戳信息,我们就可以比较精确地发现家庭暴力发生的时间点。 这样就可以把他在家庭暴力发生之前一段时间,在网上所表现的行为对应的心理数据作为前测,也就是检测他在家庭暴力发生之前是什么样的。在家庭暴力发生之后的一段时间内,他在网上的表现所对应的心理指标作为后测,以此实现对一个人在家庭暴力前后的心理测量。 这和我们一般理解的大数据可能不是特别一致,在网上报告自己有家庭暴力历史的用户量不是那么多,但还是有的。 

图片上传失败!点击重试


这个心理测量的过程是用计算机去做,用模型算出来。当然这个模型的信效度需要检验。通过这种方法我们可以对家庭暴力的心理影响做一个对比研究。 因为微博的内容是用户自主发在网上的,所以并不是每天都有。我们一般是截取足够多的数据(前后一个月),计算对应的抑郁焦虑程度,比如说自杀风险、人格、幸福感等。再去比较前后测的差异,就能知道家庭暴力对人的心理指标的影响。 首先我们通过一些关键词筛选出有家庭暴力报告的案例,比如像家庭暴力、精神暴力、老公等,还有父亲、母亲,包括虐待、受虐等等。 

图片

图片


通过这种方式,我们从130万的微博数据中提取出大概1000多条微博数据,报告过家暴。有的是长期、多次的,有的是一次性的(就是首次的家庭暴力);并且对家庭暴力做了分类以及定义上的区分: 

图片

图片


在筛选过程中,第一次筛选标准是真实遭受家庭暴力或者目睹家庭暴力,需要用户在报告中很明确地提到,比如“今天老公第一次打我”,这就是很明确的家庭暴力的报告。还有人会直接讲,比如“今天第一次看到父母打架”,这就是围观了家庭暴力。 

图片

图片


因为计算机不能完全代替人工,而且有时候虽然用户讲了关于家庭暴力的事情,但是讲的是对家庭暴力这个事件的评述,比如说反对家庭暴力或者反对夫妻吵架之类的,所以我们也找了一些主试对语境做判断,看他是不是真的遭受了家庭暴力。 这还需要主试之间达到测试一致性,以保证对家庭暴力案例的判定是准确的。 我们也特别关注首次经历家庭暴力,因为第一次家庭暴力对人的影响是最大的。而且家庭暴力如果有第一次,一般就会有第二次,很难完全戒断,所以对家庭暴力的干预或者处理可能会是一个重要的社会难题。 在筛选时,我们需要用户在网上表达家庭暴力时,一定要体现出首次家暴。 

图片

图片


同时家庭暴力也有一些长期的表现。有的人写了一次就不再写了,有的人是多次的写,比如说多次报告经遭受了家庭暴力。(通过对一个人的数据的纵向跟踪分析,看出他是否有长期家庭暴力的历史。) 

图片

图片


除了筛选,我们也做了对照组。因为即使能够发现家庭暴力事件前后的心理影响,也无法排除其他没有经历家庭暴力的人,在同样的时间段也有同样变化的可能。也就是说有可能即使没有家庭暴力,也可能会遇到这种情况,所以就需要有一个对照组做基线的比较。 

家庭暴力对人格的影响

 我们首先做了人格的分析,家庭暴力事件对人格是否会带来影响。人格是特质性的变量,一般是在青少年后期开始定型,后续有些人会被年龄,社会投入,一些重大的生活事件所影响。这也是为什么我们做了人格变化的分析。 

图片

图片


人格变化的测量主要依据“大五人格”,包括外倾性、情绪稳定性、开放性、宜人性和尽责性五个维度。我们想看看不同类型的家庭暴力,会不会对这5个维度带来影响。
从结果分析来看,三种不同的家庭暴力的类型都会对受害者的人格造成影响。家庭暴力受害者在宜人性和尽责性方面显著降低,在神经质方面得分更高。神经质越高,情绪越不稳定,表示这个人会更容易紧张焦虑,也就更容易遇到不幸的遭遇。 

图片

图片


人格是一个特质性的变量,不像抑郁、焦虑是状态性的,受影响之后,人格很难再回弹到原始状态。也就是说对受害者来讲,后续的影响可能是终身的。 通过跟踪数据分析,我们看到有些人在经受家庭暴力人格发生改变以后,还会恢复到正常,恢复到家庭暴力之前,前后不存在显著差异;而有的人就一直没有再恢复到原来的状态。 同时,每一个家庭暴力受害者的对照组样本,要在人口统计学信息上严格对应,接受前后测的时间也要一致,尽量避免其他因素的影响,尽可能控制更多的变量。 

图片

图片


我们进一步做了分析,主要是来看家庭暴力前后,家暴组和对照组的指标变化是否存在交互作用,是否同时升高或者同时降低。 从结果来看,对照组的人格相对比较稳定,这与人格的稳定性相符。 家庭暴力受害者在宜人性、尽责性以及开放性方面和对照组相比有所降低,但是情绪性增高,这表明组别差异效应显著。同时在尽责性、神经质方面呈现了时间和组别的交互作用。 

图片

图片

 

家庭暴力对心理健康的影响

 除此之外,我们还做了其他几个心理健康指标的测量,包括抑郁程度、自杀可能性和生活满意度。一个是负性指标,一个正性指标,还有一个是心理危机。从这几个角度去看家庭暴力对受害者的心理健康影响到底是怎样的。 从自杀可能性的几个维度的研究来看,很多时候他们最大的问题是绝望感比较强。对生活丧失了信心,缺乏社会支持,感觉被这个世界抛弃了。所以这时如果有很好的社会支持系统,就可能帮他克服困难。 我们可以看出,在经历家庭暴力之后,受害者的抑郁程度和自杀可能性显著升高,生活满意度降低。同时我们也做了对照组,对照组并没有多大变化。 

图片

图片


当然这个结果是用量表测出来的,并不是一个诊断结果,只能对诊断起辅助作用。但是我们也可以看到家庭暴力对于受害者在心理健康方面的影响是比较大的,使受害者可能会更倾向于罹患精神疾病。 

不同类别的家庭暴力对受害者的影响

 我们也做了不同类别的家庭暴力对受害者的影响。我们把家庭暴力分为三类:夫妻间,儿童暴力,还有围观(目睹家庭暴力)。结果显示: ·夫妻之间的家庭暴力受害者4周内抑郁程度增高,基本上达到临界值,要更多关注有没有抑郁症的状况。 ·目睹家庭暴力受害者会有比较高的自杀可能性。这里说的只是自杀可能性,并不是自杀的计划和自杀行为,但是自杀可能性一旦增高,以后会逐渐使自杀的风险提高,包括自杀意念和敌对等维度的提高。 ·目睹家庭暴力的受害者和对照组相比尽责性会降低,也就是说如果一个人目睹了家庭暴力,他以后在处理自己的家庭、婚姻问题时可能会不由自主地采取家庭暴力的方式。 我们利用网络数据(微博上的)和人工智能的方法,可以了解到家庭暴力这个事件对受害者的心理影响的模式是怎样的;能比较深入地知道哪些指标会产生什么样的影响,以及对哪些人会造成怎样的影响。这对我们以后做家庭暴力的干预提供了科学支持。 

疫情期间的家暴

图片

图片


在疫情期间,我们想了解一下在疫情的背景下家庭暴力会产生哪些不一样的变化。 我们同样通过关键词去找到了推特上和家庭暴力有关的原创内容(转载内容更多是在讨论而非亲身经历),再利用人工智能的主题模型,找到大家在疫情期间和家庭暴力有关的主题,同时分析这些主题的变化情况。 这是推特上关于家庭暴力的一些关键词。 

图片

图片


结果发现,疫情情况下,家庭暴力的频率会增加,同时求助热线的接听量增加;自杀、谋杀以及心理健康方面都受到了影响。也就是说疫情不止改变了我们出行方式,它其实改变了生活的方方面面,尤其是直接和家庭暴力相关的方面。 在进一步的分析,比如基于不同性别的分析中我们得知,在国外,家庭暴力的男性受害者比例要稍微多一些。 

图片

图片


以往的研究对于家庭暴力带来的这些影响很难量化,但是利用大数据与人工智能,能让我们真正地了解影响了哪些指标,并且达到了什么程度。这对于我们做家庭暴力的干预、预防或者相关法律与政策的制定,提供了科学性的基础。 我们知道,很多人在遭受家庭暴力之后,虽然得到了干预或者帮助,但最后还是不得不回归家庭,继而遭受二次伤害,这并不单纯是受害者接受心理咨询就能够解决的,可能需要探究家庭暴力双方的心理特质,甚至需要整个社会体制的方方面面共同努力。

本文经过音频整理而成,未及嘉宾审核

关注我们
一生很长,有些路要一起走。 关注我们,了解中国心理学家大会最新动态。…
关注大会微博
关注大会微信
微信关注
手机打开微信 > 发现 > 扫一扫
微博关注
手机打开微博 > 扫一扫
中国心理学家大会——中国应用心理学工作者的年度专业盛会。
立即咨询
立即参会