1980年DSM-Ⅲ的问世拉开了精神疾病定义革命的序幕,精神疾病回归到克雷佩林的现象学分类传统*,而不再以无法言明的病因划分。这对于精神疾病的诊断来说意义重大,但也带来了新的问题:病因的异质性,即同一疾病可能存在多样的病因。
*作者注:埃米尔·克雷佩林(1856年—1926年)根据精神疾病的症状对其进行了具有里程碑意义的分类,著有《精神病学纲要》(Compendium der Psychiatrie)。这一思路与同时代的弗洛伊德的形成鲜明对比,后者强调基于心理学病因的分类方法。
传统的遗传学方法在这里失灵:很多精神疾病虽然有家族传播的倾向,但并不严格遵循孟德尔定律(常染色体或X-连锁,显性或隐形);全基因组关联分析(GWAS)在阿尔茨海默病等复杂疾病中表现优异,在精神疾病中却不尽如人意。精神疾病的发病不仅受基因控制,也与环境高度相关。研究发现,与单纯的遗传多变性相比,基因-环境相互作用(G×E)才是带来病因异质性的遗传学核心[1,2]。
G×E:基因-环境互作研究
为了探究复杂疾病的病因,科学家们将传统遗传学和流行病学研究相结合,形成了遗传流行病学,而G×E正是其中的核心概念[3]。环境与基因均会影响疾病症状,除去基因型和环境因素分别单独作用外:环境因素对不同个体的作用会受基因型影响;遗传因素的作用也取决于环境的影响。G×E指的就是这二者的相互作用。
但G×E的研究非常困难,相比于GWAS等单纯的基因研究,环境变量的引入是一个巨大的统计学难题。一般来说,一个理想的G×E数据库应该包括以下特征[4]:
- 包含大量个体的完整胚系基因组序列,且所有个体可链接到一个统一的遗传家系,以实现垂直性状传播的推断分析;
- 包含所有个体的完整表型概况,包含动态变化。而这是极具挑战性的。目前,最好的人类观察数据包含每个个体的病史记录、临床检测记录、生物代谢特征等,但能捕捉的个体发育片段非常有限;
- 包含外部环境事件和环境干预的完整记录,包括多种多样的气候变化、微生物稳态的波动、个人的生活习惯和社交结构等等。环境条件的动态记录数据相比遗传信息更加庞大,因为环境参数的集合极其庞大,并且必须从受孕到死亡不间断地进行记录。
*作者注:胚系基因组(Germline genomics):指未发生重排的生殖细胞基因组,与体细胞基因组相对。
这无疑是一个包含基因型、环境、表型、时间四个维度的庞大矩阵,我们可以通过它建立复杂的数学模型,实现G×E对表型的拟合。但短期之内注定无法实现这样的数据集构建。
在近日发表于Cell Reports Medicine的题为“Gene-environment interactions explain a substantial portion of variability of common neuropsychiatric disorders”的研究中,作者借助结构简化的数据集和具有强大简化假设的数学模型,分析了十个高发的神经精神状态中G×E的贡献,包括抑郁症、焦虑恐惧症、偏头痛、适应性障碍、药物滥用、注意缺陷多动障碍(ADHD)、双相情感障碍、不明原因头痛、睡眠障碍和创伤后应激障碍(PTSD)[4]。
本研究的结果
本研究收集了138,383个美国家庭,404,475位个体的临床数据,家系研究,地理空间,社会经济因素,人口混杂因素,以及一系列的环境整合参数。针对这些参数,作者设计了一系列的贝叶斯回归模型,探究了(1)G×E在精神疾病中的参与度;(2)不同环境因素(地理位置、性别、年龄和当地环境质量)对多种精神疾病发病可能性的具体关联。论证了G×E在精神疾病中的重要性,也为认识这些精神疾病提供了部分指导。
引入G×E参数后,拟合度更优
本研究取遗传率(h2)和五种环境因素(配偶c2,同胞s2,家庭环境f2,个人环境e2、地理环境p2)为基本参数构建了线性多因素回归模型,将遗传率与环境因素交叉构成G×E参数(hf2,hc2,hs2和he2),结合上述参数构建混合效应贝叶斯模型。对比发现,含有G×E参数的模型对疾病的拟合度在大多数疾病中都显著优于线性模型。
- 拟合度变化:在抑郁症,焦虑恐惧症,偏头痛,ADHD,双相情感障碍,不明原因头痛,睡眠障碍和PTSD八种疾病中,含有G×E参数的模型优势明显。
- 遗传率变化:在ADHD和双相情感障碍种,如果不考虑G×E参数,疾病的遗传率会被显著高估。
地理位置的影响
ADHD和PTSD的地理差异对整体差异的影响较大。生活在美国南部和五大湖地区患ADHD风险较高;西海岸和新英格兰地区居民患PTSD风险较高;
性别、年龄的影响
男性患ADHD和药物滥用的风险高,女性患偏头痛、未具体说明的复发性头痛和PTSD的风险高。睡眠障碍在老年人群中更普遍。ADHD和双相障碍在年轻人群中较常见。
环境质量指标(EQI)的影响
- 空气质量差的地区,抑郁症、适应障碍、ADHD和双相情感障碍的风险似乎较高,焦虑症、不明复发性头痛、睡眠障碍和PTSD的风险似乎较低。
- 水质对这些精神疾病的影响很小。较低的社会人口质量可能与抑郁、适应障碍和ADHD的风险升高有关,也可能与不明复发性头痛的风险降低有关。建筑环境质量影响广泛:抑郁症、适应障碍、药物滥用、ADHD、双相情感障碍和睡眠障碍的发病率受到较差建筑环境质量的影响。
*作者注:EQI:每个县的空气、水、土地、社会人口和建筑环境五个领域的质量评估指数。
延申:G×E的研究范式
G×E是一个典型的交叉领域,研究范式仍在探索中,常见的研究范式包括:
(1)多元统计回归分析,检测G×E的解释效力(本研究的思路原型);
经典的研究方法。在前全基因组数据时代,家系研究的行为遗传学方法被用于估计遗传和环境对症状的影响。但这一方案计算出的遗传率通常比GWAS的结果低。
本研究创新性地结合双胞胎研究、家系研究和GWAS,但整体思路仍属于这类。
(2)通过关联分析确定候选基因,与环境参数进行互作研究(cGxE);
GWAS已经为复杂疾病遗传学确定了数千个相关的基因突变位点。可重点研究这些候选基因与环境的关系。如痴呆患者的APOE突变和环境因素的相互作用研究,肥胖的相关基因FTO与环境的相互作用研究等。但这种研究的假阳性问题比较严重。
(3) 使用GWAS中的PGS,测试不同环境的表现;
多基因得分(PGS)在GWAS中指多个遗传变异与表型关系的总和。2014年前后至今,大量的GxE研究借助PGS展开,在精神疾病领域大有作为。通常采用病例对照研究,如多项研究调查了重度抑郁症(MDD)的PGS和童年创伤的交互作用。有研究发现,MDD的PGS较高且经历过童年创伤的个体比那些PGS较低且无创伤病史的个体更容易发展为抑郁症。
我国的G×E数据库——CHIMGEN
中国影像遗传学(Chinese Imaging Genetics, CHIMGEN)的目标是收集来自21个中国大陆城市的30个研究中心的10000名18-30岁健康汉族受试者的基因,神经影像,环境和行为学数据。迄今为止,我们已经招募了7000余名受试者,建立了全球最大样本的中国汉族人群影像遗传学队列,旨在研究与神经影像和行为表型相关的遗传和环境因素及其相互作用。
CHIMGEN研究的一个独特方面是从卫星图像和国家调查数据库中收集了数百个宏观环境测量数据。与基于问卷和自我报告数据的微观环境评估相比,遥感和国家调查数据可以提供许多新的定量宏观环境评估。可以基于遥感数据获得每个参与者的居住地的地貌和地形,城市化,气候和空气质量的定量环境测量,以及基于国家调查数据库的参与者生活场所的经济,城市化,生活条件,医疗保健和教育的定量环境测量。
CHIMGEN的未来规划是收集2000-3000名严重精神障碍患者,并通过后续随访受试者,将CHIMGEN队列发展为纵向队列,这将为中国的精神疾病的G×E研究乃至病因研究带来长远的影响。
正如本文作者Rzhetsky提到的,“遗传学被许多人视为一种判决—你无法改变它,……找到这些基因-环境相互作用给了我们希望,我们可以找到一些与环境相互作用的遗传变异,这样,理想情况下,你可以改变你的环境来避免疾病。”
我们相信,对环境的修饰和干预终将为精神疾病的精准医疗拓宽道路。
校对:Nevaeh;编辑:光影