研究背景:
应用meta分析方法对关联数据进行整合分析,在易感基因研究领域非常普遍。Meta分析可以有效解决关联分析样本量不足而导致的统计效力较低的缺陷。随着HapMap数据库中SNP数据的完善和插值算法(Imputation)的发展,对全基因数据进行meta分析已经成为可能。在过去的两年中,利用GWAS数据进行meta分析的论文层出不穷。为了获得较高的效力,研究中使用的样本量往往大于10,。研究对象大多涉及到目前GWAS结果已经发表的而且研究较多的疾病如抑郁症、特应性皮炎、冠心病、肥胖、克隆病、糖尿病、类风湿性关节炎、肿瘤等。由于研究的效力提高,这些研究又发现了很多新的易感区域,其OR值一般小于1.2,而这些区域在单个独立的GWAS研究中往往是不可能发现的。
方法:
1.样本质控:计算样本分型成功率(callrate)=成功分型的SNPs个数/,去除callrate98%的样本(基因分型数据可以利用Hapmap的结果)。去除分型成功率较低的样本;利用plink进行样本亲缘关系检验;利用Eigenstrat软件进行样本主成份分析,剔除离群样本。
2.SNP质控:去除XYM染色体上的SNP,计算SNP的分型成功率(callrate)=成功分型的样本例数/,去除SNPcallrate90%的样本。去除MAF小于0.01的SNP。去除LD检验不平衡的SNP。
3.Imputation,填补分型数据。填补之前需要进行数据校正(正负链校正,位置校正1),使用MACH或者IMPUTE2软件进行imputation。
4.使用METAL软件进行两组GWAS数据meta分析。
5.meta分析数据作图。绘制全基因组关联的曼哈顿图以及QQ图。
6.实验验证:根据meta分析的结果选择最有可能的SNP进行实验验证。
7.meta分析结果与验证数据的合并统计。
8.显著关联区域内SNPs独立性检验:利用Haploview进行LD分析。
分析流程:
Fig1.分析流程图
示例结果:
Fig2.GWAS初筛阶段人群分层
Fig3.meta分析统计结果Q-Q图
Fig4.meta分析后显著SNP位点分布曼哈顿图
Fig5.疾病易感区域SNP疾病关联性分析散点图
第38期全国循证医学Meta分析及网状Meta分析学习通知
北京班:/1/4-6(3号报到)北京金泰绿洲酒店
医药加循证医学Meta分析及网状Meta分析培训班已举办37期,全国两百多家高校、医院和科研机构学员纷纷派人参加,参加本班培训的很多老学员都已经发表了SCI论文,培训系统提高学员临床和科研创新能力。培训班始终坚持解决实际问题为导向,不断创新,追求卓越。培训主讲老师现为上海交通大学导师,有着多年从业经历和深厚的学术造诣。作为首个讲授R软件进行Meta分析和网状Meta分析课程的培训班,我们的培训取得了非常好的效果,深受学员的一致好评。
为了更好地提高学员创新能力,自年元月开始,本培训班特增加了贝叶斯网状Meta分析、系统综述和Meta分析新方法等课程。
学习班目的:通过系统性培训,全面提高学员的循证医学知识水平、培养学员临床科学思维素养;同时使学员掌握Meta分析方法,并具备使用常用软件进行Meta分析的能力。此外,还提升学员的临床科研能力与写作水平。
参加对象:临床医师、医药院校教师、研究生及相关研究人员,CRO公司
年度全国循证医学Meta分析及网状Meta分析培训课程安排表
近期医药加学习班安排如下,如需要报名,请加学习班秘书