700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 【Nature子刊】大数据精细定位 确定191个乳腺癌的靶基因!

【Nature子刊】大数据精细定位 确定191个乳腺癌的靶基因!

时间:2021-04-13 00:39:57

相关推荐

【Nature子刊】大数据精细定位 确定191个乳腺癌的靶基因!

作者:Walter

导 读:乳腺癌是危害女性健康的头号恶性肿瘤,其发病率高、病因不明、早期症状不清。,多项研究通过已全基因组关联分析(GWAS)寻找到150个乳腺癌相关的基因易感区段,但由于随机采样导致的抽样误差以及单核酸多态分子(SNP)之间复杂的连锁不平衡,GWAS定位到通常只是致病位点的相关区域,其结果具有一定复杂性和不准确性。

基于以上研究,剑桥大学的Alison Dunning课题组1月8日于Nature Genetics发表工作,分析了乳腺癌组织联合会(BCAC)中217,000多名受试者的基因组数据,通过精细定位技术(fine-mapping)在原先发现的150个易感基因区段中准确定义了191个风险基因,为临床癌症风险评估提供可靠依据,同时为乳腺癌发生机制的研究指明新的方向!

首先,研究者对样本进行基因分型,并使用多项式逻辑回归来识别每个易感区段中独立的乳腺癌关联信号,在每个信号中定义可信的因果变异(CCV)。通过联合关联分析与计算机基因组特征注释,结合贝叶斯方法和PAINTOR,研究者定义了205个具有可信因果变体的独立风险相关信号,并依据基因表达,染色质相互作用和功能注释将其进行排序。

研究流程总结图

在确定每个信号中潜在的因果变异后,研究者希望揭示其靶基因以及在DNA水平上的功能。其中,研究者发现与雌激素受体(ER)阳性乳腺癌的特征变异,标记在ER阳性细胞上的开放活跃的基因调控区域,很大一部分与转录因子蛋白和调节因子的结合位点重叠。

另外,研究者还发现9种与ER阳性乳腺癌相关的重要靶基因编码蛋白质,这些蛋白产物在雌激素信号传导中发挥重要作用:CREBBP, EP300, ESR1, FOXI1, GATA3, MEF2B, MYC, NRIP1 和TCF7L2,其中CREBBP,EP300,ESR1,GATA3和MYC已被证明是癌症的驱动基因。

与ER阳性信号相反,研究者发现的ER阴性信号的基因组特征较少(这受限于样本数较少和可用的ChIP-Seq数据),但这同时也提示两种乳腺癌的发展具有共同分子机制。据此,研究者确定了35个ER阴性乳腺癌的靶基因,其中,CASP8和MDM4已有相关的功能研究。

通过表型和显著通路预测靶基因

最后,研究者们通过分析基因的分子功能、细胞组分和参与的生物学过程这样一个“基因本体论(GO)”途径来发现新的靶基因。值得注意的是,14%的靶基因与免疫系统途径有关,在ER阴性的乳腺癌相关基因中这个比例达到19%,尤其是涉及T细胞活化、白细胞介素信号传导、Toll样受体级联反应和I-κB激酶/NF-κB信号传导等介导先天免疫系统活化和以及的过程。

这项研究通过精确定位技术,明确乳腺癌风险信号对应的基因突变,并定义了这些变异的靶基因。尽管大多数靶基因所对应的下游通路机制基础尚不清晰,但这对现有相关通路研究的方向作扩充和延伸,为乳腺癌易感性和发病机制等生物学研究奠定基础,并为临床作乳腺癌风险筛查提供强有力的证据!

参考文献:

Laura Fachal. Fine-mapping of 150 breast cancer risk regions identifies 191 likely target genes. Nature Genetics. 08 Jan, .

Michailidou, K. et al. Association analysis identifies 65 new breast cancer risk loci. Nature, .

要点预览

全国TCGA,GEO生信高通量数据挖掘专题学习班

深圳班:2月21-23(20号报到)

清华大学深圳国际研究生院

培训简介

度国家自然基金医学科学部共批资助10138项目,批助金额总计441310万元。其中面上项目数量占45%,金额占57%;青年科学基金项目数量占43%,金额占20%。

初步统计,这些项目中大部分都与编码基因有直接或间接的关联。其中,与通路(pathway)关联的有1349项,金额4.89亿;与miRNA相关的有630项,金额2.3亿;与lncRNA相关的有395项,金额1.45亿;

如何获得有创新意义的疾病靶标基因(mRNA,Protein,lncRNA,circRNA,miRNA,Mutation等)是项目申请及文章写作时最常见的问题。基于这个目的,我们开展了该培训班:TCGA&GEO高通量数据挖掘。

癌症是临床医学中非常重要的疾病方向。TCGA数据库中包含了常见了40种癌症方向(含30000个样本)的高通量数据及临床信息。大家对TCGA数据库的使用近几年也在逐渐增加!另外,其他疾病的研究可以通过GEO数据库进行。

项目类型

题目

金额/万元

重点项目

FXYD3介导的信号网络对肠道黏膜免疫稳态的调控研究

300

重点项目

基于蛋白-蛋白相互作用精准调节转录因子Nrf2活性及探索其作为肝细胞癌治疗的新靶标

298

重点项目

miR-23b/24-1簇防治烧伤后脓毒症所致MODS的系统研究

297

面上项目

LZTR1基因突变导致的RAS/MAPK通路过度激活以及Noonan综合征相关肥厚型心肌病的机制研究

60

面上项目

SUGP2基因及其突变在遗传性血色病中的致病作用及其机制研究

60

面上项目

WDR73基因突变在Galloway-Mowat综合征中的致病机制研究

60

面上项目

STAG2通过ERK/AKT/GSK3β/c-Myc反馈通路调节甲状腺癌谷氨酰胺代谢的机制研究

60

面上项目

LncRNA FOXF1靶向调控动力相关蛋白1表达在缺氧诱发肺动脉内皮细胞焦亡中的作用及分子机制

55

培训预期:

通过三天的学习,我们了解生信分析思路对项目及文章的帮助,以及实操常见的数据库、在线工具和本地软件。使得学员可以自己完成一个完整的分析报告并获得疾病相关的靶标基因。

讲师简介

宋伟博士

研究成果:参与完成了近百篇软件著作权和发明专利的撰写和申请;肺癌、胰腺癌、骨肉瘤、胃癌等数据库的分析和构建;完成个体基因检测流程和无创唐筛流程的开发。

研究方向:有近十年的生信分析经验,擅长方向有转录组测序分析、芯片数据分析、疾病机理研究分析、疾病预后与基因关联分析、项目分析思路设计以及个性化分析等,精通perl、R等编程语言。

培训经历:在上海、沈阳、济南、武汉等城市举办过十几场培训班。培训的对象有:医生、学生、科研工作者、生信爱好者等。

培训方向:《测序与芯片数据分析》、《生物信息学的魅力》、《生信文章实例解读》、《生信与实验的密切关系》、《生信与临床医学的关系》、《生信实用工具培训》、《多组学整合分析流程》、《R语言培训》等

课程安排

分析示例图

示例图 通路富集分析结果图

示例图 聚类热图分析

示例图 蛋白互作网络图

示例图 pathway map图

示例图 关键基因的KM生存曲线图

示例图 柱状图与venn图

示例图 GSEA富集分析

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。