上个月我们曾经学习过一篇细胞内PD-L1调控RNA稳定性的文章:TCGA正常血液样本中PD-L1与BRCA1和NBS1的表达量相关性(没找到原数据,但重复出了结果)(PS,目前为止我还是没能找到TCGA中"Blood Derived Normal"样本的RNA-seq数据 ╯︿╰ ),当时文中Fig4的测序数据还没有公开,现在GEO上已经可以下载了,不过作者只提供了处理好的excel表格数据和RNA-seq raw-data,对处理RNA-seq raw data感兴趣的欢迎点击“阅读原文”去B站学习Jimmy老师的视频,但是需要有linux服务器。
本周我们就系统性的学习一下本文的4张图(几乎全部结论)的画法吧!
A. 分别用PD-L1抗体或IgG进行RNA免疫共沉淀(RIP),热图展示DNA损伤相关基因的表达量
B. 分别用2种shRNA沉默PD-L1基因,热图同样为DNA损伤相关基因的表达量
C. 图A与图B的重叠基因及重叠的DNA损伤基因,也就是受PD-L1调控的RNAs
D. RIP-seq及RNA-seq重叠基因的GO富集分析
热图
GSE128613和GSE128742分别为RIP和RNA-seq数据,GEO网站上提供了xlsx格式的数据####RIPpeak-scorelibrary(readxl)RIPheatmap.png
韦恩图##PD-L1敲除后下调的基因与RIP-seq的重叠基因library("VennDiagram")VENN.LIST=list(RNA_seq=RNA_seq$`genename`,RIP=RIP$`Genename`)venn.plot
GO富集分析图
图中展示的是受PD-L1调控的基因的GO功能富集分析,也就是:与PD-L1抗体结合的基因和PD-L1敲除后下调的基因的交集。
GO富集分析的R包和网页工具很多,我习惯用clusterProfiler包,因为它提供了很多画图函数,比较方便。genes
因为用的方法不同,和原文中富集的terms有一定出入,但总体结果是类似,都在细胞代谢、转录、蛋白质修饰等途径中有富集。
作者是在Gene Ontology Consortium website上做的分析,而且文章的图看起来是作者手动选择了一些自己感兴趣的显著terms(所以要搞清楚自己课题的需求)#将需要的基因写入文件write.table(genes,file="./GO_genes.txt",quote=F,row.names=F,col.names=F)#将基因上传到/上,下载分析结果,读入R(记得删除文件最上面几行的注释)df_go
这张图看起来和文中的差不多了,虽然有些terms的p值顺序不大一致,但因为都是显著的,也不影响结论。
是不是很激动,自己的转录组数据马上就能用起来啦,如果你完全看不懂上面的图表和代码,那么你距离成文还差一个学习班!
r语言进行go富集分析_利用R语言绘制热图 韦恩图 GO富集分析图(有了转录组数据不知道该怎么写文章 看我就对了!)...