1. cellranger-atac 输入测序文件命名规则参考cellranger 分析数据命名规则,两者一致。
cellranger 分析数据命名规则_韩建刚(CAAS-UCD)的博客-CSDN博客
一个样本名文件夹包含所有该样本的测序数据,单个lane或多个lane,多个样本名文件夹放在同一个文件夹下。如下:是两个lane对同一样本的测序数据,放在同一个以样本名为前缀的文件夹下,R1,R2,R3,I1分别代表read 1,barcode,read 2 和 sample index。这些分别代表什么可以详细的阅读10X ATAC文库构建流程。
tree 58A_samplename_A58A_samplename_A/├── 58A_samplename_A_S2_L001_I1_001.fastq.gz├── 58A_samplename_A_S2_L001_R1_001.fastq.gz├── 58A_samplename_A_S2_L001_R2_001.fastq.gz├── 58A_samplename_A_S2_L001_R3_001.fastq.gz├── 58A_samplename_A_S5_L001_I1_001.fastq.gz├── 58A_samplename_A_S5_L001_R1_001.fastq.gz├── 58A_samplename_A_S5_L001_R2_001.fastq.gz└── 58A_samplename_A_S5_L001_R3_001.fastq.gz0 directories, 8 files
2. 几个重要参数
--id=ID# 输出文件名--reference=PATH # 参考基因组文件夹路径--fastqs # 测序数据文件路径--sample # 指定要分析的样品
3. 将ATAC数据比对到参考基因组,依据数据量大小,运行时间不等,25G数据量运行了24h左右,如果运行速度慢,时间会更长
cellranger-atac count --id=output_name \--reference=/path/to/reference/folder \--fastqs=/path/to/seq_data/folder \--sample=mysample \--localcores=8 \--localmem=64
4. 输出文件,主要结果保存在outs中,输出文件内容在下一篇博客