• RNA-Seq 笔记 [4]


    ***********************该笔记为初学者笔记,仅供个人参考谨慎搬运代码******************************

    samtools 排序压缩和 featureCounts 生成基因计数表

    SAM文件和BAM文件

    1.SAM格式:是一种通用的比对格式,用来存储reads到参考序列的比对信息,以TAB为分割符文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。SAM分为两部分,注释信息比对结果部分。
    2.BAM格式:SAM的二进制文件,bam文件优点:bam文件为二进制文件,占用的磁盘空间比sam文本文件小;利用bam二进制文件的运算速度快。

    1. #排序压缩步骤
    2. conda info --envs
    3. conda activate py2env
    4. #下载subread
    5. conda install -c bioconda subread
    6. #测试是否成功
    7. featureCounts -h#成功
    8. cd /home/yinwen/biosoft/hisat2
    9. #压缩:把 sam文件 转为 bam文件
    10. samtools view -S genome.sam -b > genome.bam
    11. #排序:samtools sort
    12. samtools sort -n -@ 5 genome.bam -o genome
    13. #计数统计:
    14. featureCounts -T 5 -t exon -g Parent -a genome.gff -o genome.counts -p genome
    15. #samtools详情:http://www.360doc.com/content/23/0927/14/1098188476_1098188476.shtml

    genome.gff 就是最初下载的注释文件,如果要统计多个文件的话,在-p 后面跟上就可以,会生成 genome.countsgenome.counts.summary 两个文件,我们的DG文件也是成功得到如下:

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            

  • 相关阅读:
    搭建HBase分布式集群
    罗马数字转整数------题解报告
    Nginx 在 Linux 系统上安装 - 细节狂魔
    VF01销售开票发票金额控制增强
    SpringCloud微服务---Nacos配置中心
    java计算机毕业设计-人事管理系统-源码+数据库+系统+lw文档+mybatis+运行部署
    你真的了解CPU和GPU?
    语法基础(数组)
    ios自动化-Xcode、WebDriverAgent环境部署
    华清远见-html-js-jquery学习总结
  • 原文地址:https://blog.csdn.net/m0_56780122/article/details/136326058