微生物组

软件

链接

简介(中文)

QIIME

http://qiime.org/

用于比较和分析微生物群落的软件,主要分析高通量扩增子测序数据,但也支持其他类型的数据。

mothur

http://www.mothur.org/

用于描述和比较微生物群落的开源软件。

Metastats

http://metastats.cbcb.umd.edu/

使用Fisher检验和FDR比较复杂环境下两组样品显著差异的因素。

picrust2

https://github.com/picrust/picrust2

PICRUSt2 是一款基于16S rRNA基因测序功能丰度的软件

LEfSe

http://huttenhower.sph.harvard.edu/galaxy/

能够通过等级比较,生物一致性检测和效应量评估,发现宏基因组的生物标识。能够发现解释两个及以上微生物群落差异的物种,基因,通路,这些可能是研究宏基因组的中心问题。

usearch

http://www.drive5.com/usearch/

Usearch是常用的扩增子分析软件,其聚类方法是目前主流的聚类方法。

RDP_Classifier

http://sourceforge.net/projects/rdp-classifier/

RDP分类软件能够对16S rRNALSU基因进行分类。目前16SrRNA分类模型来自新的高阶系统分类学。

Krona

http://sourceforge.net/p/krona/home/krona/

能够用可缩放的饼图绘制分层数据。

GraPhlAn

https://bitbucket.org/nsegata/graphlan/wiki/Home

GraPhlAn能够生成高质量的环形图代表分类和系统进化树,它主要集中在简明的,综合的,多信息的和能出版的系统进化和分类学研究。

SPAdes

http://cab.spbu.ru/software/spades/

SPAdes一般用于小基因组组装,其中有一个模块做宏基因组的组装,其中组装的准确度高,但消耗的资源大,效率低。

IDBA-UD

https://www.psc.edu/user-resources/software/idba-ud

IDBA-UD 组装非均匀覆盖度的宏基因组,速度快,但组装结果没有spades组装的长。但优于MEGAHIT

MEGAHIT

https://github.com/voutcn/megahit

MEGAHIT 是宏基因组组装的常用软件,其速度快,对内存要求低,效率高。

Bowtie2

http://bowtie-bio.sourceforge.net/bowtie2/index.shtml

Bowtie2 是将测序reads与长参考序列比对工具,主要用于去除宿主的DNA序列。

MetaGeneMark

http://exon.gatech.edu/meta_gmhmmp.cgi

MetaGeneMark是对宏基因组编码蛋白基因的预测。

CD-HIT

https://github.com/weizhongli/cdhit/releases

cd-hit 是用于蛋白质序列或核酸序列聚类的工具,根据序列的相似度对序列进行聚类以去除冗余的序列。

Virsorter

https://github.com/simroux/VirSorter

Virsorter 是病毒序列识别工具,可以识别宏基因组中的噬菌体序列

RepeatMasker

http://repeatmasker.org/

Repeatmasker是基因组重复序列检测工具,可以识别宏基因组中的重复序列,以及转座子

RGI

https://card.mcmaster.ca/analyze/rgi

RGI是专门根据CARD耐药基因数据库预测耐药基因的软件。

dbCAN2

http://bcb.unl.edu/dbCAN2/

dbCAN2是对蛋白基因进行碳水化合物(Cazy)预测的软件。

MetaPhlAn2

https://huttenhower.sph.harvard.edu/metaphlan

MetaPhlAn2是分析微生物群落(细菌、古菌、真核生物和病毒)组成的工具,它在宏基因组研究中非常有用。其原理是通过reads比对特征标记基因来确定物种及其丰度。

Kraken2

https://ccb.jhu.edu/software/kraken2/

Kraken2是超快速、高度准确的宏基因组DNA序列分类学分配程序,其原理是基于k-mers的精确对齐,与参考基因组比对进行注释。

蛋白代谢组

软件

链接

简介(中文)

MoMo

http://meme-suite.org/tools/momo

基于磷酸化蛋白质修饰位点上下游氨基酸残基序列,分析修饰位点Motif(包含目前使用广泛的Motif-X算法),新版的MeMe软件内含该分析模块

Interproscan

https://www.ebi.ac.uk/interpro/download/

https://github.com/ebi-pf-team/interproscan

基于InterPro数据库进行蛋白功能注释,包含了多个蛋白质结构域数据库内容(但不限于此),可以利用其中的pfam内容进行蛋白质结构域注释分析

NetworKIN

http://networkin.info/index_ht.shtml

蛋白质磷酸化激酶底物关系分析软件,目前包含大量人和酵母的磷酸化底物和激酶对应关系。

NetPhos-3.1

https://services.healthtech.dtu.dk/service.php?NetPhos-3.1

蛋白质磷酸化激酶底物关系分析软件,可以对真核蛋白进行限定的17种激酶进行激酶和底物关系预测。

eggNOG

http://eggnog5.embl.de/

直系同源蛋白簇数据库,软件可以通过已知蛋白对未知序列进行功能注释

Proteome Discoverer

https://www.thermofisher.com/cn/zh/home.html

https://thermo.flexnetoperations.com.

Thermo质谱蛋白质质谱数据定性和定量分析软件

Compound Discoverer

https://www.thermofisher.com/cn/zh/home.html

https://thermo.flexnetoperations.com.

Thermo质谱代谢质谱数据定性和定量分析软件

mzVault

https://mytracefinder.com/tag/mzvault/

代谢质谱库管理软件,可以借此进行代谢自建库,以及代谢相关mzVault库文件管理

SIMCA-P 16

https://umetrics.com/products/simca

代谢多元统计分析软件,主要进行PCAOPLSDAPermutation分析等等

Thermo Xcalibur

https://www.thermofisher.com/cn/zh/home.html

https://thermo.flexnetoperations.com.

Thermo质谱数据采集和解析软件,主要利用其浏览质谱原始谱图、TIC等信息

表观基因组

软件名称

链接

简介(中文)

MEME Suite

http://meme-suite.org/

MEME SuiteChIP-seq数据分析的一个常用工具包, 其中通过MEMEDREMEGLAM2模块扫描大量结合的DNA片段和蛋白质序列数据库主要用来发现转录因子的motif。 通过FIMO软件可以获得已知motif的潜在DNA结合位点。 TomTom算法能够将转录因子的基序(包括MEME发现的基序)与主流的基序数据库做扫描比较,并且可以进一步用motif-GO关联的工具GOMO来分析转录因子基序的基因本体。MEME的结果中包含基序的序列LOGOS,以及能够提交基序到基序数据库的接口。

MACS2

https://pypi.org/project/MACS2/

MACS2是一个最常用的peak calling工具,支持ChIP-seq、MeDIP-seq、ATAC-seq、CLIP-seq和RIP-seq等富集实验得到测序数据

ChIPseeker

https://github.com/GuangchuangYu/ChIPseeker

ChIPseeker是一个用于ChIP-seq数据注释分析的R包。它支持ChIP peak的注释和在染色体上以及TSS区域分布的可视化。

DiffBind

http://bioconductor.org/packages/release/bioc/html/DiffBind.html

多个ChIP-seq实验根据定量数据来计算差异结合位点也能够进行重叠分析和绘图

ChAMP

http://www.bioconductor.org/packages/release/bioc/html/ChAMP.html

针对illumina 450K850K甲基化芯片开发的一款R包,集成了数据预处理,甲基化位点的质控,过滤,此外还支持细胞类型矫正、批次矫正,也支持DMR分析。

IMA

http://ima.r-forge.r-project.org/

IMA为一款Illumina 450K甲基化芯片分析的R包,集成了数据预处理,甲基化位点的质控,过滤,支持甲基化位点和区域的分析。

GenomeStudio

https://www.illumina.com/techniques/microarrays/array-data-analysis-experimental-design/genomestudio.html

illumina官方提供,用户界面友好,操作方便。包含GenotypingGene ExpressionMethylation等模块,支持illuminaSNP芯片、表达芯片以及甲基化芯片的数据处理,及可视化。

转录组
通用软件

软件名称

链接

简介(中文)

DAVID

https://david.ncifcrf.gov/

DAVID收录了NCBIENSEMBLUNIGENEUniprotTAIRAgilentAffymetrix等多个数据库基因ID信息,支持基因ID的批量转换;同时收录GeneOntologyKEGG PATHWAYReactome等多个来源的基因功能注释数据,支持基因或蛋白列表进行功能注释和富集分析DAVID操作简便,可在线分析支持发表大量文献。

KOBAS3

http://kobas.cbi.pku.edu.cn/kobas3/

Kobas3由北京大学生物信息中心负责数据库的更新和维护,采用KEGG基因同源的概念,整合多个物种的多个gene2Pathway数据,一方面支持基于差异表达结果基因列表的富集分析,另一方面针对全部基因表达数据支持9种基因集富集分析方法(GSEA GSA PADOG PLAGE GAGE GLOBALTEST SAFEGANPA CEPA)。kobas3可进行在线分析,也支持本地安装运行。

GSEA

https://www.gsea-msigdb.org/gsea/index.jsp

GSEA是一个应用最早且最广泛的基因集富集分析工具,支持RNA芯片、RNA bulk测序以及单细胞转录组数据,以全部基因的表达谱作为输入,可避免差异基因筛选规则的人为干预,支持扰动类标签和扰动基因集两种策略。同时GSEAmsigdb也是一个收录了众多高可信度、经人工审核整理后的基因集数据库。支持linuxwindowsmacos多个平台的安装和运行。

GSVA

http://bioconductor.org/packages/release/bioc/html/GSVA.html

GSVA是一个R包,同时还实现了PLAGEssGSEA算法;GSVA计算每一个样本pathwayGeneSet的总体表达水平或表达活性,并基于此计算组间pathway水平的表达差异。

CYTOSCAPE

https://cytoscape.org/

Cytoscape一款开源的网络显示和分析软件,软件的核心部分提供了网络显示、布局、查询等方面的基本功能。Cytoscape还提供了大量的生物信息app插件, 用户可以在可视化的环境下将这些生物网络跟基因表达、基因型等各种分子状态信息整合在一起,还能将这些网络跟功能注释数据库链接在一起,此外还可以基于Cytoscape的插件进行代谢组学的分析。

Combat

https://www.bu.edu/jlab/wp-assets/ComBat/Abstract.html

Combat基于经验贝叶斯的分析方法,对高通量数据进行批次校正,也支持对其他混杂因素校正;支持RNA芯片、RNA测序以及单细胞转录组测序数据的批次矫正。

Limma

http://bioconductor.org/packages/release/bioc/html/limma.html

采用混合线性模型,基于经验贝叶斯的方法筛选组间差异表达的基因,也可以进行数量性状的关联分析,对于大样本数据还支持性别、年龄等因素的矫正。Limma可应用于RNA芯片、RNA测序以及DNA甲基化等差异分析;limma也是Agilent等表达芯片常用的数据预处理工具,支持芯片内和芯片间的数据标准化。

Pheatmap

https://cran.r-project.org/web/packages/pheatmap/index.html

一方面支持对转录组表达数据的行和列进行聚类,另一方面在聚类或热图展示时支持对样本表型数据的可视化。

Cluster

http://www.eisenlab.org/eisen/?page_id=42

支持对表达数据按行或按列进行预处理标准化,也支持数据进行log转化,同时支持对芯片中样品和探针进行各种形式的聚类

WGCNA

https://cran.r-project.org/web/packages/WGCNA/index.html

WGCNA采用一种软阈值的方式,当网络服从无尺度网络(真实的生物网络)时,得到共表达网络,挖掘共表达模块,计算与表型数据的关联,筛选特定表型相关的模块,并挖掘模块中重要的节点。

STEM

http://www.ncbi.nlm.nih.gov/pubmed/16597342

对具有时间节点的芯片实验进行分析的一种工具。包含了聚类,比较和可视化的功能,也提供了GO富集的功能

MeV

http://www.tm4.org/mev.html

综合分析:包括聚类,可视化,分类器,统计等等。

Vennt

http://drpowell.github.io/vennt/

对于比较得到的多组差异基因进行维恩图展示。

TFBSTools

http://bioconductor.org/packages/release/bioc/html/TFBSTools.html

可基于JASPAR数据库中公开的转录因子motif矩阵数据,对基因上游区域进行转录因子结合位点预测。

 

RNA芯片

软件名称

链接

简介(中文)

affy

http://www.bioconductor.org/packages/release/bioc/html/affy.html

这个R主要针对Affymetrix寡核苷酸表达芯片进行数据预处理,包含常用的masrma等标准化方法。

EC

https://www.thermofisher.com/cn/zh/home/life-science/microarray-analysis/microarray-analysis-instruments-software-services/microarray-analysis-software/affymetrix-expression-console-software.html

ThermoFisher官方提供针对Affymetirx系列表达芯片如表达芯片、miRNA表达芯片、以及外显子表达芯片提供数据预处理,质控,差异表达分析以及数据结果可视化的软件。

TAC

https://www.thermofisher.com/cn/zh/home/life-science/microarray-analysis/microarray-analysis-instruments-software-services/microarray-analysis-software/affymetrix-transcriptome-analysis-console-software.html

ThermoFisher官方提供针对Affymetirx系列表达芯片如表达芯片、miRNA表达芯片、以及外显子表达芯片提供数据预处理,质控,差异表达分析以及数据结果可视化的软件。此外TAC还支持外显子芯片的可变剪切分析。

SAM

http://statweb.stanford.edu/~tibs/SAM/

采用扰动类标签的思路,为一种改进型的t-test差异分析方法,目前主要应用于Affymetrix芯片进行探针差异表达显著性判断

Feature Extraction

https://www.agilent.com/cs/library/software/public/Agilent%20Feature%20Extraction_12_1_1_1.zip

Agilent官方提供Agilent RNA单通道或双通道表达芯片数据预处理软件。

Limma

http://bioconductor.org/packages/release/bioc/html/limma.html

limma也是Agilent表达芯片最常用的公开数据预处理工具,支持芯片内和芯片间的数据标准化;同时也是文献中芯片差异表达的应用最多的方法。

 

RNA测序

软件名称

链接

简介(中文)

Trinity

https://github.com/trinityrnaseq/trinityrnaseq/wiki

无参转录组测序常用的转录本组装软件。

hisat2

https://daehwankimlab.github.io/hisat2/

对于有参转录组HISAT2基本上已替代tophat,是一个快速和敏感的基因组比对软件。

StringTie

http://ccb.jhu.edu/software/stringtie/

StringTie是一个更快且高效的RNA-seq组装软件,除了评估已知基因的表达水平外,还可以发现一些新的转录本,为cufflinks组装软件的升级版本。

featureCounts

https://sourceforge.net/projects/subread/

featureCounts用于统计基因/转录本上mappingreads数,主要用于基因/转录本的定量。

edgeR

http://www.bioconductor.org/packages/release/bioc/html/edgeR.html

edgeR以基因水平、外显子水平、转录本水平的count值作为输入,软件内部对表达数据进行标准化,估计离散度,进行差异表达基因显著性评估。edgeR支持广义线性模型,进行差异分析时可以对一些混杂因素进行矫正。

DESeq2

http://www.bioconductor.org/packages/release/bioc/html/DESeq2.html

DESeq2count值作为表达数据的输入,进行TPM标准化,采用负二项分布进行差异基因显著性评估。

DESeq

http://www.bioconductor.org/packages/release/bioc/html/DESeq.html

DESeq同样采用负二项分布进行差异基因显著性评估,一般用于无生物学重复的比较分析。

Asprofile

http://ccb.jhu.edu/software/ASprofile/

使用ASprofile 软件对每个样品组装的转录本以及StringTie-merge合并的转录本分别进行可变剪接事件统计,该分析是通过两两比较组装得到的转录本之间差异,最终决定该基因是否存在可变剪接事件。

rMATS

http://rnaseq-mats.sourceforge.net/

rMATS软件对RNA-seq数据进行可变剪接分析,软件根据reads比对到不同转录本(是否包含选择性剪接的外显子)的比例来定义剪接位点的inclusion level,并用likelihood-ratio test检验不同组中生物学重复的平均inclusion level的差异显著性来判定差异可变剪接。

GATK

https://github.com/broadinstitute/gatk

RNA-seq数据常用的SNP calling软件,Sentieon软件为在GATK的基础上进行了加速优化的商业化版本软件。

SnpEff

https://pcingola.github.io/SnpEff/

SnpEff为一款常用的SNPInDel注释软件。

STAR-fusion

https://github.com/STAR-Fusion/STAR-Fusion/wiki

STAR-fusion为一款检测融合基因的软件,可基于fastq文件,也可以基于STAR的比对结果进行分析。

 

sRNA测序

软件名称

链接

简介(中文)

miRDeep2

https://github.com/rajewsky-lab/mirdeep2

对短reads的基因组mapping,并进行上下游延伸,判断前体序列是否具有miRNA的发卡结构,来发现新的microRNA。该软件以高准确度报道了七个动物代表性物种的已知miRNA和数百个novel miRNAmiRDdeep2耗时少,省内存,是一个miRNA识别的经典工具。 

miRanda

http://www.microrna.org/microrna/home.do

miRanda 是一种microRNA的靶基因预测算法。第一步,基于序列互补性和缺失进行打分,筛选大于阈值的high-scoring结果。第二步采用了RNAlib库中的折叠方法,该步生成了一个由序列,linker和参考基因组序列组成的保守的single-stranded RNA,用RNAlib折叠这一结构,计算最小自由能,筛选小于自由能阈值(-en)的作为靶基因。

TargetScan

http://www.targetscan.org/

TargetScan通过搜索比对到每一个miRNA seed区域的8mer,7mer,6mer位点进行miRNAs的靶基因预测;然后计算种子序列上下游的content score值;结合UTR序列的保守性进行靶基因预测;最后结合热力学稳定性筛选miRNA靶基因。

PITA

https://genie.weizmann.ac.il/pubs/mir07/mir07_data.html

PITA使用seed matching工具扫描3UTR预测潜在的microRNA靶基因。同时PITA也支持人、小鼠、果蝇和线虫4个物种的miRNA靶基因预测结果的下载。

TargetFinder

https://github.com/carringtonlab/TargetFinder

TargetFinder应用于植物的miRNA靶基因预测。植物中的miRNA与靶基因以近乎完美匹配的方式发挥作用。TargetFinder基于靶标罚分策略预测小RNA的靶标软件

 

lncRNA测序

软件名称

链接

简介(中文)

CNCI

https://github.com/www-bioinfo-org/CNCI

基于已知编码mRNA和已知的非编码lncRNA3碱基分布特征不同,提取序列的特征,构建SVM分类器,并基于此分类器预测新转录本的编码蛋白能力。CNCI主要应用于lncRNA的识别。

CPC

http://cpc.cbi.pku.edu.cn/

CPC基于blast比对,把未知转录本和已知蛋白库对比,从而筛选出编码和非编码的转录本。CPC可靠性很高,缺点就是运行速度慢,使用前需下载UniRef100数据库。

PfamScan

http://pfam.xfam.org/

基于Pfam数据库对转录本进行比对,比对不上的判定为lncRNA。一般取多个lncRNA预测软件结果的交集来提高新lncRNA识别的准确度。

 

circRNA测序

软件名称

链接

简介(中文)

find_circ

https://github.com/marvin-jens/find_circ

circRNA的鉴定常用工具之一;基本原理为识别反向剪切位点,此软件不依赖注释信息,运算资源消耗小,推荐使用bowtie2比对软件。

CIRCexplorer2

https://circexplorer2.readthedocs.io/en/latest/

circRNA的鉴定常用工具之一;此软件需要有注释信息,预测的准确度高,支持BWASTARTopHat2TopHat-Fusion多种的比对软件。

CIRI

https://sourceforge.net/projects/ciri/

circRNA的鉴定常用工具之一;此软件不依赖注释信息,缺点占用资源较大,推荐使用Bwa比对软件。

MapSplice2

http://www.netlab.uky.edu/p/bioinfo/MapSplice2

circRNA的鉴定常用工具之一;此软件需要有注释信息,预测的准确度高,推荐使用bowtie比对软件。

circRNA_finder

https://github.com/orzechoj/circRNA_finder

circRNA的鉴定常用工具之一;此软件不依赖注释信息,推荐使用STAR比对软件。

采用多个软件预测结果取交集,可显著提高circRNA预测的准确度。

基因组学

软件

链接

简介(中文)

OrthoMCL

http://orthomcl.org/common/downloads/software/v2.0

用于基因家族分析的软件,不仅能得到多个物种共有的直系同源基因, 还能够分别获得不同物种特有的基因家族

MUSCLE

http://petrov.stanford.edu/software/src/muscle3.6/muscle3.6.html

用于多序列比对,速度比较快

Gblocks

http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_documentation.html

可以从多序列比对结果中提取保守位点

ProtTest

http://www.mybiosoftware.com/prottest-3-0-beta-selection-best-fit-models-protein-evolution.html

生物信息学工具,用于选择最适合的氨基酸替换模型

RAxML

https://cme.h-its.org/exelixis/web/software/raxml/index.html

最大似然法(ML法)建树的经典软件,用于系统发育树的构建

PAML

http://abacus.gene.ucl.ac.uk/software/paml.html

一款利用最大似然法对DNA或蛋白质序列进行系统发育分析的软件包,其中的程序mcmctree可用于估计物种的分化时间,codemlyn00可进行选择压力分析等

CAFE

https://sourceforge.net/projects/cafehahnlab/

用于进行基因家族的扩张收缩分析

MCScanX

http://chibba.pgml.uga.edu/mcscan2/#tm

基因水平的共线性分析软件,用于检测物种内或物种间的共线性gene区块

SGSGeneLoss

http://www.appliedbioinformatics.com.au/index.php/SGSGeneLoss

用于PAV(Gene presence/absence variation)分析,在泛基因组分析中,PAV是一项重要的分析内容,基因的存在或缺失可能对物种的进化进程和个体或亚种特异性产生重要的影响

fastp

https://github.com/OpenGene/fastp

fastp是一款开源软件,可高效快速的对fq格式的原始测序数据进行质量控制,从而得到高质量的数据。

sentieon

https://www.sentieon.com/

sentieon是一款商业软件,可准确高效快速的进行数据分析,可以实现比对,变异检测等功能。

samtools

http://samtools.sourceforge.net/

samtools是一款开源软件,可以对sambam的比对结果进行一系列操作和处理,包括索引、排序、查看比对等。

annovar

https://doc-openbio.readthedocs.io/projects/annovar/en/latest/

annovar是一款开源软件,可高效的对变异结果进行多种注释,包括突变类型,对氨基酸的影响,基因组信息及各种数据库信息。

breakdancer

http://breakdancer.sourceforge.net/

breakdancer是一款开源软件,可用于基因组大片段结构变异检测,包括插入、缺失、倒位、染色体间易位、染色体内易位。

controlFREEC

http://boevalab.inf.ethz.ch/FREEC/

controlFREEC是一款开源软件,可用于检测拷贝数变异和等位基因杂合性缺失。

snpeff

https://pcingola.github.io/SnpEff/

snpeff是一款开源软件,可高效的对变异结果进行注释,预测突变类型,对氨基酸的影响以及对CNV区域内的基因信息进行注释。

circos

http://circos.ca/

circos是一款开源软件,可以使用环形图的方式整合所有的变异结果,对变异结果进行总体的可视化展示。

Fusionmap

http://www.arrayserver.com/wiki/index.php?title=FusionMap

Fusionmap是一款开源软件,可以进行融合基因检测,使用单端或双端的DNA测序数据检测基因组内的融合事件。

OncodriveCLUST

http://bg.upf.edu/group/projects/oncodrive-clust.php

OncodriveCLUST是一款开源软件,可以进行肿瘤驱动基因检测,通过影响基因功能的变异位点来预测潜在的肿瘤驱动基因。

MutSigCV

https://www.genepattern.org/modules/docs/MutSigCV

MutSigCV是一款开源软件,可以进行肿瘤高频突变基因检测,利用变异位点检测突变频率显著高于背景突变频率的基因。

GISTIC2

http://portals.broadinstitute.org/cgi-bin/cancer/publications/pub_paper.cgi?mode=view&paper_id=216&p=t

GISTIC2是一款开源软件,可以进行肿瘤高频CNV检测,利用肿瘤样本的体细胞CNV检测显著发生扩增或缺失的基因组区域。

ABSOLUTE

https://software.broadinstitute.org/cancer/cga/absolute

ABSOLUTE是一款开源的R包,可以利用体细胞突变和体细胞拷贝数变异对肿瘤样品的纯度和倍性进行检测。

SciClone

https://github.com/genome/sciclone

SciClone是一款开源的R包,可以利用体细胞突变和体细胞拷贝数变异对肿瘤样品的亚克隆结构进行检测。

Canopy

https://github.com/yuchaojiang/Canopy

Canopy是一款开源的R包,可以利用体细胞突变和体细胞拷贝数变异对肿瘤样本进行肿瘤系统发育分析。

shapeit

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html

shapeit是一款开源软件,可以利用基因型数据进行单体型预测。

impute2

https://mathgen.stats.ox.ac.uk/impute/impute_v2.html

impute2是一款开源软件,可以利用参考人群的数据对芯片或测序的分型数据进行基因型填充处理。

Longranger

https://support.10xgenomics.com/genome-exome/software/pipelines/latest/what-is-long-ranger

LongRanger是一款开源软件,专门用于处理10x genomics平台的DNA测序数据,用于检测SNV/INDEL和大片段的结构变异。

cellranger-dna

https://support.10xgenomics.com/single-cell-dna/software/pipelines/latest/what-is-cell-ranger-dna

cellranger-dna是一款开源软件,专门用于处理10x genomics平台的单细胞DNA测序数据,用于检测单细胞的拷贝数变异。

PLINK

https://www.cog-genomics.org/plink/1.9/

一款免费开源的全基因关联分析工具包。可以高效的完成一系列基本的大规模分析。PLINK主要聚焦基因型和表型的分析。

Haploview

http://www.broadinstitute.org/scientific-community/science/programs/medical-and-population-genetics/haploview/haploview

一款不限制数据大小的综合性的单体型分析工具

TASSEL

https://www.maizegenetics.net/tassel

以广义显性模型和混合线性模型的方法对群体结构和亲缘关系进行校正。还有如下一些额外功能:分析插入缺失、计算多样性指标、整合表型和基因型数据、填补缺失数据及计算主成分。

PennCNV

http://penncnv.openbioinformatics.org/en/latest/

一款基于SNP芯片的拷贝数变异检测工具

Admixture

https://genome.cshlp.org/content/early/2009/07/31/gr.094052.109

一款基于多位点SNP基因型数据,使用最大似然估计进行个体祖先关系估计的软件

GTC

https://www.thermofisher.com/cn/zh/home/life-science/microarray-analysis/microarray-analysis-instruments-software-services/microarray-analysis-software/affymetrix-genechip-command-console-software.html

整合了SNP分型、拷贝数分析、稀有拷贝数变异鉴定和细胞遗传学分析的软件

GenomeStudio

http://www.illumina.com/applications/microarrays/microarray-software/genomestudio.html

可视化和分析Illumina 芯片平台的数据。它提供芯片数据的初步分析,其性能优化的工具和用户友好的界面可帮助你快速简单的将数据转换为有意义的结果

Merlin

http://csg.sph.umich.edu/abecasis/Merlin/

基于家系数据中的高密度遗传图,针对如共享等位基因、构建单体型等常见问题提供快速解决方案的一种方法

GACD

http://www.isbreeding.net/software/?type=detail&id=16

用于遗传图构建,QTL定位分析的软件。支持F1群体和双交群体群体。还可以进行marker binning

QTL ICIMapping

http://www.isbreeding.net/software/?type=detail&id=28

用于遗传图构建,QTL定位分析的软件。支持F2BCDHRIL等群体。还可以进行marker binning和多生境因子表型的方差分析

Carthagene

https://www.inrae.fr/bia/T/CarthaGene

用于构建遗传图

Joinmap

https://www.kyazma.nl/index.php/JoinMap/

用于构建遗传图

Lepmap

https://sourceforge.net/p/lep-map3/

遗传图构建软件,可以处理百万级的标记量和上千的样本量

Mapchart

https://www.wur.nl/en/show/Mapchart.htm

用于遗传图和QTL定位分析结果的可视化

phylip

https://evolution.genetics.washington.edu/phylip.html

用于进化树分析,适用于多种计算机系统,可以得到Newick格式的进化树文件

AgilentCytogenomics

https://www.agilent.com/en/download-agilent-cytogenomics-software?productURL=https%3A%2F%2Fwww.agilent.com%2Fzh-cn%2Fproduct%2Fcgh-cgh-snp-microarray-platform%2Fcgh-cgh-snp-microarray-software%2Fcytogenomics-software-228500

Agilent CytoGenomics 软件为细胞遗传学家提供了先进的数据分析工具。该系统具有从数据上传到最终报告的简化工作流程,能够处理体质性和血癌样品的 CGH  CGH+SNP 数据

HaploPainter

http://haplopainter.sourceforge.net/

用于图形化展示复杂家系的单体型