


全基因组定序(Whole genome sequencing,WGS)是将一个生物的基因组完整(或接近完整)定序的流程。1990年代起陆续有生物的基因组被完整定序,最早被定序完成的生物为流感嗜血杆菌(1995年),1996年首次有真核生物酿酒酵母)被完整定序。2014年以后全基因组定序逐渐开始被用于临床用途[2][3][4],以病人基因组资讯决定其疗法,即个人化医疗[5]。2000年全基因体定序技术获《科学》期刊选为该年的年度突破英语Breakthrough of the Year[6]



1977年,弗雷德里克·桑格的团队将ΦX174噬菌体英语Phi X 174的基因组完整定序,长5368bp,是第一个被完整定序的基因组[7][8][9]。1990年代起测序技术逐渐成熟,开始被用于定序生物的完整基因组[10]。第一个被完整定序的生物为流感嗜血杆菌,共长183万bp,于1995年由霰弹枪定序法完成[11],随后有其他细菌古菌的基因组陆续被以相同方法定序。真核生物的基因组大小则大的多,因此定序较为困难,1996年酿酒酵母的基因组定序完成,约长1200万bp,为第一个被完整定序的真核生物[12];1998年秀丽隐杆线虫的基因组被完整定序,为第一个完成定序的多细胞真核生物[13]。真核生物定序的方式除使用霰弹枪定序法外,还用到了细菌人工染色体(BAC)、酵母菌人工染色体(YAC)等基因文库[14]

1999年人类22号染色体(最短的体染色体)被定序发表[15];2000年黑腹果蝇的基因组被完整定序,为第二种被完整定序的动物[16],同年阿拉伯芥的基因组定序也告完成,是第一个被完整定序的植物[17]。2001年人类基因组计划发表人类基因组的定序草图(draft)[18],2003年宣告真染色质的序列皆定序完成[19][20],2021年发表定序程度达“完整”的基因组[21][22];2002年小鼠的基因组也被定序发表[23]。目前已有上千种生物的基因组被完整定序。2005年起桑格测序等传统的定序方法逐渐被Illumina染料定序英语Illumina dye sequencing焦磷酸测序SMRT定序英语Single-molecule real-time sequencing奈米孔洞测序次世代定序英语Massive parallel sequencing(NGS)技术取代(但仍使用霰弹枪定序法的策略,将基因组打碎成许多片段后分别完成定序,再进行组装)。[24][25]



已有许多公司尝试将全基因组定序商业化以作研究或临床用途[26],包括Illumina[27]Knome英语Knome[28]Sequenom英语Sequenom[29]454生物科学[30]Pacific Biosciences英语Pacific Biosciences[31]Complete Genomics英语Complete Genomics[32]Helicos Biosciences英语Helicos Biosciences[33]GE Global Research英语GE Global Research通用电气的研发部门)、Affymetrix英语AffymetrixIBM、Intelligent Bio-Systems[34]、Life Technologies、Oxford Nanopore Technologies英语Oxford Nanopore Technologies[35]华大基因[36][37][38]。2010年代晚期全基因组定序一次约要价1000美元,许多公司正试图将成本进一步降低[39],2017年华大基因的全基因组定序收费已降为一人600美元[40],2019年Veritas Genetics英语Veritas Genetics也将费用降至一人599美元[41]


全基因组关联分析(GWAS)的结果(曼哈顿图英语Manhattan plot)示意图




人类全基因组定序可能伴随一些伦理议题,此技术虽有诊断出疾病的潜力[45],但也有造成基因歧视英语Genetic discrimination、隐私外泄(特别是未成年人的隐私[46])与心理上负面影响之风险[47]。另外当一个人接受全基因组定序时,除了自己基因组的资讯外,还可能得知其近亲的基因组资讯,进而推得他们过去、现在或未来的健康状况[48],因此接受定序者是否应与近亲分享定序的结果也是一伦理议题,若其带有一与某疾病相关的突变,却不愿与近亲分享此资讯,则医疗人员可能面临预防医疗与病人隐私的两难[45]。科学研究中的全基因组定序也可能有隐私外泄的疑虑,因学术研究发表时通常需要将病人的基因型的资讯发表到公开资料库,此资讯虽为匿名,但在疾病或突变相当罕见的情况下仍有可能使病人被认出[45]


最早被全基因组定序完成的人是克莱格·凡特[49][50][51]詹姆斯·杜威·沃森[52][53][54],于2007年完成(覆盖度英语Coverage (genetics)分别为7.5与7.4),2008年又有一名匿名的中国汉族人(覆盖度为36)[55]奈及利亚约鲁巴人(覆盖度为30)[56]、荷兰的女性遗传学家玛乔琳·克里克(为首位基因组被完整定序的女性,覆盖度7至8)[57][58]与一高加索人种白血病女性患者基因组被定序完成[59]史蒂夫·贾伯斯为最早被全基因组定序的20人之一,有消息指其花费高达10万美元[60]。截至2012年6月共有69个人接近完整的基因组序列资料向大众公开[61]。2013年11月有一西班牙家庭在接受23andMe与华大基因定序后,将全家的全基因组序列以创用CC公有领域授权条款公开,是第一个公开的家族全基因组序列资料[62]



