Quantcast
Channel: 知乎日报
Viewing all articles
Browse latest Browse all 20608

最近十年,遗传学(包括基因组学)有哪些实质性的突破?

$
0
0

日报标题:十年过去了,离「生命编辑」这个宏大梦想越来越近

知乎用户,Biosciences, Junior@USTC

呼,借此机会回顾一下最近看的和做的一些东西。

这十年 Genomics 的主要变化就是定量化和可编辑,这段时间基因组学的主要任务有以下三种是对基因组进行功能性的注释 (Functional annotation)、理解表观遗传修饰 (Epigenetic modification) 在基因组中的作用以及大量的基于高通量测序技术的相关表征技术的出现。这三个部分充分融合生命科学和生物技术,联系紧密,使得我们可以看到一个多层次的高分辨率的基因组 (multi-layer genome in high resolution, 好吧,我自己定义的 2333)

基因组的功能性注释

关于这个话题,我在将「垃圾 DNA」(非编码 DNA)全部去掉对生物体会有什么影响?中有很详细的阐述,并列举了许多常见的前期没有注释完全的未知基因组成分。这一领域的突破非常的迅速,当然也要归功于 ENCODE 计划的持续推进。

这里再简单说一下,基因组除了蛋白质编码成分以外的其他成分功能不明确,因而需要开展更为详细的研究,其中非编码 RNA (non-coding RNA, ncRNA) 和顺式调控原件 (cis element,例如增强子) 等都是近期研究的热门。除了发现这些元件在基因组的物理位置以外,更多的功能性研究还在持续深入。

例如,前几天对一个著名的 Xist ncRNA 的功能性深入研究的论文发表在 Cell 上,这篇文章开发了一种高通量 RNA 双链寻找的实验技术 (PARIS,psoralen analysis of RNA interactions and structures),并用它对 Xist 的 A-Repeat 等 RNA 课题进行了详尽的研究。

详见:Lu et al., RNA Duplex Map in Living Cells Reveals Higher-Order Transcriptome Structure, Cell (2016), http:// http://dx.doi.org/10.1016/j.cell.2016.04.028

而顺式作用元件也充满了未解之谜,关于增强子 (Enhancer),之前人们认为还存在超级增强子 (super-enhancer)这样的亚型存在,此外今年初,研究人员还发现了一种在干细胞中存在的短暂作用的增强子 (Temp-enhancer),这一方面的研究还在继续,尚未定论。但是可以知道的是,基因组中的顺式作用元件的功能还有多很多秘密在其中,而且很多顺式作用元件是染色质高级结构的作用点,因而会参与更高层面的基因修饰和调控作用,这都是令人兴奋的发现!

详见:A new class of temporarily phenotypic enhancers identified by CRISPR/Cas9-mediated genetic screening

这些新发现都源于技术进步,在后面我们还会详细说一下这方面的技术突破。

多个层次的表观遗传修饰

当然了,我们测序看到了一堆 ATCG 的数据,但是在现实情况下,他们都是化学物质——既然是化学物质,和外界环境的相互作用就是不可避免的。在这一段时间内,我简单总结有三个层次的基因组序列不变却导致表观遗传修饰改变的现象发生,包括:DNA 层面的表观遗传修饰、组蛋白层面的表观遗传修饰和染色质的三维拓扑结构。

1) DNA 层面的表观遗传修饰:当然了,主要分为两类过程,一是全基因组层面的甲基化谱的绘制和分析,帮助我们了解其与基因表达的关系,在 2009 年,单个碱基分辨率尺度的人类的 DNA 甲基化组绘制完成。

详见:http://www.nature.com/nature/journal/v462/n7271/full/nature08514.html

二是,除了甲基化以外的更多的 DNA 修饰成分也被发现,2009 年 Cytosine 的羟甲基化在哺乳动物中被发现,随即开始了 DNA 层面表观遗传修饰代谢过程的研究。同时,研究人员还开发了新的技术用于绘制这些新的化学修饰位点(后面还会讲到)

详见:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3263819/

这一方面了解不多,大致说到这里

2) 组蛋白层面的表观遗传修饰:这里主要想说的是组蛋白层面的表观遗传修饰和顺式调控元件之间的关系。2007 年,科学家利用 ChIP-Chip 的方法确认了两种类型的 Histone Marker 分别于启动子、增强子具有相关性,其中 H3K4me 和增强子信号相关、H3K27me3 和启动子信号相关,这一研究在今年用超高分辨率荧光显微成像技术得到了验证。Super-enhancer 的 Histone Marker 也有被发现。

2007 年文章详见:http://www.ncbi.nlm.nih.gov/pubmed/17277777

2016 年文章详见:http://www.nature.com/nature/journal/v529/n7586/full/nature16496.html

组蛋白层面还有很多新的发现,例如在 H1 发现和 DNA 修复相关、组蛋白突变与癌症相关都是最近新的重要发现。

Nature 揭示第 5 类组蛋白的功能

Science:组蛋白单点突变可导致罕见儿童癌症

3) 染色质三维拓扑结构:

一个 TAD 大致的物理样貌,通过 CTCF-Cohesin 组成的 TAD,以及 ChIP-Seq 和 ChIA-PET 的数据表列为背景,图片来自网络,侵删

这是这一段时间非常热门的方向。以往人们都看到的是人类染色体在分裂中期的样貌,但是真正在转录过程中多数处于间期的状态,其中的三维结构对基因的表达调控影响非常重要,这一领域一直被人忽视,大概 2003 年起,研究人员首次开发出了基于分子生物学手段的染色质相互作用捕获技术 (Chromatin conformation capture, 3C) 之后,这一个领域逐渐受到大家重视。

基于 3C 的技术在这段时间有着很快的发展,后面有了 4C、5C 直到最后的 Hi-C(全基因组的染色体相互作用捕获技术),人们可以利用高通量测序技术捕获染色质的三维结构。至此可以得到大量此前不可得知的信息,弥补显微镜障碍一直以来带来的困扰。

利用 Hi-C 对细胞进行染色质三维构象的分析得出了一些基本的事实:染色质三维构象在生物体内是基本保守的,随着年龄的变化也不会发生很大的变化;我们可以将染色质分为 Compartment A 和 B,发现恰好与转录激活和转录沉默相关联(类似于更为粗略的常染色质、异染色质的分类方法);最重要的一点在于,2012 年发现的其中存在一些很稳定的拓扑相关结构域 (Topologically associated domain,TAD),研究发现在 TAD 中的转录一致性相当高,这一领域瞬间爆炸。人们开始利用 Hi-C 陆续绘制细菌的、酵母的、哺乳动物、人类各种细胞株系、细胞分裂期的、人类不同发育阶段细胞的染色体三维构象,探索 TAD 在其中的变化。

关于 TAD 的发现:Topological domains in mammalian genomes identified by analysis of chromatin interactions : Nature : Nature Publishing Group

http://www.nature.com/nature/journal/v485/n7398/full/nature11049.html

两篇文章同期发表

这两年 TAD 的研究越来越令人兴奋,并且有更多发现出炉:

今年 4 月份的研究发现,TAD 演化的复杂性和 TAD 所调控的 Hox 在动物肢体发育的精细化程度中的作用得以发现。

详见:http://www.ncbi.nlm.nih.gov/pubmed/26829752

去年年底,一篇 Cell 的文章惊人的发现,TAD 失活导致增强子作用异常进而导致了多指症等三种与手指发育异常相关的遗传病,研究人员在小鼠中利用 CRISPR/Cas9 对 TAD 进行了类似的处理,并验证了小鼠确实发育出异常手指的事实。这是令人兴奋不已的成果。

详见:http://www.ncbi.nlm.nih.gov/pubmed/25959774

这两年研究也发现 TAD 的失活与肿瘤密切相关,两个组相继发现神经胶质瘤和白血病患者中出现 TAD 的失活导致原癌基因表达异常等其他分子机制,进而对肿瘤做出贡献。

详见:http://www.nature.com/nature/journal/v529/n7584/full/nature16490.html

http://science.sciencemag.org/content/early/2016/03/02/science.aad9024

生物信息学研究也发现更多肿瘤的 TAD 异常导致原癌基因的过度表达,进而对癌症发生产生了影响。CTCF 结合位点的高度突变率是导致 TAD 失活的主要原因,现在暂时不清楚为什么突变会集中于此。

基于高通量测序技术的生物技术发展

基于高通量测序技术的生物技术突破是发现前面的新结果的重要原因,目前看来有三类主要的技术发展:第二代测序技术 (Next Generation Sequencing, NGS)、第二代合成技术 (Next Generation Synthesis) 和基因编辑 (Gene Editing) 技术。其中合成技术暂时还没有广泛应用起来,但是可以看到未来将会非常的实用。

基于 NGS 人们开发出了许多方法用于检测基因组的甲基化图谱 (Bisulphite-Seq)、羟甲基化图谱 (TAB-Seq)、各种组蛋白修饰位点 (ChIP-Seq)、PolII 等蛋白质结合位点 (ChIP-Seq)、某种蛋白结合染色质的位点分析 (ChIA-PET)、转录读本数 (RNA-Seq, GRO-Seq)、染色体三维构象 (Hi-C)、ncRNA 作用位点 (ChIRP-Seq)、RNA 双链捕获技术 (PARIS)、核纤层结合位点捕获技术、小分子药物在染色质上的分布 (Chem-Seq) 等等方法,主要的思想都是通过交联固定相互作用位点、利用酶切或者是超声破碎等方法把整体打断、再用酶连连接、加上适配体 DNA 开展高通量测序,最后得到测序读本之后进行定量的分析。

引用自:3C-based methods : Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data : Nature Reviews Genetics : Nature Publishing Group 侵删

合成技术的发展主要是体现在今年 4 月人造最小基因组生物的论文中,但是暂时还没有广泛应用起来,如果能够实现高通量的高保真合成,将来生命科学可编辑的程度将会大幅增强。

详见:http://science.sciencemag.org/content/351/6280/aad6253

关于基因编辑,现在主要是基于 CRISPR-Cas9 的一系列的方法,包括基于这个系统的剪切、修复,把 Cas9 突变沉默成 dCas9 之后,融合 GFP 进行活细胞定位、融合 TF 促进转录 (CRISPR-On)、融合沉默转录蛋白抑制转录活性 (CRISPRi),融合 Cytosine 去氨基酶进行单碱基的基因编辑等等。大量的创业公司基于 Cas9 展开,专利大战如火如荼。前几天,河北科技大学的韩春雨教授开发的 ssDNA-guided genome editing(DNA 引导的基因编辑)让生物界又一次沸腾,他开创了另外一条思路走基因编辑之路,新的技术优缺点都很明显,但是可以知道的是改造 Argonaute 的主动权会向中国倾斜一点点。这一领域竞争非常的激烈。

总体来说,遗传学感觉不再叫遗传学了,还是叫分子生物学好一些,因为不仅仅是简单的遗传过程了,人为改造的成分可以越来越多,将会更多。人们理解基因组现在越来越深入、而且是从 ENCODE 就可以看出是多个层面的理解,所以叫做 Multi-layer genome in high resolution。

大家还得继续加油~

(本人比较懒,reference 不想再在最后列了,大家感兴趣可以私信我~文中用的图片来自网络,侵删)


Viewing all articles
Browse latest Browse all 20608

Trending Articles