这篇文章花了好几年,终于在PNAS发出来了。是PNAS哦~-_>- PNAS发文章分为三类,具体请大家自己从网上搜索。这篇文章是(美国国家科学院)院士自己挂名的文章。 其中reviewer都是老朋友,一位是给天皇儿子当老师的Takashi Gojobori,另一位是jianzhi zhang。 可以说这篇文章是那位院士用掉了自己4篇文章的一个名额,送到PNAS的。

当时结果出来的时后据说投哪都被拒,每每在不同机构讲这个工作汇报(不知怎的,可能是时间原因,我一次都没听过),Wu老师总是有点忿忿不平,感觉太前沿的东西,大家都不相信。

但时到今日,我看了整篇文章后,感觉这工作被拒很正常,数据量、计算和实验方法来支持这个结论有些勉强。

另外,我的tags取得比较纠结,整篇工作没抓住什么重点。

下面简单介绍一下具体的内容。

首先在Introduction中介绍了达尔文理论,肿瘤内部对新突变是有选择的。选择会在群体层面减少突变异质性,达尔文演化模型多被用于描述在coding区域的总体突变情况。 但是这个理论从未在实际定量的角度被证实过。一般研究中常用肿瘤中总体的编码区域的突变数量\(M_{ALL}\)来描述达尔文演化理论。

“后现代观点”中,自然群体中的遗传多样性同非达尔文模型很大程度上一致。

本中从一块肝癌组织上获得286个小样本,就是一个圆形的区域,分成四个象限,每块小组织是直径位0.5mm高度位1mm的圆锥体。每个小样本估计含有20000个细胞。 这些样本中只有23个样本做了测序,其中12个样本在区域的外围,11个样本在内部靠中间的地方。 在编码区域和剪接位点,一共发现了269个SNV。其中在多个样本中出现的SNV可以说是进行了样本交叉验证,算可靠的。对于只在一个样本中出现的SNV,需要sequenom genotyping或者sanger sequencing检测。 检测结果表明这些也都是可靠出现的SNV。本文在研究中不考虑假阳性问题,认为只要是测序或者质谱或者sanger测出的SNV就是真的SNV,所以没有假阳的数据,而假阴性问题由于样本数量大,所以可忽略不计。 本文也研究了CNA,平均每个样本中检测到23.6个CNA,分布在14个染色体。由于CNA的产生机理比SNV要复杂,并且不好用实验来检测,所以后面只研究SNV的变化。

然后文中,将somatic mutation分成两类,一类是固定(fixed)的somatic mutation,这些mutation的特点是在所有的癌症样本中都出现,但是在正常的样本中不出现。 多样性动态(polymorphic)的mutation,定义为不在所有肿瘤样本中出现的mutation。上面找出的269个mutation中209个是固定的,35个是多样性的。 剩下的25个位点,被分成两部分,一部分是22个可能固定的,另一部分3个是可能多样性的,这些位点就不再研究了(不知道这些位点是怎么被分类成这样的)。

他们用35个多样性的mutation,来确定克隆的大小和划定克隆的界线。

对于固定的mutation,他们从TCGA上找了在肝癌中出现的一个driver基因列表,看在这些基因里有多少有mutation。然后他们发现在6个假定的diver基因中存在mutation。 另外35个多样性的mutation完全不属于这个基因列表集合。

之后,35个多样性的mutation确定了23个样本中存在20个克隆。 在这里他们定义克隆是一类具有唯一存在于这些细胞中的突变的细胞集合。定义在\(n\)个样本中出现\(i\)次的克隆数量为\(\Phi\),对于[\(\Phi_{i}\),i in 1 to n-1]这个向量,就是群体遗传学中的allele frequency 谱。 例如:[\(\Phi_{i}\)=18,1,1,0,0,0,…;i=1-22],n=23=181+12+1*3,也就是说,在20(=18+1+1)个克隆中包含了18个单突变(只在一个样本中出现),1个双突变(在2个样本中发现),1个三突变(在三个样本中发现)。 他们用Simpson ‘s diversity index 计算了两个随机的样本的遗传相似性非常低。

根据用35个多样性mutation确定克隆大小的方法,我觉得也可以更换定义,使得克隆数减少。所以这个定义是否具有普遍性,是一个问题。

之后他们还画出了这些克隆的相互关系。然后根据genotype画出了克隆的大小和空间关系。从系谱上分析,分开的克隆是隔离的,说明细胞间的运动在实体瘤中较为有限。 另外克隆是“向外”长的,衍生的克隆大多在外层。

接下来是假设检验:原假设是所有克隆有同样的生长速率(非达尔文理论),备择假设是达尔文理论会选择一些克隆,这些克隆生长速率快于其他的克隆。

经过他们的计算,结果无法拒绝原假设,所以说结果支持非达尔文理论。

后面又建立了模型来说明肿瘤整体的遗传多样性和肿瘤内部的遗传多样性。(这个我觉得不管怎么做,肯定结论就是又多样性,没有得出什么新的结论和现象)。

在讨论中,他们又详细解释了为什么非达尔文理论同实验现象一致,达尔文选择却很难看到(一个原因是在bulk数据中突变的频率非常低,难以发现符合达尔文选择的现象)。

这个文章看了之后,间隔的时间太常,在写这篇笔记时很多内容已经记忆不准确了。

英文 中文 英文 中文
caveat 警告 periphery 外围
terminology 术语 polymorphic 多态性
emanate 散发 progenitor 祖先
segregate 隔离 sector 部门
stifle 扼杀 blunt 迟钝
loosen up 放松 adjuvant 辅助药物
ascertain 确定 delineate 划定
genealogy 系谱,家谱 posit 假定