看了一篇比较古老的研究循环肿瘤细胞(CTC)的文章complex tumor genomes inferred from single circulating tumor cells by array-cgh and next generation sequencing, 感叹一下外国医学和研究的结合真是紧密。整篇文章没有什么比较“强”的结论,主要是探索了研究CTC的道路,由于文章较为旧,现在对于CTC的研究应该丰富了不少,对于这篇文章没有做精读。 并且建议对这篇文章不需要做精读。

CTC细胞是在血液中发现的脱离肿瘤原发灶的肿瘤细胞,它可以跑到其他组织中,并在那里扎根,成为转移灶的“干细胞”。这种细胞在同种癌症不同病人的血液里检测到的数量差别也较大, 本文中研究了37名四期病人的血样,在5名病人中完全没有发现CTC,15名病人中发现了1~10个CTC,6名病人中找到了10个以上的CTC,所以他们只用最后六个病人进行后续的研究。

研究CTC,主要做了拷贝数变异的研究。在原发灶,肝转移灶和CTC细胞中,拷贝数变异在很多区域相同,说明CTC同原发灶和转移灶之间是有联系的。 另外在转移灶中,拷贝数变异同原发灶也有着一些区别。(我认为,那些区别很可能是在转移灶中产生的新变异)

一些拷贝数变异的区域正是致癌基因所在的区域,例如chromosomes 5q13.2-5q31.2 区域就包含了APC家族的基因。

在chromosome 8q的gain是肠癌中常见的变异。

之后,文章中也分析了三个部位的突变谱,大多数在CTC中出现的mutaion都是肿瘤原发灶上的mutaion(突变频率在0.02到0.42之间)。

单词本

英文 中文 英文 中文
pharmacokinetic 药物代谢动力学 noninvasive 非侵害
enumeration 计数 acquisition 获得物
hematopoietic 造血 peripheral 周围,外周
aforemention 前述 clot 凝块
tetraploid 四倍体 biopsy 活检
prone 易于 ultraconserved region 超保守区域
bona fide 善意,真实    

由好多单词在单词本里出现了不止一次,这些都是还没记住的-_-


这个文章是华大做的,华大从12年开始连续发了好几篇关于肿瘤单细胞相关的文章,他们用的测序方法是MDA, 几篇文章都主要围绕测序方法的准确性、寻找肿瘤中的driver(驱动)基因、以及重要突变、单克隆多克隆这几个问题展开讨论。

在这篇文章中,他们主要发现了结肠癌的双克隆起源,以及一个新的致癌基因(就是标题)。 文中发现肿瘤主克隆中在致癌基因APC,TP53基因上有突变,而在另一个克隆上有CDC27PABPC1的突变。 他们还发现SLC12A5在单细胞中有高突变率(frequency of mutation)而在群体中的普遍程度却比较低,在实验验证后发现这个基因是一个潜在的致癌基因。

从这篇文章中学习一下文章的结构。

第一部分:说明测序方法的可行性(准确性)

  • 检测乘数,覆盖度
  • 检测假阳性,假阴性
  • 检测组织样本和单细胞样本的突变频率相关性

第二部分:肿瘤细胞可分为两个群体

  • PCA 分析区分group
  • 基于UPGMA的phylogenetic tree分析
  • 随机模拟单克隆到5个克隆的情况,发现实际的频率分布同双克隆相似

第三部分:从两个分组中发现了不同的驱动事件

  • 引入21个结肠癌病人数据,发现有overlap的驱动基因可以将单细胞分成三组(正常,克隆1,克隆2)。
  • 主克隆里有APCTP53,副克隆里有CDC27PABPC1

第四部分:细胞起源异质性分析

  • 用21个样本检测是不是多克隆是个普遍的现象。

第五部分:检测癌症驱动基因

  • 检测非同义突变、同义突变、错义突变、无义突变在一些重要癌症基因的出现频率。
  • 找出enrichment的基因,这些基因是驱动基因。

第六部分:对于新致癌基因的功能验证

  • 做了PCR看这个基因是不是在肠癌细胞系中表达水平高。

材料与方法部分有很多信息

  1. 找somatic mutation的原则。
  2. 如何检测allele dropout。
  3. 在研究异质性问题是,所用的SNV要排除那些在CNV异常区域的。

单词本

英文 中文 英文 中文
aberrant crypt foci 隐窝异常病灶 polyps 息肉
sporadic 零星 etiology 病因学,病源论
pathogenesis 发病机理 hybridization 杂交
inertia 惯性迟钝 specimen 样品
depict 描述 truncation 截断
abrogate 取消,去掉 elucidate 阐明
ectopic 异常 colonocyte 结肠
chloridepotassium symporter 氯化钾转运体    

Adevances and Applications of Single-Cell Sequencing Technologies 这篇review很值得一读,它总结了现有的单细胞领域技术、研究内容、现有问题以及今后方向。 下面简单总结一下比较感兴趣的内容。

单细胞DNA测序技术的缺陷包括: 测序覆盖度不均匀、allelic dropout(等位片段测序丢失)、假阳性、假阴性等。

multiple-displacement-amplification(MDA)方法由于测序覆盖不均匀,在CNV研究中不值得采用这种方法。

multiple annealilng- and looping-based amplification cycles(MALBAC) 方法假阳性高,但是研究CNV比较好。

NUC-SEQ/single nucleus exome sequencing(SNES) 方法可减少技术误差。

img

单细胞RNA测序技术

WAT会造成3’mRNA 的偏差。

区分技术误差与生物学多样性(Biological Variation)

为了解释一个突变或者转录物的确在样本里时杂合的,需要对这些结果做必要的实验验证。 在DNA层面用深度测序,digital droplet PCR(微滴式数字PCR)。 在RNA层面,可用单细胞RT-qPCR以及微滴式数字PCR。

Tissue Mosaicism的研究结果争议性很大(可以参考上一篇文章)

总结下来就是每个研究中都可以看到copy number mosaicism现象,但是这些现象的作用时正向还是负向目前还尚未有定论。

癌症方面的研究

研究主要集中在瘤内异质性、单/多克隆演化、CTC细胞携带mutation特点(肿瘤细胞转移问题)。

研究CTC细胞是为了追溯肿瘤和转移灶的mutation情况。

###小结

单细胞研究的问题涵盖:

  1. 解读群体差异性
  2. 追踪细胞系
  3. 细胞类型分类
  4. 罕见细胞的基因组学信息刻画

###展望

  1. 从单细胞入手,研究单细胞其实是研究单细胞所在的组织的情况。
  2. 如何连接并研究单细胞的phenotype到genotype。
  3. 如何研究单细胞的多层面数据(例如,某个单细胞的DNA和RNA,某个单细胞的RNA和表观)
  4. 在技术上,如何能同时测序上千个单细胞,并降低费用。

这篇去年在PNAS上的文章用Sigma GenomePlex Single Cell Whole Genome Amplification Kit进行单细胞测序,发现异倍体在正常细胞组织中出现的不多。 这个结论同之前的多项研究中说明异倍体是正向选择的结果正好相反。文章只有短短的6页,推翻了一个之前在多篇文章中都有涉及的结论。 整个内容就是找不同的正常人的肝脏和脑神经细胞,进行单细胞测序,计算CNV(500kb一个窗口),看是不是有CNV的变化。

有用的知识

  1. 异倍体在正常组织和癌组织中都有

  2. 在人类BUB1B基因上的突变回导致 mosaic variegated aneuploidy(MVA,斑花叶非整倍体综合征),BUB1B编码 BubR1蛋白,这个蛋白在纺锤体assembly checkpoint过程中染色质分离时起到作用。 MVA疾病的病人在一条或多条染色体上会出现异倍体的情况。MVA病人发育迟缓,会在儿童时期得癌症。

  3. 前人用的FISH技术和spectral karyotyping (SKY)技术都过高估计了异倍体的出现,所以用single cell来解决这个问题(一个一个细胞测得准)。

单词本

英文 中文 英文 中文
proliferation 增生 proteotoxic stress 蛋白毒性压力
retardation 延迟 hypomorphic 亚等位基因
hepatocyte 肝细胞 neonate 新生儿
polyploid 多倍体 mitosis 有丝分裂
cytokinesis 胞质分裂 aberrant 畸变
segregation 分离 endow 资助,天生具有
neural progenitor cells 神经细胞前体 compromise 损害
oncogenic transormation 致癌性转化 dissociate 分离
monosomy 单体型 trisomy 三体型
keratinocyte 角化细胞 epidermis 表皮
cerebral cortex 大脑皮层 glia 神经胶质
immunostaine 免疫标记 permeabilization 渗透
medium spiny neurons 中型多棘神经元 basal ganglion 基底神经节
autopsy 验尸 dilute 稀释
suspension 悬浮液 tetraploid 四倍体
prevalence 普遍程度 octaploid 八倍体
hexadecaploid 十六倍体 incipient 开始,初期
placenta 胎盘 Trophoblast giant cell 滋养层细胞
megakaryocyte 巨核细胞 precursor 前体
platelet 血小板 centrosome 中心粒
kinetochore 着丝粒 cull 剔除
presumably 大概 cognition 认识
isogenic 同基因的    

merotelic:一个着丝粒同时收到来自相反方向的纺锤丝牵引


Tang Fuchou 老师实验室做胚胎发育分析以及单细胞RNA-seq非常有经验,最近(7月23日)他们发表了一个新单细胞转录组测序方法———— single-cell universal poly(A)-independent RNA sequencing (SUPeR-seq),主要特点是在cDNA合成时用有固定anchor序列的随机primer代替传统的oligo(dT) primer。

对于实验部分我理解的不多,主要看信息分析部分有什么关于线性、环状RNA的新结果。

在小鼠胚胎细胞不同发育阶段的研究中:

  • 该研究中大多数circRNA含有多个外显子,少数(9%)circRNA只含有一个外显子。
  • 只有0.9%的circRNA有多于20个潜在的miRNA绑定位点,在功能上绝大多数可能没有起到miRNA海绵的作用。
  • circRNA在卵母细胞阶段就已经可以检测到,到受精卵四个-八个细胞阶段开始下降,囊胚细胞阶段降得很低(为啥?)
  • 出现circRNA多的基因的线性转录本表达量也高。
  • circRNA两侧的intron要比不环化的RNA intron长。
  • 一个基因可以产生多个circRNA,另外这些circRNA倾向于使用同一个5’端的exon,而3’端的exon差异大。
  • 对于使用同一个5’端exon的circRNAs,在下游有长intron的circRNA的数量相对同个基因产生的其他circRNA来说显著的多。反之,使用同一个3’端的exon,上游有长intron的circRNA更富集。
  • repeat元件在circRNA两侧的intron中不明显富集,但由于circRNA两侧的intron长度相对较长,所以repeat序列的总数要比其他的intron多。(从这点来看repeat序列其作用不在于排列的密度,在于绝对数量)
  • 有互补序列的circRNA数量更加富集。
  • 相对距离5kb左右的互补序列才有作用。
  • 有强splicing motif时不容易形成circRNA。
  • circRNA的上下游motif对circRNA的表达起到相反的作用,上游motif强,表达的circRNA多,下游motif弱,表达的circRNA多。

另外,我认为下面这句话看着不太地道。

Gene ontology(GO) analysis of all the 1316 host genes producing these circRNA transcripts showed strong enrichment for terms related to chromatin organization, cell division, and response to DNA damage stimulus, suggesting potential roles of these circRNAs in these functional areas.