循环肿瘤细胞的一个研究

目录: 论文笔记 | 标签: 单细胞, CTC | 发表时间: Sep 10, 2015

看了一篇比较古老的研究循环肿瘤细胞(CTC)的文章complex tumor genomes inferred from single circulating tumor cells by array-cgh and next generation sequencing，感叹一下外国医学和研究的结合真是紧密。整篇文章没有什么比较“强”的结论，主要是探索了研究CTC的道路，由于文章较为旧，现在对于CTC的研究应该丰富了不少，对于这篇文章没有做精读。并且建议对这篇文章不需要做精读。

CTC细胞是在血液中发现的脱离肿瘤原发灶的肿瘤细胞，它可以跑到其他组织中，并在那里扎根，成为转移灶的“干细胞”。这种细胞在同种癌症不同病人的血液里检测到的数量差别也较大，本文中研究了37名四期病人的血样，在5名病人中完全没有发现CTC，15名病人中发现了1～10个CTC，6名病人中找到了10个以上的CTC，所以他们只用最后六个病人进行后续的研究。

研究CTC，主要做了拷贝数变异的研究。在原发灶，肝转移灶和CTC细胞中，拷贝数变异在很多区域相同，说明CTC同原发灶和转移灶之间是有联系的。另外在转移灶中，拷贝数变异同原发灶也有着一些区别。（我认为，那些区别很可能是在转移灶中产生的新变异）

一些拷贝数变异的区域正是致癌基因所在的区域，例如chromosomes 5q13.2-5q31.2 区域就包含了APC家族的基因。

在chromosome 8q的gain是肠癌中常见的变异。

之后，文章中也分析了三个部位的突变谱，大多数在CTC中出现的mutaion都是肿瘤原发灶上的mutaion（突变频率在0.02到0.42之间）。

单词本

英文	中文	英文	中文
pharmacokinetic	药物代谢动力学	noninvasive	非侵害
enumeration	计数	acquisition	获得物
hematopoietic	造血	peripheral	周围，外周
aforemention	前述	clot	凝块
tetraploid	四倍体	biopsy	活检
prone	易于	ultraconserved region	超保守区域
bona fide	善意，真实

由好多单词在单词本里出现了不止一次，这些都是还没记住的-_-

通过单细胞技术检测到结肠癌中的双克隆起源以及发现一个新致癌基因

目录: 论文笔记 | 标签: 结肠肿瘤, 多克隆, 单细胞 | 发表时间: Sep 9, 2015

这个文章是华大做的，华大从12年开始连续发了好几篇关于肿瘤单细胞相关的文章，他们用的测序方法是MDA，几篇文章都主要围绕测序方法的准确性、寻找肿瘤中的driver（驱动）基因、以及重要突变、单克隆多克隆这几个问题展开讨论。

在这篇文章中，他们主要发现了结肠癌的双克隆起源，以及一个新的致癌基因（就是标题）。文中发现肿瘤主克隆中在致癌基因APC,TP53基因上有突变，而在另一个克隆上有CDC27和PABPC1的突变。他们还发现SLC12A5在单细胞中有高突变率(frequency of mutation)而在群体中的普遍程度却比较低，在实验验证后发现这个基因是一个潜在的致癌基因。

从这篇文章中学习一下文章的结构。

第一部分：说明测序方法的可行性（准确性）

检测乘数，覆盖度
检测假阳性，假阴性
检测组织样本和单细胞样本的突变频率相关性

第二部分：肿瘤细胞可分为两个群体

PCA 分析区分group
基于UPGMA的phylogenetic tree分析
随机模拟单克隆到5个克隆的情况，发现实际的频率分布同双克隆相似

第三部分：从两个分组中发现了不同的驱动事件

引入21个结肠癌病人数据，发现有overlap的驱动基因可以将单细胞分成三组（正常，克隆1，克隆2）。
主克隆里有APC，TP53，副克隆里有CDC27和PABPC1。

第四部分：细胞起源异质性分析

用21个样本检测是不是多克隆是个普遍的现象。

第五部分：检测癌症驱动基因

检测非同义突变、同义突变、错义突变、无义突变在一些重要癌症基因的出现频率。
找出enrichment的基因，这些基因是驱动基因。

第六部分：对于新致癌基因的功能验证

做了PCR看这个基因是不是在肠癌细胞系中表达水平高。

材料与方法部分有很多信息

找somatic mutation的原则。
如何检测allele dropout。
在研究异质性问题是，所用的SNV要排除那些在CNV异常区域的。

单词本

英文	中文	英文	中文
aberrant crypt foci	隐窝异常病灶	polyps	息肉
sporadic	零星	etiology	病因学，病源论
pathogenesis	发病机理	hybridization	杂交
inertia	惯性迟钝	specimen	样品
depict	描述	truncation	截断
abrogate	取消，去掉	elucidate	阐明
ectopic	异常	colonocyte	结肠
chloridepotassium symporter	氯化钾转运体

单细胞测序技术的优点和应用

目录: 论文笔记 | 标签: 单细胞 | 发表时间: Sep 8, 2015

Adevances and Applications of Single-Cell Sequencing Technologies 这篇review很值得一读，它总结了现有的单细胞领域技术、研究内容、现有问题以及今后方向。下面简单总结一下比较感兴趣的内容。

单细胞DNA测序技术的缺陷包括: 测序覆盖度不均匀、allelic dropout（等位片段测序丢失）、假阳性、假阴性等。

multiple-displacement-amplification(MDA)方法由于测序覆盖不均匀，在CNV研究中不值得采用这种方法。

multiple annealilng- and looping-based amplification cycles(MALBAC) 方法假阳性高，但是研究CNV比较好。

NUC-SEQ/single nucleus exome sequencing(SNES) 方法可减少技术误差。

单细胞RNA测序技术

WAT会造成3’mRNA 的偏差。

区分技术误差与生物学多样性(Biological Variation)

为了解释一个突变或者转录物的确在样本里时杂合的，需要对这些结果做必要的实验验证。在DNA层面用深度测序，digital droplet PCR（微滴式数字PCR）。在RNA层面，可用单细胞RT-qPCR以及微滴式数字PCR。

Tissue Mosaicism的研究结果争议性很大（可以参考上一篇文章）

总结下来就是每个研究中都可以看到copy number mosaicism现象，但是这些现象的作用时正向还是负向目前还尚未有定论。

癌症方面的研究

研究主要集中在瘤内异质性、单/多克隆演化、CTC细胞携带mutation特点(肿瘤细胞转移问题)。

研究CTC细胞是为了追溯肿瘤和转移灶的mutation情况。

###小结

单细胞研究的问题涵盖：

解读群体差异性
追踪细胞系
细胞类型分类
罕见细胞的基因组学信息刻画

###展望

从单细胞入手，研究单细胞其实是研究单细胞所在的组织的情况。
如何连接并研究单细胞的phenotype到genotype。
如何研究单细胞的多层面数据（例如，某个单细胞的DNA和RNA，某个单细胞的RNA和表观）
在技术上，如何能同时测序上千个单细胞，并降低费用。

单细胞测序揭示非整倍体（异倍体）在哺乳动物组织中出现的水平较低

目录: 论文笔记 | 标签: 单细胞, 异倍体 | 发表时间: Sep 6, 2015

这篇去年在PNAS上的文章用Sigma GenomePlex Single Cell Whole Genome Amplification Kit进行单细胞测序，发现异倍体在正常细胞组织中出现的不多。这个结论同之前的多项研究中说明异倍体是正向选择的结果正好相反。文章只有短短的6页，推翻了一个之前在多篇文章中都有涉及的结论。整个内容就是找不同的正常人的肝脏和脑神经细胞，进行单细胞测序，计算CNV（500kb一个窗口），看是不是有CNV的变化。

有用的知识

异倍体在正常组织和癌组织中都有
在人类BUB1B基因上的突变回导致 mosaic variegated aneuploidy(MVA，斑花叶非整倍体综合征)，BUB1B编码 BubR1蛋白，这个蛋白在纺锤体assembly checkpoint过程中染色质分离时起到作用。 MVA疾病的病人在一条或多条染色体上会出现异倍体的情况。MVA病人发育迟缓，会在儿童时期得癌症。
前人用的FISH技术和spectral karyotyping (SKY)技术都过高估计了异倍体的出现，所以用single cell来解决这个问题（一个一个细胞测得准）。

单词本

英文	中文	英文	中文
proliferation	增生	proteotoxic stress	蛋白毒性压力
retardation	延迟	hypomorphic	亚等位基因
hepatocyte	肝细胞	neonate	新生儿
polyploid	多倍体	mitosis	有丝分裂
cytokinesis	胞质分裂	aberrant	畸变
segregation	分离	endow	资助，天生具有
neural progenitor cells	神经细胞前体	compromise	损害
oncogenic transormation	致癌性转化	dissociate	分离
monosomy	单体型	trisomy	三体型
keratinocyte	角化细胞	epidermis	表皮
cerebral cortex	大脑皮层	glia	神经胶质
immunostaine	免疫标记	permeabilization	渗透
medium spiny neurons	中型多棘神经元	basal ganglion	基底神经节
autopsy	验尸	dilute	稀释
suspension	悬浮液	tetraploid	四倍体
prevalence	普遍程度	octaploid	八倍体
hexadecaploid	十六倍体	incipient	开始，初期
placenta	胎盘	Trophoblast giant cell	滋养层细胞
megakaryocyte	巨核细胞	precursor	前体
platelet	血小板	centrosome	中心粒
kinetochore	着丝粒	cull	剔除
presumably	大概	cognition	认识
isogenic	同基因的

merotelic:一个着丝粒同时收到来自相反方向的纺锤丝牵引

小鼠胚胎单细胞RNA-seq线性、环状RNA分析

目录: 论文笔记 | 标签: single cell, circRNA, embryos, 转录组分析 | 发表时间: Aug 28, 2015

Tang Fuchou 老师实验室做胚胎发育分析以及单细胞RNA-seq非常有经验，最近（7月23日）他们发表了一个新单细胞转录组测序方法———— single-cell universal poly(A)-independent RNA sequencing (SUPeR-seq)，主要特点是在cDNA合成时用有固定anchor序列的随机primer代替传统的oligo(dT) primer。

对于实验部分我理解的不多，主要看信息分析部分有什么关于线性、环状RNA的新结果。

在小鼠胚胎细胞不同发育阶段的研究中：

该研究中大多数circRNA含有多个外显子，少数（9%）circRNA只含有一个外显子。
只有0.9%的circRNA有多于20个潜在的miRNA绑定位点，在功能上绝大多数可能没有起到miRNA海绵的作用。
circRNA在卵母细胞阶段就已经可以检测到，到受精卵四个-八个细胞阶段开始下降，囊胚细胞阶段降得很低(为啥？)。
出现circRNA多的基因的线性转录本表达量也高。
circRNA两侧的intron要比不环化的RNA intron长。
一个基因可以产生多个circRNA，另外这些circRNA倾向于使用同一个5’端的exon，而3’端的exon差异大。
对于使用同一个5’端exon的circRNAs，在下游有长intron的circRNA的数量相对同个基因产生的其他circRNA来说显著的多。反之，使用同一个3’端的exon，上游有长intron的circRNA更富集。
repeat元件在circRNA两侧的intron中不明显富集，但由于circRNA两侧的intron长度相对较长，所以repeat序列的总数要比其他的intron多。（从这点来看repeat序列其作用不在于排列的密度，在于绝对数量）
有互补序列的circRNA数量更加富集。
相对距离5kb左右的互补序列才有作用。
有强splicing motif时不容易形成circRNA。
circRNA的上下游motif对circRNA的表达起到相反的作用，上游motif强，表达的circRNA多，下游motif弱，表达的circRNA多。

另外，我认为下面这句话看着不太地道。

Gene ontology(GO) analysis of all the 1316 host genes producing these circRNA transcripts showed strong enrichment for terms related to chromatin organization, cell division, and response to DNA damage stimulus, suggesting potential roles of these circRNAs in these functional areas.

On Your Mark

Never give up, Dream big