用于快速检测白血病的一种新方法:17基因干细胞性分值
去年nature上有一篇关于白血病风险检测的文章,找了17个基因的表达量组成一个分值,然后用这个分值来划分白血病的生存周期(overall survival简称OS, event-free survival 简称EFS)。这个分值与白细胞的干细胞性有关。
介绍这篇文章主要是学习一下,作者们是从哪几个方面来说明自己找到的17个基因是在白血病中非常关键的基因。这篇文章不是article,实验存在很明显的问题。
- 说明CD34/CD38不能很好的区分白细胞的干细胞性。
- 引出他们的方法,从LSC+和LSC- (LSC leukaemia stem cell)的两类样本基因表达数据中找出密切相关的转录本。方法是cox regression model,求基因表达同生存期的相关性。
- 然后他们把找到的17个基因加上权重,组合成一个数值,叫它为LSC17 score。他们发现LSC17 score高的样本中病人的OS会短一些。
- 接下来在不同的数据集中做测试,发现不管在哪个测序技术平台上,这个结果都成立。
- 他们还发现相比于之前已知的几个基因突变同白血病的联系,他们的17基因可以更好的预测病人的生存周期。
- 同其他临床指标相比,17基因的效果也很好。
- 那么这个方法有什么应用呢?
- 首先是在NanoString 平台上,可以用17基因做临床检测
- 在白血病治疗中,干细胞移植手术中17基因可以做为协助断定病人是否可以进行移植的指标,不管怎么样只要是LSC17 score高的,临床预后都不好。作者在后面又续了一段说对于不同的数据,LSC17 score中的基因是有变化的,说明这个score还可以进行优化。(换个数据集基因就有变化,说明方法不稳定,另有在做耐药性的预测时,换了权重可以得到更好的预测结果。)
- 预测药物响应。LSC17 score低的患者对于gemtuzumab ozogamicin有更好的响应,延长生存周期。
这个工作的特点就是做了大量了不同平台之间的比较,从芯片到测序,再到三代测序。并且很好的说明了结果的应用。
缺点也很明显,系统不稳定,17基因可能会变,权重也会变。这就说明不能用来预测,因为LSC17 score高和低,都是针对不同的数据集合来说的,没有一个统一的标准。
最后,我要感谢文章的作者,在我阅读文章时产生了很多疑问,发邮件询问作者,得到了快速准确的答复。虽然我觉得文章在预测白血病预后方面没有什么太大的应用价值,但是这个工作仍是一个对于白血病干细胞性相关基因的全面分析。从中可以学到如何从各个方面对于自己的假设做验证。 全篇内容都是用的临床数据统计分析的方法,用的做多的就是多元线性回归。
单词本
| 英文 | 中文 | 英文 | 中文 |
|---|---|---|---|
| induction | 感应 | relapse | 复发 |
| quiescence | 静止 | allogeneic | 异源基因 |
| haematopoietic | 造血 | umbilical cord | 脐带 |
| multipotent progenitors | 多功能祖细胞 | granulocytes | 粒性白血球 |
| monocyte | 单核 | myeloid | 骨髓 |
| engraftment | 植入 | patient outcome | 转归(病人恢复结果) |
| prognosis | 预后 | cytogenetically | 细胞遗传学的 |
| offset | 抵消 | mortality | 死亡率 |
RNA免疫沉淀测序
这个就是ChIP-seq的RNA版。
RNA免疫沉淀测序用来定位蛋白质与RNA结合的位置。在该方法中,用特定的蛋白抗体来对RNA-蛋白复合物进行免疫沉淀。 RNA酶消化后,提取蛋白质覆盖的RNA并逆转录成cDNA。 然后将位置映射回基因组。

技术优点:
- 可以针对特异性(研究需要)的蛋白-RNA复合物。
- 由于使用RNase消化,可以得到背景噪声低,高分辨率的绑定位点信息
- 不需要任何关于RNA的具体先验知识(不需要提前知道需要的是哪些RNA序列)
- 全基因组范围的RNA搜索
技术缺点:
- 需要特定蛋白质的抗体
- 非特异性抗体将沉淀非特异性复合物
- 复合物若缺乏crosslink或者稳定性,会造成假阴性
- RNase消化过程必须仔细控制
腾落指数
腾落指数(A·D·Line)主要用来确认价格变动,检测价格波动。计算方法就是用股市收盘价上涨的公司数量减去下降的公司数量,然后将得到的数值加上昨天的A·D·Line上。 例如:纽约证券市场今日交易结束后,有1692家公司的股票收盘价上涨,1311家公司下跌,那么DELTA=1692-1311=381,假设昨天的ADL是45874,那么今天的ADL就是45874+381=46255。 ADL数值是正还是负对于分析无关紧要,重要的是看它的趋势。

High #1 to High #2
上图中迷你道琼斯工业指数升高,但是ADL没能同样升高,看跌
High #2 to High #3
道琼斯工业指数降低,ADL两个小高峰之间同样降低,今后趋势仍旧看跌
Low #1 to Low #2
另一个看跌偏差发生在低位#1到低位#2。微型道琼斯期货合约涨幅较高,成为公认的看涨迹象。然而,Advance Decline Line并未确认微型道琼斯未来的上涨趋势。事实上,在低迷1号至低位#2的小型道琼斯整体涨势中,预期下降线正在下调低点。这种看跌的分歧标志着股票投资者和指数期货交易商应该警惕最近的涨幅;整体市场将于近期走高。
总而言之,ADL是确认股票和股票指数价格行动以及信号潜在逆转或价格走弱的非常有效的工具。 另一个类似的指标是武器指数[TRIN](Arms Index)。
核糖体分析测序(RIBO-seq)/ARTSEQ
活性mRNA翻译测序 (ART-seq),也被称作核糖体分析,它是分离正在由核糖体加工的RNA,以便监测翻译过程。 该方法首先将与核糖体绑定的RNA进行消化(digestion),然后提取RNA,去掉rRNA,将提取的RNA逆转录成cDNA,最后测序。 测序结果展示了同核糖体绑定的RNA序列正在经历翻译过程。 这种方法已经被改进,以提高结果的质量和数量性质。 应注意以下几点:(1)产生细胞提取物,其中核糖体被正确的终止在它们正在翻译的mRNA上; (2)未被核糖体保护的RNA将被核酸酶消化,然后只回收核糖体保护的mRNA片段; (3)将受保护的RNA片段定量转化成可通过深度测序分析的DNA文库。 加入harringtonine(一种抑制蛋白质生物合成的生物碱)会使核糖体在起始密码子上精确地积累并有助于其检测。

技术优点:
- 展示了核糖体在RNA上的精确位置的快照
- 核糖体分析比mRNA水平更接近地反映了蛋白质合成的比例
- 不需要关于RNA和ORF的先验知识
- 这是在全基因组水平的分析
- 可以用来确定蛋白质转录区域
技术缺点:
- 单一转录本有多个翻译起始位点的情况下,很难确定所有的ORF
- 不能测量翻译延伸的动力学数据(速率之类的)
自适应移动平均
移动平均这个概念常在时序分析是出现,它是价格波动的敏感性指标。价格在一定方向上移动的时期,自适应移动平均线变得更为敏感,在价格波动时对价格走势的敏感程度不大。

上图显示了自适应移动平均和指数移动平均的特点,在中间一段价格波动时期,自适应移动平均线比较平缓,而指数移动平均线上下波动。