我可能有些post里没有标注阅读的文章是哪一篇,想要查文章的时候,需要看博客的连接,连接的英文名字就是文章的title。

这篇文章是15年三月份发表在nature genetics上的。构建了一个癌症最初生长、发展的模型。

主要是说癌症相关的基因突变一开始就有,并且一开始就不止一个突变,每个不同的突变会形成一个subclone,从而不断生长。 有些突变生来就是坏突变,容易长成大的subclone,容易转移。这些特性从一开始就在癌症的subclone里存在了。

CNV和CNA概念以及其区别12

CNV(copy number variation)是生殖细胞的染色体区域/基因的拷贝数增加与减少。 CNA(copy number alteration)是体细胞的染色体区域/基因的拷贝数增加与减少。

简要介绍

文章还是可以的,但是有点读不进去。

主要是用CNA和一些病人特异性的私有mutation来判断是不是产生早的突变可扩散到很远的位置,由此来说明文章的观点Big Bang模型。

癌细胞的突变容易扩散,腺瘤突变基本有界,不容易扩散。

文章中的统计推断部分用到了他们之前发表的一篇文章的内容Single-molecule genomic data delineate patient-specific tumor profiles and cancer stem cell organization.

在比较毗连的细胞间差异性的时候用到了Shannon-Index

参考资料

单词本

英文 中文 英文 中文
primordial 原发 malignant 恶性
malignancy 恶性肿瘤 neoplasm 肿瘤
pervasive 无处不在 experimentally 实验证明
stepwise 逐步的 paradigm 范例
confer 商议、比较 recapitulate 摘要,总结
variegation 五花八门,彩斑 progeny 后代
propagate 繁衍 glandular 腺状的
phylogenies 系统发育 aberrant 畸变
colon crypt 结肠隐窝 obscure 掩盖
respective 各自、分别的 corroborate 证实
recapitulate 总结 chemotherapy 化疗

过节用3~4天时间看完了大刘的《超新星纪元》(同三体一起贩卖的京东版)。里面比较喜欢的片段如下:

  1. “大量子”作为终端,指导并帮助小孩社会重新建立秩序走出恐慌和混乱。
  2. 美国小孩那个“军师”同总统的对话。

没有弄清楚的问题:

  1. 为什么13岁以上都挂了,年龄13的就真的一点都没事?(这个问题有点较真)
  2. 国家交换时不带走一草一木的原因。(网上查了一些,说法有两种,一种是切断同祖先的联系好让这一代彻底完蛋,另一种是不忘祖先到新的地方重头开始)

网上说法是这个版本已经被删节了很多内容,我自己也没有读懂,感觉前后不连贯。另外,为什么“大量子”在前面出现,在后半段就消失的无影无踪?

我觉得真有这种毁灭世界的情况产生,绝大部分孩子也很可能无法独立存活。 除非你有什么志向要把大刘写的文章都看一遍,否则可以放弃阅读这本,内容真的是不连贯,我不知道删减了多少,也不能确信网上的那些所谓的非删减版本是不是真的是大刘所写。 由于出版方面的干预,这个新纪元世界我是不买账。

不过超新星纪元的这个世界让我想到了1984(联想有些跳跃)。

一个失控的新兴世界和一个被奴役没有反抗的世界。我觉得写孩子的世界比较难,因为走过童年后,大家也不见得能记得起多少小时候做过的事情,以及当时做事情的原因。 所以很难刻画出一个符合真实情况的想象中的新兴世界;一个被奴役没有反抗的世界,总是存在于人们的想象中,读起来感同身受。

看1984的时候正好是斯诺登事件不久之后,从“杨老板”那里借到了这本书。很多国内的版本里没有《附录:新话的原则》,但是我看的那一版里好像有。 感谢杨老板的书买得早。好像通过附录的内容,有人说引申意义是1984的世界最后没有成真/或者成真了。不管怎样,大家都不希望这样的世界出现。

War is peace. Freedom is slavery. Ignorance is strength.

基本所有的词都有对立面,没有完全的自由,也不可能出现完全的监控。 不过一个自由没有任何约束的世界同一个完全被监控没有自由的世界,我觉得后者可能更能成为现实, 因为很多人习惯于被奴役,这样可以少想一些事情,让自己认为活得更加轻松。

读1984最深的感受就是奥威尔对那个世界的刻画,一切都同二战,冷战,The Cultural Revolution,这几个不同且相互交错的时期有类似的地方。 艺术总能高于生活,提炼出来,让人看得毛骨悚然。

斯诺登事件让大家认识到,每个人的信息都在被有限制的监控着。随着科技的发展,监控和信息筛选手段越来越高明。 但是暴露出监控后,各国政府肯定没什么影响也不会有什么好措施出台(哪个实力强的政府一点不监控?没有),底层的老百姓也就关心两天,之后也会慢慢不了了之。 这种情况又让我想起了鲁迅写文章揭露恶根性,但是几十年过去了,大家一点没变。斯诺登的事情也是这个结局。


标题很俗,我就是想灌篇水,思路比较跳跃。

刚才更新了2011年的一篇用来备份安装软件的文章。 感觉4年过去了,用的软件也同以前不一样了,能吐槽的地方还不少,在标签中写错了单词python,这一错就是4年。Jupyter这种类型的应用估计将会是今后的主流。 最近也在github上开了一个repository,用来更新安装系统时必须的一些软件。

国内的大局域网,今后同外部的交流会更加减少。

我的第一个比较完善的Jekyll主题用一年的时间攒到45颗星星,已经够同时召唤6次神龙。 去年博客被人留言了3次左右(同去年之前的所有年份留言总和持平),真没想到还有人看,感谢大家的默默关注,也强烈鼓励大家留言。

今年仍会努力更新内容并且还旧债。争取像我英文博客中所说的,完成2012年的计划的目标。

由于各种各样的原因我block了一些博客的内容,但是在repository里都能看到,看过的感觉就是往事不堪回首

工作了7年的旧电脑安装了windows 10,并且进入退役预备期。

看了不少东西,但是书评都没写,再不写我就可以重头再读一遍了。这是不是记忆力已经没有那么好的一种表现?

学习自我约束能力,孙正义的中文百科太牛逼了,日文wiki都没写得这么牛。

本来注册了一门在线课程1月5日开讲,结果时间在暗中改成了1月19日。尼玛老美这节真要过到马丁路德金日之后才算完。

周星驰的“努力!奋斗!”,今年我得念成“老了!赚钱!”。


在写这篇博客的时候翻看了一下自己的分类目录,幸好没有好书推荐这种弱智的分类。

在2015年年末用了3天时间看完了刘慈欣(我一直叫成刘欣慈)的《球状闪电》,中间一些描写就看得比较快。

《球状闪电》故事的脑洞比较大,有很多不科学的地方,所以看起来不是那么精彩。 我最喜欢的部分是大刘写的后记。

与主流文学留给人们性格鲜明的人物画廊一样,西方科幻小说也留下了大量的想像世界: 除了克拉克的拉玛飞船外,还有阿西莫夫广阔的银河帝国和用三定律构造出来的精确的机器人世界、 赫伯特错综复杂的沙丘帝国、奥尔迪斯的热带雨林、克莱门特那些用物理定律构造出来的世界、 以及最近奇昂的从科学和历史角度看都不可能存在的巴比伦塔等。这些想像世界构造得那么精确鲜活, 以至于读者时常问自己它们是不是在另一个时空中真的存在。 反观中国科幻,最大缺憾就是没有留下这样的想像世界,中国的科幻作者创造自己世界的欲望并不强, 他们满足于在别人已经创造出来的世界中演绎自己的故事,我们的科幻小说中那些世界都是熟悉的,只剩下故事了。 创造一个在所有细节上都栩栩如生的想像世界是十分困难的,需要深刻的思想,需要在宏观和微观上都强劲有力游刃有余的想像力, 需要从虚无中创生的造物主的气魄,而后面两项,恰恰是我们的文化所缺乏的。但如果我们一时还无力创造整个世界, 是否能退而求其次,先创造其中的一个东西呢?这就是我写这部小说的目的。

平心而论,球状闪电中的世界同读者感觉不是很近也很远,既不真实,也不是描述遥远的未来。 书后面描写的一场战争,感觉开始的毫无头绪。在不同章节中主观视角的叙述,客观视角的叙述,都有些生硬。

但是反观三体的世界,第一部从大家都“熟悉”或“经历过”的历史时期开始,让国内的读者能更好的进入故事中的环境。 第二部的展开非常有意思,又有遥远未来的感觉。 虽然第三部有点狗尾续貂。但故事终究有个让人回味/反思/争论的结尾。

三体世界是大刘带给我们的一个不算丰满,但能引起较为深入思考的想像世界

球状闪电只是一个中规中矩的作品。


总结几篇关于单细胞RNA-seq的工作内容。这次的文章属于泛读。

思考两个问题:单细胞RNA-seq能用来做什么? 在癌症方面,每个细胞的基因表达差异性意味着什么(癌症干细胞)?

Accounting for technical noise in single-cell RNA-seq experiments

  • 文章介绍了RNA-seq中技术噪声的估计。
  • 单细胞RNA0-seq的基因表达量校正要用spike-in
  • 用到了统计方法来做假设检验。派段哪些基因是在细胞间差异性大的。

Deep sequencing reveals cell-type specific patterns of single-cell transcriptome variation

  • 文章中的PCA前三个主成分只占13%
  • Jaccard 相似性只有0.258和0.286,是怎么做到p.value < 十的负四次方的
  • rho=0.19或者0.22,p.value竟然达到了十的负十四次方以上
  • 唯一有意思的工作是总结了3’UTR的多样性,但是单细胞数据,准确性在没有实验验证的情况下不敢保证

这篇文章看的比较囫囵吞枣,里面一些内容没仔细看。

没准上面提到的问题是我理解出错。

Identification of Distinct Tumor Subpopulations in Lung Adenocarcinoma via Single-Cell RNA-seq

  • 研究了TF与基因表达的关系。一类基因启动子区域的某TF出现的多,再看看TF的基因同“一类基因”是不是表达有相似性。唯一问题是,基因共表达本来就很多会解释不清。(我对于基因共表达网络抱有谨慎怀疑态度。)
  • 用TCGA数据做了一下选出的基因集合的生存分析。看到那两条生存曲线,能算出p.value < 0.05 也是不容易。

单词本

英文 中文 英文 中文
substantiate 证实 pragmatic solution 务实解决
physiologically relevant 生理相关 metazoan 后生动物
cell phenotypes 细胞表型 calibrate 校准
intestinal in situ 原位
morphologically 形态 variability 变异性
brown adipocytes 棕色脂肪细胞 cardiomyocytes 心肌细胞
cortical pyramidal neurons 皮质锥体神经元 hippocampal pyramidal neurons 海马锥体神经元
serotonergic neurons 5-羟色胺神经元(血清素能神经元) confounding 混杂
caveat 警告 mitigate 减轻
Saturation 饱和 cardiomyocyte 心肌细胞
patient-derived xenografts 来自患者的移植(异种移植) glioblastoma 胶质母细胞瘤
proliferation 增殖 hypoxia 缺氧
putative 假定