这篇博客起始于2016年8月,完成于来年的2月,中间经历了9月份的初稿,请不要纠结文章中的时间。

炎热的季节终于要过去了,这个夏天我在做什么?在忍受炎热。 进入九月份终于凉快多了。 所以给自己的忠告就是夏天一定要找个凉快一点的地方,否则连正常的工作都没法做。每天同炎热作斗争,电脑也因为过热而经常罢工。 另外觉得自己应该无法在北纬30度附近生活,只能向北,不能向南。在美国德州的人们夏天都是怎么度过的?

2016年这个夏天对我来说到底有多热?我在7月份的博客草稿箱里就有一个待完成的北京夏天气温统计相关的文章,结果8月份草稿箱里又躺了一篇同样标题的,终于在2017年2月份完成了。

关于热的概念,不是因温度升高难受,而是因空气湿度大而感到更热,但是我没有下载湿度的数据进行分析,如果以后有机会再补上。

分析完数据,我发现最好用的气象数据下载网站还属NOAA.GOV,大学时做数学建模当时要下载美国Florida的气象水文数据,直接NOAA,FTP下载。现在NOAA更加智能化的帮助用户提取时间点的数据。反观国内的气象数据下载网站,国家气象局,中科院,实名注册都要费老半天时间,谁用谁放弃。

那么大家肯定会问,这点屁事,写一篇博客就成了,为啥你水了2篇? 因为没空调真的是太热了


八月一日将系统升级,拥抱Fedora24,谢天谢地升级很顺利。

新版本的字体有了很大改进,在终端下显示很清晰舒服,但是在文件浏览器下字体有些单薄。

Fedora

字体如下所示:

Font in Fedora

不是为什么升级完,jekyll没法用了。

提示错误信息

/usr/share/rubygems/rubygems/core_ext/kernel_require.rb:55:in `require’: libruby.so.2.2: cannot open shared object file: No such file or directory

索性删除ruby*和所有Gem安装的包(gem uninstall -aIx),重新安装一次,即可。


我所在的屋子没有空调,所以夏天会很热,但是我没要想到竟然会这么热。

由于热得是在是受不了了,所以找来了从我出生到现在,北京的每日气温数据,我想看一下今年究竟处于__我所经历的所有时间里__同期的什么水平。

经多简单的统计,我发现,在7月北京的最高平均气温是34.4摄氏度,最低气温是18.8摄氏度,而这两个温度都是进入新世纪(21世纪)后的温度。 最高气温是41.66度,进入2001年后,最高气温是41.11度。

(注意,这篇文章是我后补的,所以我获取了2016年七月份每天的数据。)

从下图可以看到,北京的平均气温在进入七月的第一个7天里会有一个小幅度的上升然后回落,在月末最后5天又会重复一次同样的过程。

Beijing Average Temperature in July

值得注意的是7月9日,这一天的1st四分位数和3rd四分位数都非常接近中位数,说明这一天的温度差异非常的小。所以我可以预测,2017年的7月9日,北京的日平均气温应在26摄氏度左右(7月里最舒服的一天)。

我刚想“神棍”得预测一下7月9日的气温,但当我把2015和2016年的气温放到直方图上时,这两年的气温都高于历史同期水平,是图上的两个outlier!! 并且这两年的气温走势也不符合我刚才说的月初7天一个小坡,月末5天一个小坡。

Beijing Average Temperature in July(2015-2016)

近两年完全不按照历史规律来办事(╯°Д°)╯︵ ┻━┻

2016年7月的平均气温,有3天是进入2001年以来的最高气温,这估计是我会觉得这么热的主要原因。

当然光考虑气温不代表人感受到的实际热度,还要考虑湿度的影响,湿度大,外加气温高,会让人感到更热。

我直接找到2016年7月的日湿度数据,发现不下雨的时候平均湿度维持在50%~60%左右,下雨的时候,会维持在80%~90%。由于北京多为阵雨,并且经常出现海淀下雨,朝阳没雨的情况(一个城市竟然会按“城区”下雨),并且每天最高湿度都能达到80%~90%,所以整个7月内人们都会感到很闷热。


NIPT(Noninvasive prenatal testing)非侵入式产前检测,国内一般称作“无创DNA产前检测技术”。之前一直没有时间看,这个技术究竟怎么从母亲的血液中测胎儿的DNA,现在有时间了,赶紧记录一下原理。

NIPT技术细分为两种:一种是测CNV,另一种是测SNP。 在2012年时比较流行的4中具体方式是1

  1. Sequenom 公司:定量,短序列全基因组测序,并且评估胚胎DNA含量
  2. Verinata 公司:定量,短序列全基因组深度测序,不评估胚胎的DNA含量
  3. Ariosa 公司:定量,目标区域扩增,并且根据SNP频率来确定胚胎DNA含量
  4. Natera 公司:基于非定量的SNP,分析等位基因频率(这个方法中用白细胞的测序结果作为母亲的基因型)

其中重点要说明的是,测CNV是不用区分母亲和胎儿的DNA的,首先,我们明确母亲没有任何一种三体综合征和染色体缺失,那么在这种条件下仍然检测出一定比例的三倍体或者单倍体,那么就说明是胚胎出现了问题。

从测序角度来说就是测序深度越高越精确,对于测序结果是否说明有染色体异常,用假设检验(Z-score)来估计其异常程度。

下图比较了四个公司的方法的准确性,可以看到对于21三体综合征是最准确的,对于18三体综合征和单倍体的检测准确性低。

Imgur

测不准的原因在于测序技术有GC偏好性,并且在13和X染色体上表现得很明显2

NIPT方法目前主要还是用于测染色体倍增或者缺失(截至2013年),对于一些微缺失和微倍增( microdeletions and microduplication )用芯片的方法也开展了检测研究。

我个人的理解,孕妇首先应该做常规血检和B超检查,如果检查认为有问题,可以先做一个无创DNA产前检测来确认一下,如果无创也指示有问题或者数值处于临界值,那么继续做羊水穿刺来确定。

我本认为技术应该很高超,结果看完相关网络资料发现不用区分母婴的DNA时,方法也就很常规了。


又来补课了,这三部太经典了,一口气看完,每一部都很有意思。

里面的梗是在是太多了:

  • 没想到霸王龙的小手原来在十几年前已经是个梗了。
  • 企鹅叫Wheezy,马上想到Linux/Debian,结果查看百科,原来所有Debian的发行版本号命名都来自这部片子。
  • I am your father!
  • 第三部的越狱,比TV系列剧越狱难度还高。
  • 玩具里还有一只龙猫。

看完之后去翻资料,原来在2014年还出了个短篇,2018年还可能要有第四部。Andy的玩具传承给了Bonnie,不知道第四部会有什么样的故事(据说是去找Bo)。

最后再喊一句 To Infinity and Beyond!(英文博客的subtitle出处)