今天看了两个短篇,大神Efron给science在2年半前写的贝叶斯理论在21世纪的作用Bayes’ Theorem in the 21st Century; Nature Methods有个系列讲统计显著性points of significance之中的Power and sample size

重新读完之后感到,统计和生物是密不可分的,做生物不懂统计,得到的结果就失去了指导实践的意义。

Efron大神的短篇主要讲贝叶斯是非常有用滴,从1763年至今,越来越有用,在上世纪50年代我们有了经验贝叶斯这个工具。 该工具在新世纪的大数据统计中焕发光彩。贝叶斯统计让Nate Silver在2012年美国总统大选中百分百预测了50个州的结果。 现在我们还可以结合FDR来用这个工具。当然,贝叶斯也不是万能的,我们总要有其他工具来检测我们的贝叶斯结果是否合理,就是频率理论。 Efron的文章中用词具有多样性,写作时应该学习。

关于显著程度

我们总是说某个假设检验结果显著,那么究竟怎么样才叫真正的显著呢?起码type I error 在0.05,统计功效(整体1减去type II error)在0.80。

如下图中的b所示,即便功效达到0.8,也有可能出现阳性预测率仅仅为0.64的情况。这是因为只有10%的假设是有效的(not null)

Imgur

用效应值可以来度量零假设分布和备择假设分布之间的差异。

理想情况下,我们希望在type I error 一定的情况下,power越大越好。 达到这个目的有两种方式,一种是用多样本集(参见下图a), 另一种是增大效应值d(下图b)。

Imgur

所以做试验要有尽量多的生物学重复,会适当减小统计功效太小的问题。

单词本

英文 中文 英文 中文
controversial 有争议的 oxymoron 矛盾形容法,逆喻
triumph 巨大胜利 sonogram 超声波图
identical 全等的 fraternal 兄弟的
identical twins 同卵双胞胎 fraternal twins 异卵双胞胎
odds 几率 pundit 评论员
impeccable 无可挑剔 violator 违犯者
parlance 腔调,说法,用语 fueled 激起
repetition 重复 dispute 辩论
interim 暂时的 corollary 必然结果
firmly 坚固的 bust 破产
fire hose 灭火水龙带 disparate 完全不同的
intensely 强烈的 jujitsu 柔术,柔道的旧称
coined 创造 statistical power 统计功效
bleak 暗淡的,没指望的 fiscal 财政
rigor 严格的 dire 可怕的
unethical 不道德的 postulate 假定
noncentrality parameter 非中心参数 reassess 再评估
effect size 效应值