贝叶斯理论在21世纪的作用,统计功效与样本大小
今天看了两个短篇,大神Efron给science在2年半前写的贝叶斯理论在21世纪的作用Bayes’ Theorem in the 21st Century
;
Nature Methods有个系列讲统计显著性points of significance之中的Power and sample size
。
重新读完之后感到,统计和生物是密不可分的,做生物不懂统计,得到的结果就失去了指导实践的意义。
Efron大神的短篇主要讲贝叶斯是非常有用滴,从1763年至今,越来越有用,在上世纪50年代我们有了经验贝叶斯这个工具。 该工具在新世纪的大数据统计中焕发光彩。贝叶斯统计让Nate Silver在2012年美国总统大选中百分百预测了50个州的结果。 现在我们还可以结合FDR来用这个工具。当然,贝叶斯也不是万能的,我们总要有其他工具来检测我们的贝叶斯结果是否合理,就是频率理论。 Efron的文章中用词具有多样性,写作时应该学习。
关于显著程度
我们总是说某个假设检验结果显著,那么究竟怎么样才叫真正的显著呢?起码type I error 在0.05,统计功效(整体1减去type II error)在0.80。
如下图中的b所示,即便功效达到0.8,也有可能出现阳性预测率仅仅为0.64的情况。这是因为只有10%的假设是有效的(not null)
用效应值\(d=(\mu_A-\mu_0)/\sigma\)可以来度量零假设分布和备择假设分布之间的差异。
理想情况下,我们希望在type I error 一定的情况下,power越大越好。 达到这个目的有两种方式,一种是用多样本集(参见下图a), 另一种是增大效应值d(下图b)。
所以做试验要有尽量多的生物学重复,会适当减小统计功效太小的问题。
单词本
英文 | 中文 | 英文 | 中文 |
---|---|---|---|
controversial | 有争议的 | oxymoron | 矛盾形容法,逆喻 |
triumph | 巨大胜利 | sonogram | 超声波图 |
identical | 全等的 | fraternal | 兄弟的 |
identical twins | 同卵双胞胎 | fraternal twins | 异卵双胞胎 |
odds | 几率 | pundit | 评论员 |
impeccable | 无可挑剔 | violator | 违犯者 |
parlance | 腔调,说法,用语 | fueled | 激起 |
repetition | 重复 | dispute | 辩论 |
interim | 暂时的 | corollary | 必然结果 |
firmly | 坚固的 | bust | 破产 |
fire hose | 灭火水龙带 | disparate | 完全不同的 |
intensely | 强烈的 | jujitsu | 柔术,柔道的旧称 |
coined | 创造 | statistical power | 统计功效 |
bleak | 暗淡的,没指望的 | fiscal | 财政 |
rigor | 严格的 | dire | 可怕的 |
unethical | 不道德的 | postulate | 假定 |
noncentrality parameter | 非中心参数 | reassess | 再评估 |
effect size | 效应值 |