摆动指数
摆动指数是用来预测未来短期内的价格变化的:当摆动指数曲线穿过零值水平线(可以想象成x轴)向上运动时,价格会短时向上运动;当摆动指数曲线穿过零值水平线向下运动时,价格会在短时期内向下运动。
计算方法参见:http://www.marketinout.com/technical_analysis.php?id=100
这种介绍技术指标的网站挺多的,上面的计算方法参考网站也全面介绍了各种技术指标。
累积摆动指数
累积摆动指数是摆动指数的加强版,如果累积摆动曲线在上升趋势线的下方,这是一个买入信号,如果累积摆动曲线在下降趋势线的上方,是一个卖出信号。 总之,累积摆动曲线是一个确认买入卖出信号的工具。
使用(Push/Pull)多个Git远程仓库
众所周知,GitLab.com 在今年年初上演了一场惊天大戏——从删库到直播。 最近一段时间GitHub也经常down个十几分钟,据说是断电引起的。
为了避免工作上的不便,是时候使用远程同步到多个git仓库了!!
前不久由于在考虑跳槽,想把现在的工作都保存到云端以免丢失。自从硬盘挂了之后就对自己电脑上的存储设备不再信任,但是存“别人”硬盘上,也肯定不能保证一点问题都没有,例如Apple云同步有权限删除大于180天的资料。由于现在的工作都是在GitHub私有仓库里进行的,考虑到直接复制到硬盘占地方又有设备之间同步的问题,所以干脆把仓库同步到其他远程git仓库服务中。
方法是从stackoverflow上复制下来的,仅此备份。
我已经在本地有一个名叫cn的仓库,同步到gitlab,现在想把这个仓库也同步到github,操作如下:
## 以https://github.com/yulijia/cn 为例
## 首先cd到仓库相应目录
## 不需要 Git 初始化 git init
## 添加备份仓库地址(在此之前要在备份仓库网站创建相应的空白仓库)
git remote add alt git@github.com:yulijia/cn.git
## Git 添加文件信息
git add .
git commit -m "git init push"
## push到备份地址
git push --set-upstream origin master
之后每一次添加commit的push操作都要用两次git push
,这样才能将本地内容分别备份到两个云端仓库中。
KDD cup 2017 总结
今年KDD cup由阿里巴巴天池承办,比赛的题目是预测汽车通过高速公路闸口的时间,以及高速公路入口到闸口的车流量,这是一个时间序列预测类的问题,同类问题很多都属于经济学方面。
预测方法就是提取前6个时间段的信息,预测后6个时间段的结果。训练数据量大约3个月左右。
这题麻烦在从题目中的各种表格中提取特征,以及预测时训练集合的组成(究竟用每个路口的数据预测,还是一个路口一个路口来训练预测)。很明显比赛题目中的缺失数据是硬造出来了,给数据整理带来了不少麻烦。
灰师弟和我一起参加了比赛(分别做1,2题,两个人选题不一样),前后一共忙活了20天,他的成绩比我好,mape 0.23 我的在0.3到0.6之间徘徊 _-_
。
废话不多说,总结一下从中学习到了什么新东西:
- 比起R,python在机器学习方法上的包内容更全面,也更好掌握
- 完整的实现了R中xgboost方法的tune步骤,借鉴了这个脚本,比caret包好用。
- objective function 几乎忘光了,要重新捡起来,我觉得构造这个方程很有意思。
- 关于一个一个路口预测还是整体一起预测的问题,整体一起预测的效果会好一些。
- 有一个同boosting相关的时间序列包叫forecastxgb,官方推荐的入手点,测试了一下,计算速度慢,结果也不好。
最后还要唠叨一句,十年河东,十年河西,今年的KDD cup平台不好用,选手登录都不方便。论坛里各种中文发帖交流,我估计都没几个外国选手参加。最后还出现了竞赛“丑闻”,不知道是不是有人蓄意抹黑还是真的有这种事情发生。
数数据竞赛,还看Kaggle!
通过RNA纯化进行染色质分离
Illumina公司有一张特别牛x的poster,叫做 For all you seq,全面记录了目前问世的所有二代测序技术的建库protocol,但是这张poster是加密的,无法分割、提取进行打印。然后,他们又出了一个手册,来介绍For all you seq里的建库方法,叫做Sequencing Methods Review,全手册加上illumina的广告将近200页。我打算从头到尾都看一遍,有兴趣的就写出来分享一下。
对于做生物信息的人,为啥要知道实验上的建库原理?
因为测序数据的第一道处理步骤就是排除并分析建库和测序时产生的错误和误差。为什么会产生这些问题?如何在mapping时排除相应问题,做到准确alignment?
第一部分就从RNA转录开始说起,RNA转录的度量方法分为很多种:
- post-translational modifications 后转录修饰
- RNA splicing 剪接
- RNA bound to RNA binding proteins (RBP) 与RNA相关蛋白结合
- RNA expressed at various stages 在不同阶段的表达量
- unique RNA isoforms 转录本异构体
- RNA degradation 降解
- regulation of other RNA species 调控其他RNA “物种” (我不清楚这句话的意思)
Chromatin isolation by RNA purification
Chromatin isolation by RNA purification (ChIRP-Seq) RNA纯化染色质分离技术是用于定位非编码RNA,例如长非编码RNA及其蛋白同染色质相互作用的位置。
首先进行交联,超声打断,用Biotinylated寡核苷酸对感兴趣的RNA进行杂交,并用链霉抗生物素蛋白磁珠捕获复合物。用RNase H(核糖核酸酶H)处理后,对DNA进行提取和测序。
技术优点:
- 可在基因组全部区域找寻结合位点
- 可发现新结合位点
- 可只对感兴趣的RNA进行相应研究
技术缺点:
- 非特异性的寡核苷酸相互作用会导致对结合位点的错误解读
- 染色质会在预处理阶段降解
- 感兴趣的RNA序列信息必须已知 (这不是废话吗,感兴趣的RNA肯定是已知的,已知的能不知道序列?感兴趣的未知RNA的作用位点,知道了也没法研究啊)