GRO-seq(Global Run-On Sequencing)测序技术可以在整个基因组范围上绘制参与转录的RNA聚合酶的位置、数量并进行定位。在这个技术下,激活的RNA聚合酶II可以在有Br-UTP(Br标记的三磷酸尿苷)的条件下继续反应,RNA会水解并被有Brd-UTP抗体的磁珠抓住(纯化)。洗下来的RNA在逆转录成cDNA前要进行去帽处理和末端修复。对于cDNA的测序结果反映了正在细胞内被RNA聚合酶II转录的RNA。

GRO-seq

技术优点:

  1. 可以map正在转录中的RNA聚合酶II的位置
  2. 确定转录位点的相对活性
  3. 检测正义和反义转录
  4. 检测全基因组转录
  5. 不需要已知转录位点的位置

技术缺点:

  1. 由于必须在存在标记核苷酸的情况下进行转录,该方案仅限于细胞培养物和其它人造系统
  2. 在准备核苷酸的过程中可能会有人造添加剂的干扰
  3. 新的转录起始事件可能会在转录时发生 (New initiation events may occur during the run-on step) 没能理解这句话的含义。
  4. 物理障碍可能阻断聚合酶的活动

摆动指数是用来预测未来短期内的价格变化的:当摆动指数曲线穿过零值水平线(可以想象成x轴)向上运动时,价格会短时向上运动;当摆动指数曲线穿过零值水平线向下运动时,价格会在短时期内向下运动。

Swing_Index

计算方法参见:http://www.marketinout.com/technical_analysis.php?id=100

这种介绍技术指标的网站挺多的,上面的计算方法参考网站也全面介绍了各种技术指标。


accumulative_swing_index

累积摆动指数是摆动指数的加强版,如果累积摆动曲线在上升趋势线的下方,这是一个买入信号,如果累积摆动曲线在下降趋势线的上方,是一个卖出信号。 总之,累积摆动曲线是一个确认买入卖出信号的工具。


众所周知,GitLab.com 在今年年初上演了一场惊天大戏——从删库到直播。 最近一段时间GitHub也经常down个十几分钟,据说是断电引起的。

GitHub_down Reason_of_GitHub_down

为了避免工作上的不便,是时候使用远程同步到多个git仓库了!!

前不久由于在考虑跳槽,想把现在的工作都保存到云端以免丢失。自从硬盘挂了之后就对自己电脑上的存储设备不再信任,但是存“别人”硬盘上,也肯定不能保证一点问题都没有,例如Apple云同步有权限删除大于180天的资料。由于现在的工作都是在GitHub私有仓库里进行的,考虑到直接复制到硬盘占地方又有设备之间同步的问题,所以干脆把仓库同步到其他远程git仓库服务中。

方法是从stackoverflow上复制下来的,仅此备份。

我已经在本地有一个名叫cn的仓库,同步到gitlab,现在想把这个仓库也同步到github,操作如下:

## 以https://github.com/yulijia/cn 为例
## 首先cd到仓库相应目录
## 不需要 Git 初始化 git init
## 添加备份仓库地址(在此之前要在备份仓库网站创建相应的空白仓库)
git remote add alt git@github.com:yulijia/cn.git
## Git 添加文件信息
git add .
git commit -m "git init push"
## push到备份地址
git push --set-upstream origin master

之后每一次添加commit的push操作都要用两次git push,这样才能将本地内容分别备份到两个云端仓库中。


今年KDD cup由阿里巴巴天池承办,比赛的题目是预测汽车通过高速公路闸口的时间,以及高速公路入口到闸口的车流量,这是一个时间序列预测类的问题,同类问题很多都属于经济学方面。

预测方法就是提取前6个时间段的信息,预测后6个时间段的结果。训练数据量大约3个月左右。

这题麻烦在从题目中的各种表格中提取特征,以及预测时训练集合的组成(究竟用每个路口的数据预测,还是一个路口一个路口来训练预测)。很明显比赛题目中的缺失数据是硬造出来了,给数据整理带来了不少麻烦。

灰师弟和我一起参加了比赛(分别做1,2题,两个人选题不一样),前后一共忙活了20天,他的成绩比我好,mape 0.23 我的在0.3到0.6之间徘徊 _-_

废话不多说,总结一下从中学习到了什么新东西:

  1. 比起R,python在机器学习方法上的包内容更全面,也更好掌握
  2. 完整的实现了R中xgboost方法的tune步骤,借鉴了这个脚本,比caret包好用。
  3. objective function 几乎忘光了,要重新捡起来,我觉得构造这个方程很有意思。
  4. 关于一个一个路口预测还是整体一起预测的问题,整体一起预测的效果会好一些。
  5. 有一个同boosting相关的时间序列包叫forecastxgb,官方推荐的入手点,测试了一下,计算速度慢,结果也不好。

最后还要唠叨一句,十年河东,十年河西,今年的KDD cup平台不好用,选手登录都不方便。论坛里各种中文发帖交流,我估计都没几个外国选手参加。最后还出现了竞赛“丑闻”,不知道是不是有人蓄意抹黑还是真的有这种事情发生。

数数据竞赛,还看Kaggle!