2022-05-12 21:38 湖南师范大学 Java

关注

refseqID转换为geneID

refseqID转换为geneID（2018-06-05）

简单点lili已关注

0.2492018.06.05 13:39:02字数 191阅读 3,260

1 refseqID转换成geneID

下载gene2refseq.gz

wget -c ftp://ftp.ncbi.nih.gov/gene/DATA/gene2refseq.gz

2 提取相似物种的基因

gene2refseq.csv文件较大，有4G多，所以将blast比对过的物种中的提取出来，在进行ID转换。

首先查找物种的分类号
Glycine max 3847
Cicer arietinum 3827
Medicago truncatula 3880
vitis japonicus 29760
Homo sapiens 9606
Citrus sinensis 2711
Theobroma cacao 3641
Zea mays 4577

grep命令(例)

grep ^9606 gene2refseq1 | grep ^38 gene2refseq1 | …

cut命令合并（应该不会写脚本）
```
cut  gene2refseq* > gene.csv 
```

(得到的两个文件：gene.csv和db_blast3.csv)

3 R语言-merge函数

merge函数的声明:

merge( x, y, by = intersect(names(x), names(y)),
by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all,
sort = TRUE, suffixes = c(".x",".y"),

incomparables = NULL, ...）

#merge过程中两个文件匹配行一致，不然会报错。

DF1<-read.csv("lyr/rna-seq/blast/geneID/gene.csv") #读取gene.csv
DF2<-read.csv("lyr/rna-seq/blast/geneID/db_blast3.csv") #读取db_blast3.csv
dim(DF1) #看一下表格维度
dim(DF2)
merge(DF1,DF2,by ="RNA_nucleotide_accession.version", all.y = TRUE)
data1<-(merge(DF1,DF2,by ="RNA_nucleotide_accession.version", all.y = TRUE)) #将merge结果写道data中
write.csv(data1, file = "result_data.csv", quote = FALSE, row.names = FALSE) #输出文件为result_data.csv

接着看result_data.csv中基因的功能。

全部评论

推荐最新楼层

12-05 10:08

滴滴_运维开发工程师(准入职员工)

滴滴内推，滴滴内推码

🔥滴滴一二三面 技术面 面经后端最近结束了滴滴的面试，三轮技术面问得超细致❗️整理了完整面经和思路分享给大家👇——————🧩一面 60min•RocketMQ vs Kafka 区别（设计理念/吞吐/延迟）•Redis性能核心：内存+I/O多路复用原理•Redis数据结构选型场景实战•MySQL与Redis一致性方案（旁路缓存策略）•协程原理剖析：Goroutine底层调度模型•Lua脚本实现原子库存扣减•MySQL索引优化与B+树优势•防超卖方案：分布式锁+库存校验•算法：搜索旋转排序数组（二分变形）——————🧩二面 60min•List遍历删除的坑（迭代器失效问题）•MySQL索...

点赞评论收藏

分享

12-07 20:48

门头沟学院 Java

美团后端一面

1.介绍一下平衡二叉树，复杂度是多少2.@Autowired底层是怎么实现的？3.Bean是如何管理的？4.添加索引的好处和坏处5.JVM的垃圾回收期有几种回收的算法？推荐看深入了解JVM（这本书是必看的）6.谈谈Spring的作用？7.SpringCloud微服务之间的调用，底层是怎么实现的？8.场景题，10亿数据与10亿数据的查询9.Mysql存储大量数据会怎么样？（应该从B+树那里回答）10.布隆过滤，原理以及怎么优化11.快速查询的数据结构，haxi12.Mysql中一张数据表能够存储多少数据？13.二叉树的层序遍历（算法）

查看13道真题和解析

点赞评论收藏

分享

11-04 19:05

已编辑

东莞城市学院单片机

这offer是不是不太对劲啊

这offer是不是不太对劲啊

不知道怎么取名字_：你这个要实习两年？哪有这么久的，感觉就是即使你毕业了，但还按实习的话，是不是不用给你缴社保公积金啥的

点赞评论收藏

分享

10-25 07:35

西南石油大学后端工程师

团子实习第一周

累是真的，发现有好多互联网名词要学一直以为大厂里每个人都是忙忙碌碌的，不是在对齐就是在对齐的路上。但这一周下来，感觉他们和学生一样，踩点打卡、快走抢饭（不然要排队），不同级别之间的沟壑也不大，敢于说出自己的观点。下周赶紧把需求写完，尽量让自己产出多一些ps:这袋鼠真的好乖啊

牛客31544035...：美团很好，第一个实习的公司，技术基本功很扎实

点赞评论收藏

分享

昨天 09:12

湖南农业大学 C++

数字马力选人标准

之前参加过那个校企合作的项目，估计校招差不多，是看前面几面综合成绩，包括笔试，一面二面三面，bg，综合排序来的

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

华为进展交流圈

热聊中

创作者周榜

更多

正在热议

更多

# 找工作能把i人逼成什么样 #

8373次浏览 92人参与

# 大学最后一个寒假，我想…… #

70346次浏览 713人参与

# 百融云创求职进展汇总 #

23749次浏览 181人参与

# 0经验如何找实习？ #

19966次浏览 356人参与

# 大家每天通勤多久？ #

63102次浏览 407人参与

# 你今年做了几份实习？ #

6384次浏览 97人参与

# 度小满求职进展汇总 #

17461次浏览 87人参与

# 大厂面试初体验 #

82456次浏览 373人参与

# 面试尴尬现场 #

201962次浏览 782人参与

# 字节出了豆包coding模型 #

5770次浏览 58人参与

# 你的秋招第一场笔试是哪家 #

274101次浏览 2066人参与

# 双非本科的出路是什么？ #

184514次浏览 1481人参与

# 你还有多少年退休？ #

29919次浏览 195人参与

# 你开始找寒假实习了吗？ #

11465次浏览 171人参与

# 你找工作经历过哪些骗局？ #

7210次浏览 120人参与

2690次浏览 17人参与

# 打工人的工作餐日常 #

76193次浏览 520人参与

# 实习越久越好，还是多多益善？ #

14398次浏览 143人参与

# 工作两年想退休了 #

201809次浏览 1783人参与

# 25年找工作是什么难度？ #

11596次浏览 113人参与

# 一起聊华为 #

166126次浏览 809人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务