云上GWAS使用说明
一、当前孟德尔随机化分析的痛点
IEU数据库的502报错——难以完成MR分析
数据下载缓慢易中断——难以下载最新的数据
笔记本处理大批量数据很崩溃——严重影响MR分析的效率
二、云上GWAS三大优势,直击上述痛点
IEU网站的所有数据已下载导入网站——无需担忧服务器502问题
官方网站发表的高质量GWAS数据——已下载清洗好,可直接使用
MedicineIT的云上GWAS数据所有数据均可代码包调用——高效一键分析
三、云上GWAS包含哪些数据
1.芬兰R9-2272条数据
编号开头:finngen_R9 https://flash0926.yuque.com/org-wiki-flash0926-kivyu0/dls869/akuhdb5c4lb6s6a1
来自芬兰数据库最新R9版本的数据,数据更新比较及时,MR-PheWAS的优质数据库
2.UKB-PPP 全蛋白质组数据
编号开头:ukb-ppp (https://www.synapse.org/#!Synapse:syn51364943/files/)
2023年10月刚发布的最新数据,UKB-PPP项目使用Olink平台对54,219名参与者的血浆蛋白质组学特征进行了表征,并收集了2,923种蛋白质的数据
下载非常麻烦,需注册,登录,专门的软件下载,还有网速和电脑要求,未解压缩时大约2T,下载后需要进行数据清洗后方能使用!普通的笔记本电脑及个人电脑难以完成该操作!
一时间网上对于UKB-PPP数据的使用和价格炒到了2500-5000元,但是即便是买了这个数据,也很难保障其完整有效性,还需要进一步转化方正常使用!
药物靶点、全蛋白组优质数据
3.UKB-Saige
编号开头:ukb-saige https://pheweb.org/UKB-SAIGE/
收集了1403个数据中,case病例数超过500的783个表型,可以进行分类,MR-PheWAS的优质数据库
4.新1400血浆代谢组-2023年5月
编号开头: ebi-met1400 https://flash0926.yuque.com/org-wiki-flash0926-kivyu0/fh8cil/yh7o2ewcgkl9xiai
ebi上,catalog编号GCST90199621~GCST90201020,网站已不开放下载
5.免疫细胞731个数据
编号开头:ebi-a (https://flash0926.yuque.com/org-wiki-flash0926-kivyu0/fh8cil/qrvqh0z794ez312h
数据来源catalog上重新清洗的731免疫细胞数据,id和OpenGWAS上保持一致
6.91炎症因子
编号开头:ebi-IPs91 https://flash0926.yuque.com/org-wiki-flash0926-kivyu0/fh8cil/ttb6gwyglsb0xzgh
2023年全新炎症因子GWAS,暂时未有发表的MR文章引用
7.克隆血GWAS
编号开头:ebi-ch5 https://flash0926.yuque.com/org-wiki-flash0926-kivyu0/fh8cil/fx5r843i2pkbyy0o
2022年克隆血数据
8.正在进行加入的数据
- 脑脊液代谢组
- 3143+3935 UKB MRI影像学数据
- 91线粒体pqtl数据
- ieu OpenGWAS上收录的数据,正在进行最终导入阶段
- 更多质量更好的数据持续更新
四、如何使用
1.检索需要的id
我们提供了一个高效地检索网站,可以方便地检索自己想要地数据👍
阈上医学·云上GWAS (medicineitlab.com)
2.安装R包与进行分析
获取数据需要使用专用的R包FastGWASR,安装方法比较简单,只需要简单几步即可完成👍
如何快速获取云上GWAS数据 | 阈上医学 (medicineitlab.com)
3.积分规则及获取方式
云上GWAS积分规则 | 阈上医学 (medicineitlab.com)
五、进群方式
关注公众号添加任意一个客服,进群了解先锋计划更多详情