中国(浙江)卫生健康科技研发与转化平台

该项目已经在英国境内采集40至69岁人群中50万份志愿者的基因信息和血液样本、生活方式及环境暴露数据,并跟踪记录他们之后数十年的健康医疗档案信息。

二、UKBiobank数据库有哪些重要信息?

1、流调数据

(2)环境因素。调查问卷考虑了大量潜在的环境暴露,选择被认为是常见疾病影响的指标,这些问题包括当前住址、出生时的居住地、职业和其他工作场所因素、被动吸烟暴露、室内空气污染和使用手机频率。

(3)饮食习惯。主要是包括食物频度问卷、24小时饮食回忆和多天饮食回忆问卷。

(4)参与体育活动情况。主要是体力活动强度(剧烈、适度),体育活动频率,关于常见久坐活动的问题也被纳入。

(5)心理和认知状态。在心理状态方面,调查问卷的方法是在标准化问卷的基础上评估心理特质和情绪,并记录影响心理症状的严重事件及其医学表现。

2、体格检查

身体测量指标。当志愿者完成问卷后,接下来会进行一系列的身体测量过程,包括血压(和脉搏)、身高、体重、腰围、臀围、握力、肺活量、骨密度数据。

3、生物样本检测、组学检测

4、电子医疗记录数据

UKBiobank数据库大样本、前瞻性、精细化的特点

这项数据库中,包含有大量的疾病数据。见下图:

三、UKBiobank申请流程

研究者在申请UKBiobank研究数据和生物样本前,需在UKBiobank官方网站注册一个AccessManagementSystem(AMS)账号。

在AMSLogin页面中,点击「SignuptoaccessUKBiobankresources」按钮,进入Signup页面。

需要特别注意的是,因为国内服务器限制的原因,reCAPTCHA验证通常加载不出来,这时候可以通过委托国外的朋友或使用一些插件来解决。

在申请提交后,会出现提示页面,表示申请正在审核,正常情况下需3~5个工作日。

四、UKBiobank研究资源检索

注册成功后,即可在AMSLogin页面(图2)中输入Uesrname和Password登陆。

「Showcase」一栏是对UKBiobank数据的展示,研究者可通过所需的数据字段对数据库进行检索。

这些类别包括:

1)Populationcharacteristics,人口特征,这个类别包含参与者的一般特征数据。

2)UKBiobankAssessmentCentreUKB评估中心,这一类别包含了评估中心收集的信息,并根据评估的类型(如触屏、语言面试、身体测量、生物采样)被分为子类别。

3)Biologicalsamples,生化样本,该类别包含UKB在评估中心采集后收到的生物样本的类型和数量信息(样本清单),以及进行的测定及其结果。

4)Genomics,基因组信息,UKB目前包含以下基因组数据,488,000名参与者的基因型及其填充数据,5万参与者的外显子组序列,50名参与者的全基因组序列。

5)Onlinefollow-up,在线的随访数据,此类别包含基于UKB使用在线问卷进行的额外评估的信息。

6)Additionalexposures,额外的暴露因素,这一类别包含基于在评估中心以外进行的其他评估的信息。

这七个大的类别下面还有小的类别,小的类别还可以分更小的类别,有三个level的数据。

当然,也可以直接进行搜索,通过UKB官方网站进入DataShowcase,点击Search,进入Search界面。

但是如何寻找我们感兴趣的数据呢,使用Category前提是需要我们知道感兴趣的数据的类别,比如我们想知道UKB数据中是否含有VitaminD的数据,我们需要知道VitaminD是生化指标,一般是从血液中检测,血液又属于生物样品类别,因此我们直接找到Browse里面的Biologicalsamples数据集,这个数据集又包括了Bloodassays、Salivaassays和Urineassays数据,在这里我们就知道应该从Bloodassays数据集寻找数据Bloodbiochemistry,在这个数据集中,我们最终找到了VitaminDaliquot(FieldID30890),VitaminDassaydate(30891),VitaminDcorrectionlevel(30893),VitaminDcorrectionreason(30894),VitaminDmissingreason(30895)和VitaminDreportability(30896)。最后我们根据FieldID号(后面会再次介绍)在自己数据中就能定位到数据了。

UKB数据使用介绍

当我们通过UKB的申请后,会收到一封包含32字符MD5校验和64字符的电子邮件,UKB中的数据都是保存在一个安全的在线存储库中,所有标准数据下载后必须解密并转换成合适的格式才能使用。

第一步,需要下载三个帮助程序来解密和转换数据,“ukbmd5”,“ukbunpack”,和“ukbconv”。这些程序可以从UKB主网站的DataShowcase中的download下载,帮助程序可以选择Windows系统跟Linux系统下版本。但是使用Windows系统的研究者来说,需要使用命令提示符窗口下运行(可以使用Windows+R进入,但是路径需要跟三个帮助程序下载的位置保持一致),Linux系统需要在终端运行命令。除了上述的三个帮助程序外,在ukbconv转换数据过程中,还需要一个“encoding.ukb”的文件用于将编码定义分配给数据集中的变量,这个文件是兼容Windows跟Linux系统的,这个文件也需要跟上面的帮助程序在一个文件中。

第三步,数据解密和转换过程,如果是选用的Windows系统的,需要进入命令提示符窗口,然后进入到帮助程序及加密数据集所在的目录下(cd+位置信息),接下来需要验证加密数据集的完整性,输入命令ukbmd5filename(加密数据集名字),运行此命令时产生的MD5的值应该与通过电子邮件提供的MD5值相同。如果值不同,则应删除文件并重新下载数据。当加密数据集通过验证后,接下来需要ukbunpack程序进行加密数据集的解密和解压为一个自定义的UKB格式,所用到的命令是1,ukbunpackinputfilekeyvalue,其中keyvalue表示来自通知电子邮件的64个字符的密码。命令2,ukbunpackinputfilekeyfile,keyfile是包含密码的纯文本文件的名称。默认情况下,下载的文件命名为“ukbN”。,其中N是整数(申请号)。将解压缩此名称的文件以生成“ukbN.enc_ukb”。

到这一步,我们已经有了基本的数据,利用ukbconv程序(ukbconvinputfileformat)可以将此数据集“ukbN.enc_ukb”转换为各种标准格式,例如csv,docs,sas,stata,r等数据格式,便于利用相应的软件进行后续处理分析,另外如果申请的数据量非常大的话,而分析只是用到一部分数据的话,我们还可以从ukbN.enc_ukb数据中提取用到的一部分数据,所用到的命令是ukbconvinputfileformatflagfile-ID,Flag,主要是包括:

1)-i后面跟一个txt文件,这个文件是一个每行都有一个字段Field-ID号的txt文件(例如VitaminD30890),需要提取的数据的Field-ID号都放进这个txt文件中,最终提取的数据就是含有这个txt的Field-ID的数据集。

2)–x,但是-x是原始文件中去除掉所在txt文件标注的Field-ID号,提取剩余的数据。

3)–o,为输出文件指定一个替代名称。

4)–e,指定要从其它文件中提取编码信息的,默认是“encoding.ukb”。由于原始文件一般很大,提取数据非常耗时,因此我们一般是从Linux系统中进行提取数据,用到的命令如图七,

图七,Linux系统下进行数据的提取

如何申请UKbiobank的研究数据和生物样本?

在了解数据和样本的基本情况后,若要下载使用数据和样本,则需进行申请。

全部填写完成后点击「Submitform」即可提交申请。

在申请中要注意,研究者需明确是否仅申请研究数据还是需要申请生物样本或与参与者重新联系,后两者的申请需经过更严格的科学性或伦理性审查。

申请的数据或样本不是免费提供,费用取决于所批准的研究项目需要的数据和样本量的大小。

需要注意的是,在研究者提交申请后,UKBiobank管理团队的审核委员会会分小组对每一份申请进行科学性审查,最终确定批准或拒绝申请。

小结

随着大数据时代的到来,基于大样本人群的研究对于医学的发展和促进人群健康具有重要的意义。而对于医学科研工作者来说,UKBioBank数据是不可多得的宝贵资源。

THE END
1.梅斯医学最佳午睡时长出炉!Science:午睡半小时,大脑“重启”,进入最佳状态!小睡提升认知的原因终于找到了! 2024-12-18 07:35 76岁老人被接到莆田平安医院“免费”做手术,家属质疑医院存在“骗保”行为 2024-12-18 07:35 中国专家合著文章闪耀Circulation,共谋心血管健康事业新辉煌 https://www.163.com/dy/media/T1633768609863.html
2.CurrentMedicalScience投稿信息Current Medical Science 出版年份:2002年文章数:617投稿命中率:开通期刊会员,数据随心看 出版周期:Bimonthly自引率:14.2%审稿周期:开通期刊会员,数据随心看 前往期刊查询 期刊讨论|中国SCI论文|期刊主页|投稿经验|杂志官网|投稿链接|作者需知|PMC链接|Pubmed全文检索https://www.medsci.cn/sci/journal-discuss?id=c8c47265
3.科学网—CurrentMedicalScience期刊介绍Current Medical Science(简称CMS),中文刊名《当代医学科学》,是一本综合性医学英文SCI期刊,由华中科技大学主办,同济医学院期刊部承办,双月出版,入选中国科技期刊“卓越行动计划”,湖北省科技期刊“楚天卓越行动计划”,连续多年入选“中国最具国际影响力学术期刊”、“中国国际影响力优秀学术期刊”。 https://wap.sciencenet.cn/home.php?mod=space&uid=3588992&do=blog&id=1441529
4.梅斯医学医路相伴,成就大医梅斯医学App——医路相伴,成就大医,内容涵盖临床科研和临床实践,为各级临床医生提供智慧、精准的决策支持,是临床医生职业成长的良师益友。 梅斯医学App——每天一小步,职业一大步! 亮点功能: 【权威资讯】:每日更新200+篇涵盖30+个学科前沿的特色资https://apps.apple.com/hu/app/%E6%A2%85%E6%96%AF%E5%8C%BB%E5%AD%A6-%E5%8C%BB%E8%B7%AF%E7%9B%B8%E4%BC%B4-%E6%88%90%E5%B0%B1%E5%A4%A7%E5%8C%BB/id1012163770?see-all=customers-also-bought-apps
5.LetPubCurrentMedicalScience影响因子2.000分,是几区,2023LetPub整理了最新的Current Medical Science 期刊投稿经验, 期刊官方投稿网址,影响因子,审稿周期/时间,研究方向,SCI期刊分区,中国作者发表的文章等信息, 以供中国作者投稿前参考。http://www.letpub.com.cn/index.php?journalid=10842&page=journalapp&view=detail
6.梅斯医学MedSciHealthcareMedSci - medical portal Online Medical Education Bioon - Pharma industry portal Bioonline - Life science portal BioInsight - Industry consultant Recent Posts 医学策略 医学教育与培训 竞争情报 品牌/产品战略 关于梅斯医学 中国数字化医学领导者,利用医学专业能力与人工智能等科技为中国医疗行业提供全面的产品与http://www.medscihealthcare.cn/
7.梅斯网站我们独特的学术匹配方式可确保您的论文被分配给具有专业知识的高素质语言专家。在了解您的需求后,我们能够提供更多定制服务。 客户 安徽医科大学 北京武警总医院 首都医科大学 重庆医科大学附属儿童医院 中国医科大学附属医院 重庆医科大学附属第一医院 南京医科大学第一附属医院 中山大学附属第一医院 第四军医大学 广州http://editing.medscihealthcare.com/dist/medsci-order/
8.2020年JAMA十大医学研究与发现丨梅斯评述澎湃号·湃客转眼间,2020年已接近尾声,这一年里 JAMA杂志又发了很多有意义的重磅级研究成果,本文梅斯医学选取一些重磅级研究,带您一起回顾JAMA系列期刊最有价值的研究进展。 JAMA系列期刊 JAMA(JAMA: The Journal of the American Medical Association)《美国医学会杂志》系列期刊由美国医学会出版的官方杂志,创刊于1883年,迄今已https://www.thepaper.cn/newsDetail_forward_10585523
9.这10个网站,真的打死也不能删!官网:https://www.webofscience.com/wos/alldb/basic-search 这是一个全学科数据库,也是全球权威的数据库,有非常丰富的资源,收录了全球多种权威的国际学术期刊,包括SCIE(科学引文索引扩展版)、SSCI(社会科学引文索引)、AHCI(艺术和人文学科引文索引)以及CPCI(会议记录引文索引)数据库的全部回溯数据。 https://zhuanlan.zhihu.com/p/689437892
10.ScienceDirect–國立艦炒髮W圖書館參考服務部落格」一文中介紹過,ScienceDirect 這種典型的資料庫,是屬於出版商將自家出版品電子化的產品,相較於索引摘要型的資料庫,其涵蓋內容較少、且有侷限性;但其優點是,只要是本館有訂購的刊物與年份,都可以直接下載全文,且最新卷期上線快速,因此仍有許多使用者會直接進入此類資料庫查詢文獻。尤其 ScienceDirect 因為與 SCOPUShttp://tul.blog.ntu.edu.tw/archives/tag/sciencedirect
11.JAMANetworkOpenExplore the latest research in hypertension, diabetes, stroke, Alzheimer disease, and more, all completely free and open accesshttps://jamanetworkopen.jamanetwork.com/
12.《新英格兰医学杂志》回溯数据库《新英格兰医学杂志》(The New England Journal of Medicine,简称NEJM) 是由马萨诸塞州医学会(Massachusetts Medical Society,简称MMS)所出版的经同行评审的综合性医学期刊,出版生物医学科学与临床医学领域具有重要意义的医学研究新成果、综述文章等,内容涉及20多个专业学科领域。1828年改为周刊型态出版。《新英格兰医学https://www.las.ac.cn/front/dataBase/detail?id=4c2582538d7549518e0ea52d884791f2
13.MEDICALSCIENCEMONITOR好投中吗MEDICAL SCIENCE MONITOR涵盖了医学科学的各个领域,包括临床医学、基础医学、药理学、生物医学工程等,为读者提供了一个全面了解医学科学研究进展的平台。期刊影响因子超过3分,收稿范围广、对国人友好、学术水平高,非常适合相关同学关注投稿。 时间急,投稿总被拒? https://m.peipusci.com/news/4991.html
14.资源动态《新英格兰医学杂志》(TheNewEnglandJournalof《新英格兰医学杂志》(The New England Journal of Medicine) 是由马萨诸塞州医学会( Massachusetts Medical Society)所出版的同行评审医学期刊和综合性医学期刊,1812年由约翰?柯川博士创办。NEJM至今已连续出版超过200年,现在NEJM是世界上阅读、引用最广泛、影响力最大的综合性医学期刊。NEJM 集团出版的期刊还包括NEhttps://library.suda.edu.cn/2022/0929/c4023a510745/pagem.htm
15.NEJM杂志官网1811年,美国马萨诸塞州波士顿内科医师John Collins Warren和James Jackson创办季刊《New England Journal of Medicine and Surgery and the Collateral Branches of Medical Science》,是新英格兰历史上第一份医学期刊,1812年1月在波士顿发行第一期。于1818年,它与《Boston Medical Intelligencer》合并,改为周刊。1921年,https://www.zhanlian.net/sites/7122.html