来源:丁香科研

当你以为公开数据库都是外国创建时,这些国家级数据库带你领略不一样的科研中国、数据中国。

了解中国医疗现状,其实我们还能从以下这些数据库中获取信息,接下来笔者就给大家分享几个国内的数据库。

NO.1 国家基因组科学数据中心

(网址:https://ngdc.cncb.ac.cn/?lang = zh)

国家基因组科学数据中心(National Genomics Data Center,简称 NGDC)已发布了15 大数据资源体系、40 个数据库

涵盖生物项目数据、生物样本数据、组学原始数据、基因组序列、基因组变异数据、生物信息工具等,形成了重要的国际影响力。

2020 年,NGDC 开发了 8 个全新数据库(2019nCoVR,Aging Atlas,BrainBase,CGIR,GTDB,LncExpDB,scMethBank 和 TransCirc)。

更新和丰富了多个核心数据库资源(BioProject,BioSample,GSA,GWH,GVM,GEN 和生物多样性资源等)。

涉及疾病、衰老、调控和生物多样性等多个前沿领域,初步形成我国生物数据安全汇交管理和多组学数据平台的国家中心数据资源体系。

其中,「2019 新型冠状病毒信息库」是目前全球收录信息最全和访问最多的新冠病毒序列信息库之一,它始终保持全球最新、最完整的新冠病毒基因组数据发布动态。

GVM(Genome Variation Map)是国内规模最大的多物种基因组序列变异库。

NGDC 免费向国内外用户提供方便快捷的多组学数据汇交和存储服务。

截至 2020 年 12 月,已汇交来自 343 个单位 1206 个用户递交的超过 6PB 的组学数据,相关数据发表于 203 种国内外期刊的 466 篇文章。


图片来源:国家基因组科学数据中心官网

NO.2 国家微生物科学数据中心

(网址:https://nmdc.cn/)

国家微生物科学数据中心(National Microbiology Data Center ,NMDC)数据记录数超过 40 亿条。

数据内容完整覆盖微生物资源、微生物及交叉技术方法、研究过程及工程、微生物组学、微生物技术以及微生物文献、专利、专家、成果等微生物研究的全生命周期,承担微生物领域科学数据汇交管理、共享与服务工作。

NMDC 具有以下特点:

①国家微生物科学数据中心发布的数据编号,可在国际期刊直接使用。

②支撑中国科学家发表文章时的数据存储、共享。

③支持微生物样本、核酸序列、微生物基因组、微生物元基因组、转录组、蛋白质结构、期刊附件等多种类型数据提交。

④支持国家重点研发计划、科技资源调查专项、国际合作专项等项目数据汇交。

⑤数据当日提交三个工作日内完成审核并发放编号。

⑥为每条数据提供唯一标识符。


图片来源:国家微生物科学数据中心官网

NO.3 国家人口健康科学数据中心

(网址:https://www.ncmi.cn/)

国家人口健康科学数据中心(National Population Health Data Center, NPHDC),构建包含数据注册服务、汇交服务、长期保存服务、定制化服务、数据接口服务、专题服务、科普服务、应用示范等多维度的国家人口健康科学数据服务体系。

建库至今,NPHDC 已收录 1179 个项目、1.4 万多个数据集,推出「青少年健康主题数据库」、「全人类心理健康科学数据库」、「中国围产期母婴健康监护与 AI 风险预警科学数据库」、「中国流动人口卫生计生动态监测健康数据 (2009-2017 年)」、「典型地区行为活动模式数据库」、「前列腺肿瘤预警数据集」、「糖尿病并发症预警数据集」、「2001-2020 年中国卫生健康事业发展统计数据」8 大特色资源。

提供「中国人成骨不全症变异数据库」、「老年医学专题服务」、「气象环境与健康专题服务」、「国民体质与健康数据库」、「热点传染病预警与追踪」、「卫生决策专题服务」、「脑卒中防治工程管理专项数据库系统」等 13 个主题数据服务,并配套 Tableau、R 等多个数据配套工具服务。


图片来源:国家人口健康科学数据中心官网

NO.4 国家基础学科公共科学数据中心

(网址:https://www.nbsdc.cn/)

国家基础学科公共科学数据中心(National Basic Science Data Center, NBSDC)数据资源覆盖 17 类一级学科、八大基础学科、三大区域和部分基础前沿领域。

以领域科学数据家实验室自主采集或野外观测为主,以及基于自产数据和公开数据融合加工的增值产品,已经系统整合形成了 23 个主题库和专题库。

在线服务数据总量 2.29 PB,数据记录近 10 亿条,形成完善的标准体系、技术体系和软件栈,服务体系全面覆盖「数据服务-信息服务-知识服务」。

除数据库在线查询服务外,平台也针对用户对科学数据进行加工、处理、计算、分析等需求,提供了基于科学数据的在线分析平台、特种数据离线数据处理工具,提供深度服务。


图片来源:国家基础学科公共科学数据中心官网

说了这么多,家人们迫不及待想知道怎么获取这些数据了吧!每个数据库数据获取的方式大同小异,均以「在线提交数据申请」方式以获得官方审批并发送数据下载链接。

接下来笔者以「国家人口健康科学数据中心」为例,来为大家提供 get 免费数据的方式……

Step 1:数据库提供三种在线网络提交申请和注册的方式,分别是:个人账号注册、机构账号注册、合作机构账号注册。


图片来源:国家人口健康科学数据中心官网

Step 2:根据实际情况,任选一种注册途径。个人账号提供邮箱和手机注册方式,普通用户可在系统上浏览、查询和下载数据,以及进行个人数据汇交。

机构账号面向机构用户进行数据注册、汇交、管理和机构标识符申请,挂靠机构的注册用户可在系统上进行机构数据汇交和项目数据汇交。

合作机构账号支持数据加工员账号和数据审核员账号的创建、编辑和管理,以及支持合作机构数据汇交、审核和管理等功能,但仅限与国家人口健康科学数据中心建立合作关系的机构申请。


个人账号—邮箱注册

图片来源:国家人口健康科学数据中心官网


个人账号—手机注册

图片来源:国家人口健康科学数据中心官网


机构账号

图片来源:国家人口健康科学数据中心官网


合作机构账号

图片来源:国家人口健康科学数据中心官网

Step 3:注册成功后登录账号


图片来源:国家人口健康科学数据中心官网

Step 4:以选择「特色资源」中「中国围产期母婴健康监护与 AI 风险预警主题科学数据库」为例,可在数据库详情页中了解基本信息、描述信息、创建者信息、联系信息、引用格式、服务信息、数据关联信息等。

其中,服务信息中,会明确说明数据公开时间、实体数据共享方式、数据使用许可、收费方式、申请流程等。

类似地,「中国围产期母婴健康监护与 AI 风险预警主题科学数据库」属于公开,公益免费、商业收费数据库,数据以 xlsx、png 形式储存,详情页底部即是实体数据申请访问入口,并提供数据引用参考规范及致谢方式。


图片来源:国家人口健康科学数据中心官网

四款国家科学数据中心,有你感兴趣的吗?如果是你的科研领域,戳戳手指去了解一波吧。

我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖PCR、细胞实验、蛋白研究、神经科学、肿瘤免疫、基因编辑、外泌体、类器官等领域,定期分享实验干货、文献解读等活动。

添加实验菌企微,回复【】中的序号,即可领取对应的资料包哦~

【2401】论文写作干货资料(100 页)

【2402】国内重点实验室分子生物学实验方法汇总(60 页)

【2403】2024 最新最全影响因子(20000+ 期刊目录)

【2404】免疫学信号通路手册

【2405】PCR 实验 protocol 汇总

【2406】免疫荧光实验 protocol 合集

【2407】细胞培养手册

【2408】蛋白纯化实验手册

【2501】染色体分析方法汇总

【2502】国自然中标标书模板

【2503】WB 实验详解及常见问题解答

【2504】DeepSeek 论文写作常用口令

【2505】中国科学院期刊分区表(2025 年最新版)

ad1 webp
ad2 webp
ad1 webp
ad2 webp