基因信息学数据库(基因数据库哪些分类)
水稻DNA调控元件数据库RiceENCODE的框架结构 华中农大供图
水稻的染色质交互远程网络和浏览器截图 华中农大供图
人类的疾病和动植物的表型性状基因信息学数据库,都与该物种的基因正确表达密切相关。而基因的表达不完全由基因的DNA序列决定,而是同时与DNA调控元件的调控息息相关。
近日,《分子植物》(Molecular Plant )在线发表了华中农业大学教授李国亮和李兴旺团队联合发表的题为最新研究论文。基因信息学数据库他们报道了一个整合水稻多元表观基因组数据的数据库,全面盘点了水稻基因转录调控的“零件库”。
调控元件百科全书计划
论文共同通讯作者李国亮介绍,2003年提出并实施的人类ENCODE计划(DNA调控元件百科全书计划)通过整合DNA、RNA和表观修饰等多个层面的数据建立了多组学的人类基因组DNA调控元件数据库,注释了人类基因组中数以百万计的DNA调控元件,增强了我们对人类功能基因组的理解。同时,ENCODE计划的一系列技术和成果,为后续人类或模式生物基因调控的功能挖掘提供了极大帮助和支持。
水稻是我国乃至世界重要的粮食作物,同时也是基础研究的重要模式植物。“水稻基因组DNA顺式调控元件的注释和鉴定,对理解水稻基因表达调控机理有重要意义。”论文共同通讯作者李兴旺说,因此,一个整合了水稻多元表观基因组数据的数据库,将极大地方便研究人员查询和分析水稻的表观遗传信息,促进水稻表观和三维基因组研究。
李国亮说,基因的正确表达,相当于一个机器的正常运行,需要各个零件的正常工作。而水稻基因表达涉及多少零件,以前的知识是零散的。
该数据库基于团队此前发表的水稻20个品系参考表观基因组图谱(https://www.nature.com/articles/s41467-020-16457-5)和水稻高分辨率三维基因组结构数据 (https://www.nature.com/articles/s41467-019-11535-9),收集了公开发表的水稻多品种多组织多维度的表观基因组信息,展示了水稻不同类型的染色质调控元件,立体地呈现了水稻品种和组织间复杂的基因表达调控关系。
“这是参照人类ENCODE计划,推进水稻功能基因组研究的重要一步。”李国亮说。
最完整的“零件库”
该数据库收集了包括ChIP-seq, ATAC-seq, MNase-seq, FAIRE-seq, BS-seq, RNA-seq, ncRNA-seq, Hi-C和ChIA-PET 等共计972套水稻高通量组学数据,通过标准化的数据处理流程,得到了多维度的高质量表观基因组和三维基因组数据。
研究者构建了综合的数据库搜索页面,用户可在数据库的基因组浏览器中查看不同品种、多种组织的表观基因组数据。用户可根据自己需求,选择不同类型的表观基因组数据,查询目标区域或目标基因的表观修饰信息。该数据库还提供了大量结果数据信息,这些数据文件都可在下载页面下载。用户可根据自己的需要进行下游分析。
另外,该数据库引入了水稻三维基因组数据。用户不仅可以查询目标区间参与的所有染色质远程交互信息,还可查询两两基因之间拥有的多层级交互基因网络,为水稻多基因之间共转录、共调控提供参考。
该数据库全面展示了多维度水稻表观基因组数据,涵盖了水稻不同品系不同组织间的表观基因组动态变化模式,为水稻功能基因组研究领域提供了解析水稻表观基因组和染色质远程互作信息的重要研究平台。
李兴旺解释说,该数据库相当于发布了水稻基因转录调控的“零件库”,方便大家在研究中选取合适的零件,组成基因表达的机器,正确表达相关基因。打个形象的比方即相当于乐高中的零件,现在整理出来一个最完整的“零件库”和相对完整的“零件列表”,大家可选择自己想要的零件,组装自己想要的机器。
该研究得到国家重点研发计划,国家自然科学基金和华中农业大学自主科技创新基金的支持。
来源基因信息学数据库:中国科学报
中国工程科技知识中心(以下简称”知识中心”)是经国家批准建设的国家工程科技领域公益性、开放式的知识资源集成和服务平台建设项目,是国家信息化建设的重要组成部分。
知识中心建设以满足国家经济科技发展需要为总体目标,通过汇聚和整合我国工程科技相关领域的数据资源,以资源为基础、以技术为支撑、以专家为骨干、以需求为牵引,建立集中管理、分布运维的知识中心服务平台。
知识中心以为国家工程科技领域重大决策、重大工程科技活动、企业创新与人才培养提供信息支撑和知识服务为宗旨,最终建设成为国际先进、国内领先、具有广泛影响力的工程科技领域信息汇聚中心、数据挖掘中心和知识服务中心。
中国工程科技知识中心公众号基因信息学数据库:知领
中国工程科技知识中心微博:知领直播