哈尔滨网站制作公司价格,桐城市网站建设,如何设计一个网页步骤,wordpress 访客 用户PGCP: A comprehensive database of plant genomes for comparative phylogenomics
PGCP#xff1a;用于比较基因组学的植物基因组综合数据库 https://biobigdata.nju.edu.cn/pgdatabase/home 随着测序和基因组组装技术的快速发展#xff0c;成千上万的植物基因组已被测序、…PGCP: A comprehensive database of plant genomes for comparative phylogenomics
PGCP用于比较基因组学的植物基因组综合数据库 https://biobigdata.nju.edu.cn/pgdatabase/home 随着测序和基因组组装技术的快速发展成千上万的植物基因组已被测序、组装和注释Marks et al., 2021Xie et al., 2024为植物的比较基因组学和进化研究提供了丰富而宝贵的资源。然而这些基因组往往分散在不同的数据库中导致高效的数据访问、整合和全面分析存在障碍。现有的植物基因组数据库如PhytozomeGoodstein et al., 2012和Ensembl PlantsBolser et al., 2017做出了重要贡献但在范围上有所限制通常仅覆盖有限数量的物种和少数代表性基因组。缺乏一个集中的平台来访问和分析各种植物基因组使得进行大规模的比较研究变得具有挑战性阻碍了保守和差异化基因组特征的识别也妨碍了植物王国内更广泛进化和功能模式的发现。因此亟需一个全面、用户友好且整合的数据平台将来自多种植物物种的高质量基因组数据汇集在一起。
在此我们介绍PGCP植物基因组比较基因组学平台这是一个综合性数据库整合了植物系统发育树上广泛的基因组数据。PGCP整合了来自不同平台和已发布研究的719个公开可用的基因组确保包括高质量的组装和完整的注释信息图1a。经过严格的质量控制后我们从这些基因组中获得了共计26,600,642个蛋白质编码基因。为了增强数据一致性和可用性我们对整个数据库中的基因组注释进行了统一和标准化的重建。基因和染色体的标识符ID被转换为PGCP特有的标识符记录经过精心筛选以保持数据的完整性和保密性。所有蛋白质编码基因进一步进行了各种功能属性的注释包括使用iTAK预测转录因子TFs和转录调控因子TRsZheng et al., 2016。此外使用InterProScanJones et al., 2014为基因本体GO术语和蛋白质结构域注释提供支持从而为基因数据集提供了全面的功能性景观图1b。 植物基因组比较基因组学平台PGCP数据库概述
(a) 植物基因组数据的汇编包括高质量的基因组序列和基因特征注释。 (b) 基因组数据集和蛋白质编码基因的各种功能注释的统计摘要。 (c) 通过OrthoFinder识别直系同源群展示全面的系统基因组学分析能够探索植物物种间的进化关系、基因家族动态和功能分化。 (d–i) “基因组视图”d、“基因注释视图”e、“BLAST工具”f、“功能富集分析”g、“同源性视图”h和“引物设计器”i的页面截图。
为了揭示广泛基因组数据集中的隐藏模式我们使用OrthoFinderEmms和Kelly2019进行了大规模的比较基因组学分析。在PGCP中收集的719个基因组中我们识别出237,400个直系同源群每个群组包含来自至少三个不同物种的基因。这个综合资源通过比较植物物种间的同源基因追溯基因家族的起源和分化突出适应性进化识别贡献于特有物种特征的谱系特异性基因并根据保守和差异化特征预测基因功能从而使得探索复杂的进化关系成为可能图1c。这些分析为深入理解植物多样性的遗传基础提供了重要信息揭示了植物王国中进化轨迹、适应性策略和功能创新。简而言之整合这些直系同源群显著提升了PGCP数据库的实用性使其成为推动进化研究的重要资源。
PGCP数据库还提供了广泛的可视化功能和强大的分析工具帮助用户高效地探索丰富的基因组数据。
基因组视图和基因注释视图 “基因组视图”提供了关于基因组组装和注释的详细信息并链接到内部基因组浏览器和外部数据库以及可搜索的注释基因列表图1d。从该列表中用户可以选择特定的基因访问“基因注释视图”该视图提供详细的序列信息、功能注释和同源关系支持跨物种的基因功能、进化关系和比较分析的深入调查图1e。
多基因组BLAST工具 PGCP提供了强大的“BLAST工具”使跨物种的序列搜索成为可能。用户可以从直观的物种关系树中轻松选择参考基因组进行比对从而简化跨植物物种同源序列的识别过程。BLAST结果会保存1周并可选择通过电子邮件接收详细结果方便进行无缝且高效的跨基因组比较满足多种研究需求图1f。
功能富集分析 该平台提供了在线“功能富集分析”工具用户可以对数据库中的任何物种进行功能分析。结果以富集图和富集路径图的形式呈现提供了功能和通路的可视化概览。详细的表格数据也可以访问支持深入探索图1g。
同源性视图用于染色体级基因组 “同源性视图”功能使用户能够同时比较最多五个基因组使用SynVisioBandi和Gutwin2020显示所选基因组之间的同源性关系。这个工具对于研究结构变异甚至指示物种间的全基因组复制特别有用图1h。
引物设计器工具 “引物设计器”工具允许用户为PGCP中列出的任何基因组区域设计引物。该工具提供可视化选项帮助选择最佳引物用于实验应用图1i。
总之PGCP旨在提供一个广泛且易于访问的平台整合来自多种植物物种的基因组数据涵盖了研究较为深入的模式植物、重要农作物和多样化的野生植物。通过提供高分辨率基因组序列、注释和比较基因组学数据的统一库PGCP促进了大规模的比较分析使研究人员能够探索植物系统发育学、基因家族动态和植物王国中的功能基因组学。该数据库包括先进的分析工具支持同源物种的识别、系统发育重建以及发现与适应性和农业性状相关的关键基因。作为一个统一的平台PGCP被设计为植物生物学研究人员的基本资源促进了对植物进化、多样性和驱动性状多样性的分子机制的新见解。未来我们计划通过整合更多植物基因组资源扩展PGCP数据库的内容以增强其全面性。作为我们持续发展的组成部分我们将致力于系统地纳入GWHMa et al., 2025和其他相关数据库中的基因组以为植物研究社区提供更广泛且最新的资源。