共表达网络分析揭示棕榈藤纤鞭生长动态调控模块

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
共表达网络分析揭示棕榈藤纤鞭生长动态调控模块
王炯亮 赵韩生 高志民
( 国际竹藤中心 北京 100102)
摘 要:棕榈藤是世界上仅次于树木与竹子的最重要非木森林资源ꎮ 2018 年国际竹藤中心全球首次发布了
棕榈藤全基因组序列( 单叶省藤和黄藤) ꎬ极大促进了棕榈藤基因功能的研究ꎮ 基因共表达网络分析有助于
放使用ꎮ
关键词: 棕榈藤ꎻ 基因共表达网络分析ꎻ 纤鞭
DOI: 10.12168 / sjzttx.2020.04.014
棕榈藤属于棕榈科ꎬ 多年生常绿攀援类 植 物ꎬ
芥、 芥菜、 大豆 等 9 个 物 种 的 CEN 数 据 集 的 数 据
个商业品种在热带地区被广泛种植ꎮ 棕榈藤每年可
功能基因比较分析ꎬ AraNet v2 构建了提供 28 个植
藤纤鞭生长 调 控 有 了 新 的 认 知ꎮ 最 后ꎬ 构 建 了 首 个 棕 榈 藤 组 学 在 线 数 据 库———Rattan ̄NET ( http: / / rattan.
bamboogdb.org / ) ꎬ 包含基因集富集、 模块富集、 网络比较和顺式作用元件等分析工具ꎬ 可供研究人员开
与 CEN 的动态展示ꎮ GBrowse 和 SequenceServer 用于
提供序列扫描和 BLAST + 服务ꎮ
2 结果和分析
2 1 CEN 的构建和功能模块的鉴定
CEN 分析
丙素生物合成通路的 PAL、 C4H 和 4CL 基因 ( 原文
个 C4H 基因、 9 个 4CL 基因ꎬ 黄藤中有 13 个 PAL 基
法ꎮ 在本研究中ꎬ 通过使用单叶省藤和黄藤的基因
了基因的覆盖率和模块的数量ꎬ 优化对基因的功能
注释ꎬ 在 CEN 中鉴定了覆盖纤鞭不同发育阶段的功
能模块ꎬ 并使用基因家族分类、 同源基因注释、 顺
式作用元件分析和基因本体分析等工具对优化的基
能基因的强大工具ꎬ 可在多种条件下批量注释、 聚
因功 能 注 释 进 行 了 评 估ꎮ 此 外ꎬ 构 建 了 棕 榈 藤 的
在系统发育分析中ꎬ 使 用 MUSCLE v3 8 31 在
取保守区序列ꎮ 使用 jModeltest v2 1 6 寻找最优的替
75
Copyright©博看网 . All Rights Reserved.
BESTꎮ 最后ꎬ 使用 PhyML v20120412 进行系统发育
棕榈藤基因 3 kb 启动子区域时ꎬ 选择 P ̄value< 0 05
Cuffdiff v2 2 1 评估差异表达基因ꎮ 此外ꎬ 此研究使
1 7 捕 光 复 合 物 基 因 家 族 的 鉴 定 与 系 统 发 育
使用 Cufflinks v2 2 1 进 行 FPKM 值 的 计 算ꎬ 使 用
作者说明:本成果的文章作者参见 Frontiers in Genetics 杂志的原文作者ꎻ本文为王炯亮、赵韩生、高志民翻译整理ꎮ E- mail:
gaozhimin@ icbr ac cnꎮ
74
Copyright©博看网 . All Rights Reserved.
类基因家族中分别有 12 个和 14 个类黄酮生物合成
藤和黄藤确定了符合单向 MR<3 + 双向 MR≤30 条件
酮生物合成相关基因相比ꎬ 在单叶省藤和黄藤中分
个黄藤的纤鞭样本进行 CEN 的构建ꎮ 分别在单叶省
相关的基因 ( 原文图 1B 与附表 S5) ꎬ 与发现的类黄
的 630 081 和 670 502 个基因对作为 CEN 的边 ( 原
验和多重假设检验过程中被剔除ꎮ 然后ꎬ 使用模块
使用 个棕榈藤物种的基因功能注释进行
得的 4 个黄藤纤鞭组织的 RNA 测序数据ꎬ 共使用了
进行注 释 优 化ꎻ 对 每 个 基 因 的 共 表 达 基 因 集 进 行
100 bp 的双末端测序ꎮ 同时ꎬ 还收集了此前测序获
下载拟南芥的捕光复合物 ( LHC) 基因序列ꎬ 作为
1 3 CEN 的构建
查询序列ꎬ 在单叶省藤、 黄藤和水稻基因序列组成
和互 相 排 序 ( MR) 整 合 在 一 起 用 于 CEN 的 构 建
参数为 E ̄value<1e -5 ꎮ 相似性搜索的结果进一步使用
本研究采用的策略是将皮尔森相关系数 ( PCC)
并使用 NanoDrop 2000 分光光度计测定浓度和纯度ꎮ
黄藤中选定 k = 6 和 k = 5 作为 CFinder 的参数 ( 原文
minꎬ 以去 除 所 提 取 RNA 中 残 余 的 DNAꎬ 之 后 将
具对模块进行功能注释ꎬ 不可靠的模块在 Fisher 检
RNA 在反转录系统下反转录成 cDNAꎬ 并建库测序ꎮ
( 原文附图 S2) : 1) 使用 FPKM 计算基因对之间的
的数据库中进行相似性搜索ꎮ 搜索工具为 BLAST + ꎬ
pfamscan pl 脚本进行检验ꎬ 提取该基因家族的编码
PCC 值ꎬ 并过滤掉弱相关的基因对ꎬ 只保留强相关
序列ꎬ 用于后续分析ꎮ
对之间的 MR 值ꎬ 并提取高置信度的基因对ꎬ 剔除
1 材料与方法
后ꎬ 本研究选定了单向 MR< 3 + 双向 MR< 30 的基因
对作为 CENꎮ
1 1 样品收集与测序
1 4 功能模块的鉴定和基因注释优化
国林业科学研究院广州热带林业研究所 ( 原文附表
每个节点的密度ꎬ 进而在网络中鉴定模块ꎮ 为使基
不同发育阶段单叶省藤和黄藤纤鞭组织采自中
类和探索海量基因ꎮ CEN 分析和相应的数据库在植
CEN 数据库 ( Rattan ̄NET) ꎬ 提供了潜在的功能模块
物中得 到 广 泛 应 用ꎬ ATTED ̄II 是 一 个 提 供 了 拟 南
和基因功能注释ꎬ 方便研究人员使用ꎮ
基金项目:“ 十二五” 农村领域国家科技计划项目研究任务( 编号:2015BAD04B0101) ꎮ
因、 12 个 C4H 基 因 和 15 个 4CL 基 因 ( 原 文 附 图
S4) ꎮ 通过检测功能注释ꎬ 在这些基因中调查与类黄
酮生物合 成 和 木 质 素 生 物 合 成 相 关 的 共 表 达 基 因
( 原文图 1) ꎮ 结果表明ꎬ 在单叶省藤和黄藤的上述 3
使用处于不同发育阶段的 24 个单叶省藤和 36
RBH 被认为是最优的直系同源对ꎬ 所有 BLAST 结果
4: 15、 MINLEN: 50、 TOPPHRED 64 等参数下对接
的 E ̄value 值分布的峰值作为阈值ꎬ 小于该阈值的基
后的序列被输入到 HISAT2 v2 1 0 中进行转录组序
1 6 顺式作用元件的显著性分析
intronlen 4000、 - rna ̄strandness RFꎮ HISAT2 输 出 的
上的基因功能分析仍是空白ꎮ
组和转录组数据ꎬ 选择成熟方法构建 CENꎬ 最大化
表性棕榈藤的全基因组序列ꎬ 但棕榈藤转录组水平
基因协同功能网络在构建整体通路模型、 细化
基因注释ꎬ 以及在体内模拟重要调控机制等方面发
挥着关 键 作 用ꎮ 作 为 其 中 主 要 代 表 的 共 表 达 网 络
( CEN) ꎬ 它是基于基因转录表达水平以表征相关功
用 3σ 准则 ( threshold = average ( 5% value) + 3 ∗
SD) 计算 FPKM 阈值ꎬ 用于筛除 FPKM 过低的数据
( 原文附图 S1) ꎮ
Байду номын сангаас
的元件模体作为显著富集的调控元件ꎮ
分析
从 TAIR 网 站 ( https: / / www arabidopsis org )
使用 RBH 方法在 2 个棕榈藤物种中鉴定参与苯
Cytoscape js 是 Linux 版本的 Cytoscapeꎬ 它用于模块
图 1) ꎬ 结果表明ꎬ 单叶省藤中有 8 个 PAL 基因、 12
Rattan ̄NET 的构 建 基 于 Linux 系 统、 Apache 软
工具 是 基 于 Python、 Perl 和 R 脚 本 语 言 开 发 的ꎮ
藤和拟 南 芥 之 中 鉴 定 直 系 同 源 基 因ꎬ 排 位 前 三 的
鞭转录组数据集进行分析ꎮ
使用 FastQC v0 11 6ꎬ 在默认参数下进行转 录
LEADING: 3、 TRAILING: 3、 SLIDINGWINDOWS
注释ꎮ
使用 BLAST 相互最佳匹配 ( RBH) 方法在棕榈
GSEA 产生的功能注释文件ꎮ 共有 54 6% 的单叶省
数设为 1 000ꎮ
释优化ꎮ
树的构建ꎬ 其中模型参数由 jModeltest 得到ꎬ 自检参
藤和 62 4%黄藤的基因在模块和 CEN 分析中得到注
1 8 查询与可视化平台构建
2 2 棕榈藤中类黄酮和木质素生物合成通路的
件、 MySQL 软件和 PHP 语言ꎮ 涉及计算相关的分析
库ꎬ CcNET 提供了基于 CEN 的二倍体和多倍体棉花
物物种间同源关系的 CENꎬ RiceNet v2 是一个升级
后的水稻 CEN 分析数据库ꎬ Bamboo ̄NET 提供了毛
竹的 CEN 和优化后的基因功能注释ꎮ 但是ꎬ 棕榈藤
中的 CEN 研究仍处于空白ꎮ
一般 CEN 的构建遵循以下 3 个步骤: 计算基因
优化ꎬ 即: 用模块的功能注释对属于该模块的基因
处于不同发育阶段的 24 个单叶省藤和 36 个黄藤纤
GSEAꎬ FDR< 0 05 的 词 条 也 做 为 是 该 基 因 优 化 后
1 2 数据处理和基因表达分析
1 5 棕榈藤和拟南芥之间的直系同源基因鉴定
组数 据 的 质 量 分 析ꎮ 使 用 Trimmomatic v0 36 在
此ꎬ 纤鞭生长发育的遗传调控机制备受关注ꎮ 作为
间的相似性值ꎻ 选定阈值提取基因对形成网络ꎻ 在
竹藤基因组图谱 ( GABR) 项目的一部分ꎬ 虽然国
CEN 中寻找功能模块ꎮ 每一步都有不同的方法可供
际竹藤中心在 2018 年发布了单叶省藤和黄藤 2 个代
选择ꎬ 所以构建一个 CEN 可以有许多不同的组合方
使用基于集团渗透算法的 CFinder v2 0 6 测定
S1) ꎮ 按 照 说 明 书ꎬ 使 用 TRIzol 试 剂 分 离 出 RNAꎬ
因的覆盖度和模块数量最大化ꎬ 分别在单叶省藤和
所使 用 RNase ̄free DNase I 试 剂 在 37 ℃ 下 处 理 30
附图 S4) ꎮ 此外ꎬ 使用基因集富集分析 ( GSEA) 工
在转录组层面提供完整全面的基因功能注释ꎬ因此本研究整合棕榈藤基因组序列和不同发育阶段的纤鞭转
录组数据进行了共表达网络分析ꎮ 通过整合共表达网络、基因家族分类和功能富集等分析ꎬ分别在单叶省
藤和黄藤中鉴定得到 3 504 和 3 027 个功能模块ꎬ包括光合作用、木质素生物合成、类黄酮生物合成、苯丙素
生物合成等主要的生物学过程ꎮ 同时ꎬ使用共表达网络和功能模块对基因的功能注释进行了优化ꎬ对棕榈
世界上共有 600 多个种ꎬ 分别属于 13 个属ꎬ 其中 27
产生大约 70 亿美元的收益ꎬ 超过 500 万人在经济上
依赖于棕榈藤ꎮ 棕榈藤是热带森林生态系统的组成
部分ꎬ 其纤鞭带有爪钩ꎬ 利于在森林环境中攀爬和
生长ꎻ 然而ꎬ 这也使得棕榈藤种植、 管理和采收等
经营环节变得困难ꎬ 导致棕榈藤产品成本较高ꎮ 因
筛选策略用于顺式作用元件的显著性测试ꎬ 在扫描
头序列和低质量序列进行修剪和过滤ꎮ 经质量控制
列 的 回 帖ꎬ 参 数 如 下: - min ̄intronlen 20、 - max ̄
因对被认定为次优的直系同源基因对ꎮ
参照前人研究ꎬ 使用基于 Z ̄score 和 P ̄value 的
数据都被保留下来用于后续分析 ( 原文附表 S2) ꎮ
默认参数下进行多序列比对ꎮ 使用 Gblocks server 提
characteristic 分析ꎬ 用于筛选最优的 MR 参数值ꎮ 最
换模型ꎬ 参 数 如 下: - f、 - g 4、 - i、 - s 203、 - S
的基因对 ( 原文附图 S3) ꎻ 2) 使用 PCC 计算基因
不 可 靠 的 基 因 对ꎻ 3 ) 进 行 Receiver operating
相关文档
最新文档