欢迎进入泛第三极环境中心

首页

首页 > 正文

青藏高原湖泊微生物宏基因组数据集

 

该数据集由邢鹏团队提供,包含2019年07月23日至2019年08月03日在青藏高原采集的8个湖泊共24个水体微生物宏基因组测序数据。采样站点位于经度80°23.801'E~89°38.864'E,纬度28°08.951'N~ 34°35.258'N,海拔4278m~5018m之间的湖泊,对湖泊中设定点位的水体进行20-3μm,3-0.8μm和0.8-0.1μm孔径滤膜的分级收集。 

使用Novaseq 6000平台进行测序。首先对原始测序数据进行质量控制,之后采用 SOAPdenovo 软件组装优化数据reads。使用 ABySS进行多重 Kmer 参数的基因组组装,得到最优的组装结果,采用默认参数的 MetaGeneMark 软件从组装好的Contigs片段来预测基因集 (ORFs),采用CD-HIT来获得非冗余基因,采用SOAPaligner软件将保留的 clean read 与基因库进行比对。通过去除含有少于3个mapped reads映射片段的基因类别来获得 unigene,用DIAMOND软件将unigene与NCBI-NR数据库进行比对,并采用 MEGAN 软件 LCA 算法进行物种注释和功能基因注释。

配套发布的环境因子数据包括:取样时水体温度(℃),pH,总氮(mg/g),总磷(g/kg),NH4+(mg/g),NO3-(mg/g)和电导率(μS/cm)。温度(℃)、pH和电导率(μS/cm)使用YSI多参数水质测定仪于现场测定;总氮(mg/L)采用碱性过硫酸钾消解紫外分光光度法测定;总磷(mg/L)采用流动注射-钼酸铵分光光度法测定;NH4+(mg/L)和NO3-(mg/L)采用连续流动分析仪(SKARA)测定。

详细信息参见泛第三极环境数据中心:http://tp.lzu.edu.cn/node/dataSet/dataSet01.jsp