Requirements
PromethION 2 Integrated IT 配置要求
FOR RESEARCH USE ONLY
PromethION 2 Integrated IT 配置要求
概览
PromethION 2 Integrated(P2i)是一款用于纳米孔测序的台式设备。它能够同时运行和分析多达两张测序芯片。对希望借助纳米孔测序的优势而进行多重项目的实验室而言,P2i是理想之选:
- 简易的文库制备
- 实时分析
- 长读长带来的深度解析
此外,用户在获得 认证后,可作为服务商对外提供P2i纳米孔测序服务。
得益于强大的内置计算功能,P2i可独立进行设备控制、数据采集、实时碱基识别、和数据流传输,且无需任何附属IT基础设施。它还可以执行碱基识别后的数据分析(例如使用 EPI2ME 工作流程)。
P2i 预装有负责执行设备控制、数据采集和碱基识别的软件。该软件由Oxford Nanopore Technologies开发。以下为 P2i测序设备的默认数据分析工作流程:
图一: PromethION 2 Integrated 测序设备的默认数据分析工作流程
规格
P2i内置先进的电子设备,配备简明的用户界面,方便用户实时分析样本。设备内置触屏,使用户能轻松启动和监控测序运行,同时支持通过外接显示器和集成计算机进行EPI2ME等下游分析。
组成 | 规格 |
---|---|
尺寸和重量 | 180 mm x 225 mm x 430 mm,10.6 kg |
环境条件 | 设计用于+18℃至+25℃的温度范围内测序 (该设备的工作环境温度为+5℃至+40℃) |
显示输出接口 | 1x HDMI 2.0 接口(最高支持4K分辨率,60 Hz) 1x DisplayPort 接口 |
USB 接口 | 4 x USB 3.0 Type-A 接口(最高 10 Gb/s) |
网络 | 1x 2.5 Gbp/秒 宽带网(RJ45 连接器) |
内置触屏显示 | 5.5英寸(对角)AMOLED触摸显示屏 |
音频 | 1x 3.5 mm 音频输出(顶部) |
电源 | 750 W 电源 |
存储 | 15 TB SSD |
内存 | 64 GB DDR4 |
CPU/GPU | 1x Intel Core i7处理器(12核/20线程) 1X NVIDIA Ampere系列GPU |
操作系统 | Ubuntu 20.04 LTS |
已安装的软件 | MinKNOW |
遥测反馈 | 通过HTTPS/443端口出站访问52.17.110.146、52.31.111.95、79.125.100.3, 或访问域名ping.oxfordnanoportal.com |
EPI2ME分析 | 宽带网:HTTPS/端口:443 通过TCP访问列于http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html的AWS eu-west-1 IP地址范围 |
软件更新 | 通过HTTPS/443端口出站访问178.79.175.200 及 96.126.99.215, 或访问域名cdn.oxfordnanoportal.com |
遥测
MinKNOW会按照条款和条件中的规定,在测序运行期间收集遥测信息,以监控设备性能并远程排除故障。由于部分信息源自自由文本字段,因此请您不要填写任何个人身份信息。我们不会收集任何测序数据。
EPI2ME平台是一项由AWS托管、基于云端的数据分析服务,为多个应用程序提供基于云的分析解决方案。用户通过EPI2ME代理上传FASTQ格式的序列数据,再通过EPI2ME门户中预定义的管道进行处理。所得结果以(数据+遥测)或遥测的形式从EPI2ME下载。EPI2ME门户生成的报告基于遥测信息。
软件更新
您的地理位置决定了接收软件更新的IP地址。更新可通过软件用户界面(UI)或Linux系统的安装包管理工具(apt)进行。该工具已预装在P2i上,并可通过终端应用程序使用。如需通过apt更新,您需具备出站访问权限。我们会在纳米孔社区发布可用更新,您可在公告中查看完整的更新说明。
存储
文件类型
Nanopore测序软件 MinKNOW 可生成三种格式的测序数据:POD5、FASTQ 和 BAM。碱基识别摘要信息存储在sequencing_summary.txt 文件中:
- POD5是由Oxford Nanopore开发的一种用于储存纳米孔数据的文件格式,它易于访问,取代了传统的.fast5 格式。与.fast5 相比,POD5 格式具有以下优点:读取和写入数据的速度更快、使用的计算资源更少、且原始数据文件的大小更小。POD5 文件每10分钟批量生成一次。若启用条形码功能,文件可按条形码拆分,但该功能默认关闭。
- .fast5 是一种基于.hdf5 文件类型的传统文件格式,它含有分析纳米孔测序数据所需的一切信息及其溯源。一份.fast5文件内含多条序列(默认为4000条),文件大小为数百Mb。
- FASTQ是一种基于文本的序列储存格式,它包含DNA/RNA序列及其质量值(Q值)。FASTQ 文件按时间批量生成,默认每 10 分钟生成一个。该频率可调整为每 10 分钟、每小时,或在运行结束时生成单个文件。此外,还可根据序列片段数量拆分文件。
- 如果您对经过碱基识别的数据集进行比对或修饰碱基识别,则会输出BAM 文件。BAM 文件的生成方式与 FASTQ 文件类似。默认情况下不生成 BAM 文件,但在启用比对或修饰碱基识别功能时,会自动启用BAM文件选项。
sequencing_summary.txt
文本储存了单次测序中,与测序序列及碱基识别相关的元数据。其中包括:序列片段编号、序列长度、每条序列片段的质量值、测序时长等。该序列摘要文件的大小取决于其所包含的序列片段数目。
下表中的文件大小是基于单张测序芯片在不同通量下的估值,文件格式分别为 POD5、FASTQ 和BAM ,序列片段的N50为23kb。TMO = 理论最大产出(theoretical maximum output)。
测序芯片产(Gbases) | POD5(Gbytes) | FASTQ.gz(Gbytes) | 未经比对的BAM(带修饰)(Gbytes) |
---|---|---|---|
100 | 700 | 65 | 60 |
200 | 1,400 | 130 | 120 |
290 (TMO) | 2,030 | 188.5 | 174 |
随着实验的推进,所有的序列片段会以.POD5格式产出。如您希望对数据进行碱基识别,MinKNOW软件会根据序列数据生成测序数据,并以 FASTQ 和/或 BAM 格式存储。
数据传输及长期存储
P2i具备充足的SSD磁盘空间,可储存多各测序实验所产生的POD5、FASTQ和BAM数据。然而,定期清理数据至关重要,以免存储空间不足导致运行中断。因此,用户端应提供额外存储空间,以便将数据传输到外部设备。
P2i 在Ubuntu系统上运行,支持挂载多种文件系统类型。我们建议您以NFS或CIFS格式储存数据。数据的存储形式和数量取决于用户的需求:
- 您可选择保存或删除含有原始序列数据的POD5文件。如您希望未来对测序数据重新进行碱基识别,则可以在MinKNOW中选择保存POD5文件。
- 仅保留FASTQ/BAM文件将无法重新进行原始数据的碱基识别,但可以使用标准的下游分析工具分析文件中的DNA/RNA序列。
变更日志
日期 | 版本 | 变更内容 |
---|---|---|
2024 年 7 月 31 日 | 4 | 在“文件类型”一节,更新有关POD5、FASTQ 和 BAM 文件的数据生成信息。 |
2024 年 4 月 24 日 | 3 | 在“规格”一节,对部分数值进行了修正。 |
2024 年 4 月 8 日 | 2 | 更正 “环境条件” 部分的描述,修改为 "设计用于+18℃至+25℃的温度范围内测序" 。 |
2023 年 10 月 10 日 | 1 | 初版 |