Requirements
Requisitos informáticos GridION Mk1
FOR RESEARCH USE ONLY
Contents
Requisitos informáticos GridION Mk1
Dispositivo GridION Mk1
- 2. Descripción general
- 3. Características técnicas
- 4. Requisitos de la ubicación
- 5. Telemetría
- 6. Actualizaciones del programa
- 7. Almacenamiento
- 8. Tipos de archivos
- 9. Almacenamiento a largo plazo
Preguntas frecuentes
Registro de cambios
Requisitos informáticos GridION Mk1
Lista de comprobación
Esta lista recoge los requisitos mínimos para instalar el GridION en su institución. Encontrará una información más completa de los mismos a lo largo del documento.
Elemento/configuración necesaria | Motivo | ¿Proporcionado? |
---|---|---|
1 puerto RJ45 de 1 Gb/s con servicio DHCP en funcionamiento | Conexión a una infraestructura informática y a internet | |
1 cable Ethernet de 1 Gbp/s | Conexión a una infraestructura informática y a internet | |
HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida) o regla DNS aplicada a ping.oxfordnanoportal.com | Información de telemetría | |
Ethernet: HTTPS/puerto 443: Acceso TCP a los rangos de IP de AWS eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html | Análisis en EPI2ME | |
HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida) o una regla DNS aplicada a cdn.oxfordnanoportal.com | Actualizaciones de programa | |
Ratón USB | Gestión del dispositivo | |
Teclado USB | Gestión del dispositivo | |
Monitor compatible con HDMI o DisplayPort | Gestión del dispositivo | |
Fuente de alimentación capaz de suministrar 650 W | Potencia del GridION | |
Almacenamiento: infraestructura suficiente para el almacenamiento requerido* | Almacenamiento de datos a largo plazo | |
*_El tamaño del almacenamiento requerido dependerá de cada caso. Siga leyendo para conocer las directrices en esta materia. |
Dispositivo GridION Mk1
Descripción general
El GridION es un dispositivo de sobremesa para secuenciar por nanoporos, diseñado para realizar y analizar hasta cinco celdas de flujo MinION o Flongle o una combinación de ellas. Es perfecto para laboratorios que realicen múltiples proyectos y necesiten beneficiarse de las ventajas de la secuenciación por nanoporos:
- Preparación sencilla de bibliotecas
- Análisis en tiempo real
- Comprensión biológica a partir de lecturas largas
Además, el GridION permite a los usuarios certificados ofrecer la secuenciación por nanoporos como servicio.
El GridION tiene la ventaja de incluir un ordenador integrado, que facilita la adquisición de datos, el análisis y la retroalimentación, la identificación de bases, transferencia de datos y gestión del dispositivo, todo ello sin suponer un peso adicional en la infraestructura informática existente.
Un programa personalizado preinstalado, creado por Oxford Nanopore Technologies, lleva a cabo la gestión del dispositivo, la identificación de bases y el análisis y orquestación en el GridION. A continuación se muestra el flujo de trabajo del análisis de datos predeterminado cuando se empieza a utilizar el GridION Mk1:
Flujo de trabajo del análisis de datos predeterminado en el dispositivo GridION
Características técnicas
El GridION Mk1 está diseñado en torno a una interfaz de usuario sencilla, sobre una electrónica personalizada de vanguardia, que proporciona soluciones de análisis en tiempo real:
Elemento | Características técnicas |
---|---|
Sistema operativo | Ubuntu 20.04, con CPU Intel Aconsejamos mantenerse al día con todos los parches de programa y de seguridad |
Almacenamiento | 7 TB de SSD interno (Los dispositivos GRD-MK1 con núm. de serie inferior a GXB05000 tienen 4 TB de almacenamiento SSD) |
Tarjetas GPU | 1 tarjeta gráfica Nvidia Quadro GV100 |
Memoria | 64 GB de RAM |
Tamaño y peso | 220 (alto) x 365 (ancho) x 370 (largo) mm Peso 14.4 kg |
Intervalos ambientales | Intervalo de funcionamiento del sistema: 5 °C a 40 °C Diseñado para secuenciar de 18 °C a 25 °C |
Requisitos de la ubicación
Instalar el GridION Mk1 en su institución es similar a instalar un ordenador nuevo. Los requisitos del dispositivo son los siguientes:
Elemento | Requisitos |
---|---|
1 puerto RJ45 | Dirección IP a través del servicio DHCP o asignado estáticamente TCP que se ejecute en un puerto 443 HTTPS Requiere permisos de cortafuegos perimetral: - Para acceder a HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida) o una regla DNS aplicada a ping.oxfordnanoportal.com a fin de obtener información de telemetría - HTTPS/puerto 443 y acceso de TCP a AWS en rangos IP eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html para análisis en EPI2ME. - HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida) o regla DNS aplicada a cdn.oxfordnanoportal.com para las actualizaciones de programa Conectado a la infraestructura de almacenamiento local |
1 fuente de alimentación | 1 cable C13 específico para cada país incluido con el dispositivo - Consumo máximo de energía 650 W - Corriente máxima 6,5 A - Tensión de alimentación 100-240 V CC (50/60 Hz) |
1 monitor | Compatible con conexiones HDMI o DisplayPort (con el GridION se incluye un adaptador de DisplayPort a HDMI) |
1 teclado | Compatible con USB |
1 ratón | Compatible con USB |
Telemetría
MinKNOW recoge información de telemetría durante los experimentos de secuenciación, de acuerdo con los Términos y condiciones, que permiten supervisar el rendimiento de un dispositivo y la resolución de problemas a distancia. Algunos de estos datos provienen de campos de texto libre, así que no deberían incluir datos de identificación personal. No recogemos ningún dato de secuenciación.
La plataforma EPI2ME está alojada en AWS y proporciona soluciones de análisis basadas en la nube para múltiples aplicaciones. Los usuarios cargan datos de secuenciación en formato FASTQ a través del Agente de EPI2ME, que procesa los datos a través de flujos de análisis definidos dentro del Portal EPI2ME. Las descargas de EPI2ME se realizan en forma de Datos + Telemetría o solo Telemetría. El portal de EPI2ME usa información de telemetría para cumplimentar informes.
Actualizaciones del programa
La dirección IP desde la que se recibirán actualizaciones del programa dependerá de su ubicación geográfica. Es posible actualizar el dispositivo a través de la interfaz de usuario o mediante el comando apt
del terminal, por lo que se requiere acceso solo de salida. Cuando haya actualizaciones disponibles, lo notificaremos a través de la comunidad Nanopore y proveeremos instrucciones detalladas en cada nota de lanzamiento.
Almacenamiento
Tipos de archivos
Los datos de secuenciación por nanoporos se almacenan en tres tipos de archivos: POD5, FASTQ y BAM. La información general de bases identificadas se almacena en un archivo de tipo sequencing_summary.txt:
- POD5 es un formato de archivo desarrollado por Oxford Nanopore, que almacena datos de nanoporos de manera accesible y sustituye el formato .fast5, ya obsoleto. Esta opción lee y escribe datos más rápido, utiliza menos cómputo y tiene un tamaño de archivo de datos crudos más pequeño que .fast5. Los archivos POD5 se generan por lotes, cada 10 minutos. Si se utilizan códigos, los archivos pueden dividirse por códigos, pero esta función deberá activarse, ya que está desactivada por defecto.
- .fast5 es un formato de archivo obsoleto basado en el archivo .hdf5, que contiene toda la información necesaria para analizar datos de secuenciación por nanoporos y rastrearlos hasta su origen. Un archivo .fast5 contiene datos de múltiples lecturas (4000 lecturas como mínimo) y tiene varios cientos Mb de tamaño.
- FASTQ es un formato de almacenamiento de secuencias basado en texto, que contiene tanto la secuencia de ADN/ARN como sus índices de calidad. Los archivos FASTQ se generan por lotes regularmente. Por defecto, estos archivos se generan cada 10 minutos, sin embargo es posible configurar la frecuencia a una hora o hacer que se genere un archivo al final del experimento. También es posible procesar las lecturas por lotes, en función del número de lecturas por archivo.
- Los archivos BAM proporcionan resultados si se realizan alineaciones o identificación de bases modificadas en el conjunto de datos de bases identificadas. Los archivos BAM están desactivados por defecto y se activan automáticamente si se utiliza el alineamiento o la identificación de bases modificadas.
- Los archivos
sequencing_summary.txt
contienen metadatos sobre las lecturas de bases identificadas de un experimento individual. La información incluye el identificador de lecturas, la longitud de secuencias, el índice Qscore por lectura, la duración, etc. El tamaño del archivo resumen de las secuencias dependerá del número de lecturas secuenciadas.
Los tamaños de archivo de ejemplo representados en la tabla siguiente se basan en diferentes rendimientos de una celda de flujo individual, con una ejecución que guarda archivos POD5, FASTQ y BAM con un N50 de lectura de 23 kb.
Rendimiento celda de flujo (Giga bases) | Almacenamiento POD5 (Gigabytes) | Almacenamiento FASTQ.gz (Gigabytes) | BAM sin alinear con modificaciones (Gigabytes) |
---|---|---|---|
10 | 70 | 6,5 | 6 |
15 | 105 | 9,75 | 9 |
30 | 210 | 19,5 | 18 |
A medida que avance el experimento, se producirán archivos POD5 de todas las lecturas. Si decide identificar las bases de sus datos, el programa MinKNOW utilizará esas lecturas para generar datos de secuenciación, que luego se almacenarán en archivos FASTQ o BAM.
Almacenamiento a largo plazo
El GridION tiene suficiente espacio en el disco SSD para realizar múltiples experimentos y almacena datos tanto en POD5 como FASTQ. Sin embargo, es imperativo que esta memoria de datos se limpie regularmente a fin de prevenir que futuros experimentos se paren debido a falta de espacio. Para ello, la institución debe proporcionar un espacio de almacenamiento al que transferir datos desde el dispositivo.
El GridION funciona con Ubuntu y es capaz de montar múltiples tipos de sistemas de archivos. Recomendamos el almacenamiento NFS o CIFS. La forma (y volumen) de datos que se almacenen dependerá de los requisitos del usuario:
- Almacenar archivos .POD5 con datos de lecturas brutas permitirá volver a identificar las bases de esos datos cuando Oxford Nanopore Technologies lance nuevos algoritmos. En algunos casos, las nuevas versiones de identificador de bases han permitido mejorar significativamente la precisión en conjuntos de datos existentes gracias a la reidentificación de bases. Además, tanto las herramientas de terceros como las de Oxford Nanopore usan la información de la señal bruta, contenida en el .POD5, para extraer información adicional, por ejemplo la identificación de bases modificadas, la identificación de polimorfismos de un solo nucleótido guiados por la referencia o la limpieza de datos.
- Conservar solo los archivos FASTQ permitirá utilizar las herramientas de análisis habituales, utilizando la secuencia de ADN/ARN, pero no se podrán generar más datos cuando aparezcan nuevas versiones de identificador de bases.
Preguntas frecuentes
¿Puedo utilizar un sistema de alimentación ininterrumpida (SAI) con el GridION?
Sí, es posible usar un sistema SAI, aunque no podemos recomendar ningún producto específico.
¿Tenéis alguna recomendación para transferir datos en tiempo real desde el GridION, durante un experimento de secuenciación?
En la actualidad, recomendamos transferir datos con rsync y ejecutarlo cada hora a través de crontab. Para más información, escriba a support@nanoporetech.com
Registro de cambios
Fecha | Versión | Cambios realizados |
---|---|---|
8 ene 2025 | V14 | En las “características técnicas”, se han hecho cambios en el almacenamiento: de 4 TB a 7 TB de almacenamiento SSD; además, se ha añadido una nota que dice que los dispositivos con núm. de serie inferior a GXB05000 tienen 4 TB. |
10 dic 2024 | V13 | En “Requisitos de la ubicación”, en el apartado “1 fuente de alimentación”, la corriente máxima se ha cambiado por 6,5 A. |
31 jul 2024 | V12 | En la sección “Tipos de archivos”, se ha actualizado la información sobre generación de datos en archivos POD5, FASTQ y BAM. |
28 sep 2023 | V11 | - Se ha añadido una tabla con tamaños de archivos a la sección "Tipos de archivos". - Se han realizado pequeñas correcciones y aclaraciones a lo largo del documento. |
28 jun 2023 | V10 | - En la "Lista de comprobación", se han modificado las características técnicas de la información de telemetría, el análisis de EPI2ME y las actualizaciones del programa. - Se ha eliminado la sección "Conexión a la red". - En la sección "Tipos de archivos" se ha añadido información sobre los archivos POD5 y BAM. Se ha borrado temporalmente la tabla de comparación de tamaños de archivos. - La sección "Programa incluido" se ha eliminado. - Se han realizado pequeñas correcciones y aclaraciones a lo largo del documento. |
10 mar 2023 | V9 | - La lista de comprobación y los Requisitos del emplazamiento se han actualizado para eliminar el requisito del puerto HTTP 80. |
22 sep 2022 | V8 | - En la sección "Requisitos de la ubicación" se ha corregido la URL de los intervalos de IP de eu-west-1, de AWS. |
19 ago 2022 | V7 | - En la sección "Características técnicas", el peso del dispositivo se ha actualizado a 14,4 kg y el intervalo de funcionamiento del sistema se ha actualizado a: 5 °C-40 °C. - Se ha actualizado la tabla de tamaños de archivos .fast5/FASTQ. |
21 abr 2022 | V6 | - En la lista de comprobación y en la sección de conexión a la red, se ha actualizado el enlace de mirror.oxfordnanoportal.com a cdn.oxfordnanoportal.com. |
12 nov 2020 | V5 | - Se ha corregido la compatibilidad entre DisplayPort y HDMI. |
14 sep 2020 | V4 | - Se han eliminado las referencias a la compatibilidad con DisplayPort, ya que el GridION ahora se envía con un adaptador de DisplayPort a HDMI. |
29 abr 2020 | V3 | - Tras la introducción de la compresión de archivos, se han modificado los tamaños de los archivos de salida. |
29 jul 2019 | V2 | - Se ha actualizado la información del GridION Mk1 |
9 jul 2018 | V1 | - Versión inicial del documento |