Requirements
Requisitos informáticos MinION Mk1D
FOR RESEARCH USE ONLY
Contents
Requisitos informáticos MinION Mk1D
- 1. Descripción general
- 2. Configurar un nuevo ordenador
- 3. Ordenadores de ejemplo
- 4. Requisitos informáticos
- 5. Telemetría
- 6. Actualizaciones de programa
- 7. Tipos de archivos
Registro de cambios
Requisitos informáticos MinION Mk1D
Descripción general
El MinION™ Mk1D es un dispositivo pequeño y portátil para secuenciar por nanoporos, que permite secuenciar en el lugar donde se encuentra la muestra, sin necesidad de transportarla a un laboratorio. El dispositivo necesita un ordenador externo para suministrar la energía y gestionar la secuenciación a través del programa MinKNOW™.
MinKNOW lleva a cabo varias tareas esenciales, como la adquisición de datos, el análisis y retroalimentación en tiempo real o la transmisión de datos y gestión del dispositivo, que a su vez incluye la selección de los parámetros del experimento y la identificación de muestras y su seguimiento. Además de recoger la señal en bruto de los nanoporos, MinKNOW incorpora un algoritmo de identificación de bases que utiliza técnicas de procesamiento de señales basadas en el aprendizaje automático, que transforman la señal sin procesar de las lecturas en bases identificadas.
El propósito de este documento es facilitar la elección de un ordenador compatible con el MinION Mk1D.
Configurar un nuevo ordenador
Nótese, el MinION Mk1D es compatible con la versión 24.06.16 de MinKNOW o una posterior.
Preste especial atención a los requisitos que se indican a continuación y procure elegir un ordenador que los cumpla. De lo contrario, podrían producirse problemas con la adquisición de datos o la velocidad de la identificación de bases. El identificador de bases de MinKNOW, Dorado, está optimizado para funcionar tanto con la GPU de NVIDIA como con Apple Silicon. Para identificar bases durante el experimento de secuenciación, se debe utilizar una GPU de NVIDIA o un ordenador Mac que utilice un procesador Apple Silicon, capaz de seguir el ritmo de generación de datos.
Importante - Para conectar el MinION Mk1D al ordenador, solo son compatibles los cables USB-C. Procure adquirir un ordenador con este tipo de puerto. Los adaptadores USB-A a USB-C y los cables USB-A a USB-C no son compatibles. Por lo general, los puertos USB-A no suministran suficiente potencia para el MinION Mk1D y podrían comprometer el rendimiento de la secuenciación.
Elementos | Windows, Linux | macOS |
---|---|---|
Sistema operativo | Windows 10/11, Ubuntu 20.04/22.04 LTS | macOS |
Periféricos | USB-C (USB 2.0 o superior) | USB-C (USB 2.0 o superior) |
Memoria | 16 GB o superior | 16 GB o superior |
GPU | NVIDIA RTX 4070 o superior | Apple M3 Max |
CPU | Procesador Intel o AMD con al menos 4 núcleos/ 8 hilos | Apple M3 Max |
Almacenamiento | 1 TB SSD o mayor | 1 TB SSD o mayor |
Recomendamos utilizar almacenamiento interno en estado sólido (SSD) tanto para instalar MinKNOW, como para la adquisición y salida de datos. Las unidades de estado sólido son mucho más rápidas que los tradicionales discos duros y pueden mantener el ritmo creado por el flujo de datos generado durante el experimento de secuenciación.
Ordenadores de ejemplo
A continuación hay una lista no exhaustiva de ordenadores que cumplen o pueden configurarse para reunir los requisitos mínimos recomendados del MinION Mk1D. Procure configurar el ordenador para que cumpla las características de la tabla anterior. Hay otros fabricantes disponibles; compruebe la disponibilidad en su región.
• Apple MacBook Pro 14” M3 Max
• Razer Blade 18 (RTX 4070 o superior)
La lista anterior está actualizada hasta octubre de 2024. En el momento de leer este documento, puede que haya modelos equivalentes o más nuevos que hayan replazado a los modelos citados.
Requisitos informáticos
Los requisitos indicados a continuación sirven para garantizar un funcionamiento correcto del MinION durante un experimento de secuenciación:
Elemento | Requisitos mínimos |
---|---|
Nivel de privilegios de la cuenta de usuario | Se necesita permiso de administrador para instalar y actualizar MinKNOW. Para realizar experimentos de secuenciación no se necesita permiso de administrador. |
Conexión a internet | Se necesita una conexión a Internet constante para actualizar el programa y enviar los datos de telemetría. Las configuraciones sin conexión están disponibles para utilizar sobre el terreno y en expediciones. Si está pensando en utilizar el MinION sin conexión, contacte con Support en support@nanoporetech.com. |
Configuración antivirus | El programa antivirus que escanea todo el disco duro, consume una cantidad significativa de recursos y tal vez ocasione problemas de rendimiento. Por este motivo, se recomienda que los análisis antivirus se realicen de forma manual y no automática, para que se puedan realizar cuando el MinION no esté funcionando. |
Configuración actualizaciones SO | Las actualizaciones deben cambiarse al modo manual, ya que descargarlas durante un experimento de secuenciación tal vez afecte al rendimiento de la secuenciación. Las actualizaciones que requieran reiniciar el equipo detendrán los experimentos. |
Información de telemetría | HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida) o regla de DNS aplicada a ping.oxfordnanoportal.com |
Análisis en EPI2ME | Ethernet: HTTPS/puerto: 443 Acceso TCP a los rangos IP de AWS eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip- ranges.html |
Actualizaciones de programa | HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida) o una regla DNS aplicada a cdn.oxfordnanoportal.com |
Telemetría
MinKNOW reúne información de telemetría durante los experimentos de secuenciación, de acuerdo con los Términos y condiciones estipulados, que permiten supervisar el rendimiento de un dispositivo y facilitan la resolución de problemas a distancia. Algunos de estos datos provienen de campos de texto libre, así que no deberían incluir datos de identificación personal. Nosotros no recogemos ningún dato de secuenciación.
La aplicación de escritorio EPI2ME ofrece soluciones de análisis locales y en la nube para múltiples aplicaciones. La opción local depende de los recursos informáticos disponibles, mientras que la opción en la nube está alojada en AWS. Los datos se cargan en formatos de flujos de trabajo adecuados (por ejemplo, BAM, FASTQ) a través de la aplicación de escritorio EPI2ME, que procesa los datos utilizando flujos bioinformáticos personalizados Netflow, locales o alojados en la nube, y que proporciona informes html interactivos dentro de la aplicación. Las descargas de EPI2ME están disponibles en la misma aplicación y hay opción de descargar informes, archivos de registro y varios flujos de trabajo y archivos de datos. Es posible elegir uno a uno si se desea realizar el análisis localmente o en la nube (los datos no se almacenan en la nube).
Actualizaciones de programa
Dependiendo de la zona geográfica, se utilizará una de estas dos direcciones -178.79.175.200 o 96.126.99.215- para proporcionar actualizaciones al dispositivo. Las actualizaciones se activan como solicitudes de extracción, por lo que se requiere acceso solo de salida.
Tipos de archivos
Los datos de secuenciación por nanoporos se almacenan en tres tipos de archivos: POD5, FASTQ y BAM. La información del resumen de la identificación de bases se guarda en un archivo sequencing_summary.txt:
- POD5 es un formato de archivo desarrollado por Oxford Nanopore, que almacena datos de nanoporos sin procesar, de forma accesible y sustituye al formato, ya obsoleto, .fast5. Esta salida lee y escribe datos más rápido, utiliza menos recursos informáticos y tiene un tamaño de archivo de datos sin procesar más pequeño que .fast5. Los archivos POD5 se generan por lotes, cada 10 minutos. Si se utilizan códigos, los archivos pueden dividirse por códigos, pero esta función deberá activarse, ya que está desactivada por defecto.
- .fast5 es un formato de archivo obsoleto basado en el archivo .hdf5, que contiene toda la información necesaria para analizar datos de secuenciación por nanoporos y rastrearlos hasta su origen. Un archivo .fast5 contiene datos de múltiples lecturas (4000 lecturas como mínimo) y tiene varios cientos Mb de tamaño.
- FASTQ es un formato de almacenamiento de secuencias basado en texto, que contiene tanto la secuencia de ADN/ARN como sus índices de calidad. Por defecto, los experimentos de secuenciación por nanoporos guardan hasta 4000 secuencias de ADN en un archivo FASTQ. El tamaño del archivo puede variar de < 1 Mb o decenas de Mb, según el número y la longitud de las secuencias. Conservar solo los archivos FASTQ permitirá utilizar las herramientas de análisis habituales, utilizando la secuencia de ADN/ARN, pero no se podrán generar más datos cuando aparezcan nuevas versiones de identificador de bases.
- Los archivos BAM proporcionan resultados si se realizan alineaciones o identificación de bases modificadas en el conjunto de datos de bases identificadas. Los archivos BAM están desactivados por defecto y se activan automáticamente si se utiliza el alineamiento o la identificación de bases modificadas.
- Los archivos
sequencing_summary.txt
contienen metadatos de todas las lecturas de bases identificadas de un experimento individual. La información incluye un identificador de lecturas, longitud de secuencias, puntuación Q-score por lectura, duración, etc. El tamaño del archivo resumen de las secuencias dependerá del número de lecturas secuenciadas.
Los tamaños de archivo de ejemplo representados en la tabla siguiente están basados en diferentes rendimientos de una sola celda de flujo, con una ejecución que guarda archivos POD5, FASTQ y BAM, con un N50 de lectura de 23 kb.
Rendimiento celda de flujo (Gigabases) | Almacenamiento POD5 (Gigabytes) | Almacenamiento FASTQ.gz (Gigabytes) | BAM sin alinear con modificaciones (Gigabytes) |
---|---|---|---|
10 | 70 | 6,5 | 6 |
15 | 105 | 9,75 | 9 |
30 | 210 | 19,5 | 18 |
A medida que avance el experimento, se producirán archivos POD5 de todas las lecturas. Si decide identificar bases con sus datos, el programa MinKNOW utilizará esas lecturas para generar datos de secuenciación, que luego se almacenarán en archivos FASTQ o BAM.
Registro de cambios
Fecha | Versión | Cambios realizados |
---|---|---|
28 nov 2024 | V4 | En "Configurar un nuevo ordenador", se añadió el siguiente enunciado: "Nótese, el MinION Mk1D es compatible con la versión 24.06.16 de MinKNOW o una posterior". |
25 oct 24 | V3 | En la sección “Descripción general”, se ha revisado la descripción del dispositivo y se ha eliminado una imagen. - En “Configurar un nuevo ordenador”, se ha añadido la importancia de escoger un ordenador que cumpla con los requisitos informáticos. También se ha añadido que la conexión del ordenador al dispositivo solo es posible a través de puertos USB-C. Se ha modificado el requisito de la CPU para Windows y Linux, de “Procesador Intel o AMD con al menos 4 núcleos” a “Procesador Intel o AMD con al menos 4 núcleos/8 hilos”. - En la sección “Telemetría”, se ha actualizado la información sobre la aplicación EPI2ME y se ha añadido la opción de análisis local de datos utilizando recursos informáticos. |
31 jul 24 | V2 | En el apartado “Tipos de archivos” se ha actualizado la información sobre generación de datos de los archivos POD5, FASTQ y BAM. |
2024 | V1 | Publicación del documento inicial. |