Requisitos informáticos del MinION Mk1B
- Home
- Documentation
- Requisitos informáticos del MinION Mk1B
Requirements
Requisitos informáticos del MinION Mk1B
FOR RESEARCH USE ONLY
Contents
Requisitos informáticos del MinION Mk1B
- 1. Descripción general
- 2. Características técnicas del ordenador
- 3. Telemetría
- 4. Actualizaciones de programas
- 5. Tipos de archivos
Registro de cambios
Requisitos informáticos del MinION Mk1B
Descripción general
El MinION™ es un dispositivo pequeño y compacto para secuenciar por nanoporos. Se conecta directamente en un puerto USB tipo A o C, con un adaptador recomendado de 5 Gb/s. El programa MinKNOW™gestiona el dispositivo MinION. MinKNOW lleva a cabo varias tareas fundamentales. Entre ellas se incluyen la adquisición de datos, el análisis y la retroalimentación en tiempo real, la identificación de bases, transmisión de datos y la gestión del dispositivo, incluida la selección de los parámetros del experimento y la identificación de muestras y su seguimiento. Además, garantiza que la química de la plataforma funcione correctamente para procesar las muestras.
A pesar de su reducido tamaño, el MinION Mk1B puede secuenciar muchos gigabases en un único experimento de secuenciación. Por ello, se recomienda que los usuarios adquieran un ordenador potente para garantizar el acceso a todas las funciones que ofrece.
A continuación se muestra el flujo de trabajo del análisis de datos predeterminado cuando se empieza a utilizar MinKNOW:
Características técnicas del ordenador
A partir de la versión 23.07 de MinKNOW, el nuevo identificador de bases, Dorado, está integrado en el programa, lo que permite acelerar la identificación de bases tanto en la GPU de NVIDIA como en Apple Silicon. Para identificar bases recomendamos utilizar una GPU de NVIDIA o Silicon Mac de Apple, capaces de seguir el ritmo de generación de datos.
Parte | Características técnicas requeridas: GPU para identificación de bases de alta precisión | Características técnicas requeridas: adquisición de datos/CPU para identificación de bases (nótese, el rendimiento de la identificación de bases en CPU es limitado - se recomienda usar GPU) |
---|---|---|
Sistema operativo | Windows – 11 y 10 macOS – Sonoma (14), Ventura (13), Monterey (12) Linux – Ubuntu 22.04 and 20.04 | Windows – 11 y 10 macOS – Sonoma (14), Ventura (13), Monterey (12) Linux – Ubuntu 22.04 and 20.04 |
Memoria RAM | 16 GB de RAM o superior | 16 GB de RAM o superior |
CPU | Intel i7, i9, Xeon, o superior, con al menos 4 núcleos y 8 hilos Ryzen 5, 7, o superior, con al menos 4 núcleos y 8 hilos Apple silicon (M1, M2) | Intel i7, i9, Xeon, o superior, con al menos 4 núcleos y 8 hilos Ryzen 5, 7, o superior, con al menos 4 núcleos y 8 hilos Apple silicon (M1, M2) |
GPU | NVIDIA GPU RTX 2060 SUPER o superior, con al menos 8 GB memoria GPU. Hay información técnica en varias websites, por ejemplo https://www.techpowerup.com/gpu-specs/. Algunos ejemplos de fácil acceso incluyen la RTX 206 SUPER, RTX 2070, RTX 3060 y RTX 3070. Para mejorar el rendimiento, se recomiendan las GPU Ampere (las series 3000, series A, etc.). Apple silicon (M1, M2) Si está trabajando con un tipo de CPU diferente a los modelos mencionados arriba, compruebe que tiene capacidad de cálculo CUDA >6.1 (para más información sobre las GPU compatibles con CUDA, visite la página de NVIDIA). | - |
Almacenamiento | 1 TB de SSD interno o superior | 1 TB de SSD interno o superior |
Puertos | USB 3.0 | USB 3.0 |
Recomendamos el uso de almacenamiento interno de estado sólido para la instalación de MinKNOW, así como para la salida y adquisición de datos. Las unidades de estado sólido son mucho más rápidas que los tradicionales discos duros y pueden mantener el ritmo, creado por el flujo de datos generados durante el experimento de secuenciación.
Recomendaciones informáticas
A continuación hay algunos modelos de ordenadores que cumplen con los requisitos mínimos del MinION Mk1B o pueden configurarse para tenerlos. No hemos probado en profundidad ninguno de los modelos, por lo que la adquisición de cualquiera de ellos se realiza bajo su responsabilidad. No olvide configurar el ordenador para que cumpla las características de la tabla anterior. Hay otros fabricantes disponibles; compruebe su disponibilidad en su región.
Franja de rendimiento | Modelo de ordenador |
---|---|
Bajo: Sigue el ritmo de la identificación de bases rápida | M1 MacBook Air (2023) |
Medio: Sigue el ritmo de la identificación de bases de alta precisión | M2 Max 16” MacBook Pro (2023) / MacStudio |
Cómo conectar el MinION Mk1B a un ordenador sin un puerto USB-A
Si su ordenador no dispone de puerto USB-A, recomendamos utilizar un adaptador USB-A a USB-C (de hembra a macho, 5 Gb/s). A continuación hay una lista exhaustiva de ejemplos de adaptadores. No hemos probado de manera exhaustiva ninguno de los modelos, por lo que cualquier adquisición se hace bajo su responsabilidad.
Los requisitos indicados a continuación sirven para garantizar un funcionamiento correcto del MinION durante un experimento de secuenciación:
Elemento | Requisitos mínimos |
---|---|
Nivel de privilegios de la cuenta de usuario | Se necesita permiso de administrador para instalar y actualizar MinKNOW. Para realizar experimentos de secuenciación no se necesita permiso de administrador. |
Conexión a internet | Se necesita una conexión a Internet constante para actualizar el programa y enviar los datos de telemetría. Las configuraciones sin conexión están disponibles para uso sobre el terreno y en expediciones. Si está pensando en utilizar el MinION sin conexión, contacte con Support en support@nanoporetech.com. |
Configuración antivirus | El programa antivirus que escanea todo el disco duro consume una cantidad significativa de recursos y tal vez ocasione problemas de rendimiento. Por este motivo, se recomienda que los análisis antivirus se cambien a una configuración manual, en lugar de automática, para que se puedan realizar cuando MinION no esté funcionando. |
Ajustes de actualización del sistema operativo | Las actualizaciones del sistema operativo deben cambiarse al modo manual, ya que descargarlas durante un experimento de secuenciación tal vez afecte al rendimiento del mismo. Las actualizaciones que requieran reiniciar el equipo detendrán los experimentos. |
Información de telemetría | HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida) o regla de DNS para ping.oxfordnanoportal.com |
Análisis en EPI2ME | Ethernet: HTTPS/puerto: 443 Acceso TCP a AWS rangos IP eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip- ranges.html |
Actualizaciones de programas | HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida) o una regla DNS para cdn.oxfordnanoportal.com |
Telemetría
MinKNOW recoge información de telemetría durante los experimentos de secuenciación, de acuerdo con los Términos y condiciones, que permiten supervisar el rendimiento de un dispositivo y la resolución remota de problemas. Algunos de estos datos provienen de campos de texto libre, así que no debería incluir datos de identificación personal. No recogemos ningún dato de secuenciación.
La plataforma EPI2ME está alojada en AWS y proporciona soluciones de análisis basadas en la nube para múltiples aplicaciones. Los usuarios cargan datos de secuenciación en formato FASTQ a través del Agente de EPI2ME, que procesa los datos a través de flujos bioinformáticos definidos dentro del Portal EPI2ME. Las descargas de EPI2ME se realizan en forma de Datos + Telemetría o solo Telemetría. El portal de EPI2ME usa información de telemetría para cumplimentar informes.
Actualizaciones de programas
Dependiendo de la zona geográfica en la que esté, solo se utilizará una de las dos direcciones, 178.79.175.200 o 96.126.99.215, para suministrar actualizaciones al dispositivo. Las actualizaciones se activan como solicitudes de extracción, por lo que se requiere acceso solo de salida.
Tipos de archivos
Los datos de secuenciación por nanoporos se almacenan en tres tipos de archivos: POD5, FASTQ y BAM. La información general de bases identificadas se almacena en un archivo sequencing_summary.txt
POD5 es un formato de archivo desarrollado por Oxford Nanopore, que almacena datos de nanoporos de manera accesible y sustituye el formato .fast5, ya obsoleto. Esta opción lee y escribe datos más rápido, utiliza menos cómputo y tiene un tamaño de archivo de datos crudos más pequeño que .fast5. Los archivos POD5 se generan por lotes, cada 10 minutos. Si se utilizan códigos, los archivos pueden dividirse por códigos, pero esta función deberá activarse, ya que está desactivada por defecto.
.fast5 es un formato de archivo obsoleto basado en el archivo .hdf5, que contiene toda la información necesaria para analizar datos de secuenciación por nanoporos y rastrearlos hasta su origen. Un archivo .fast5 contiene datos de múltiples lecturas (4000 lecturas como mínimo) y tiene varios cientos de Mb de tamaño.
FASTQ es un formato de almacenamiento de secuencias basado en texto, que contiene tanto la secuencia de ADN/ARN como sus índices de calidad. Los archivos FASTQ se generan por lotes, regularmente. Por defecto, estos archivos se generan cada 10 minutos, sin embargo es posible configurar la frecuencia a una hora o hacer que se genere un archivo al final del experimento. También es posible procesar las lecturas por lotes, en función del número de lecturas por archivo.
Los archivos BAM proporcionan resultados si se realizan alineaciones o identificación de bases modificadas en el conjunto de datos de bases identificadas. Estos archivos están desactivados por defecto y se activan automáticamente si se utiliza el alineamiento o la identificación de bases modificadas.
Los archivos sequencing_summary.txt contienen metadatos sobre las lecturas de bases identificadas de un experimento individual. La información incluye el identificador de lecturas, la longitud de secuencias, el índice Qscore por lectura, la duración, etc. El tamaño del archivo resumen de las secuencias dependerá del número de lecturas secuenciadas.
Los tamaños de archivo de ejemplo representados en la tabla siguiente se basan en diferentes rendimientos de una celda de flujo individual, con una ejecución que guarda archivos POD5, FASTQ y BAM con un N50 de lectura de 23 kb.
Rendimiento celda de flujo (gigabases) | Almacenamiento POD5 (gigabytes) | Almacenamiento FASTQ.gz (gigabytes) | BAM sin alinear con modificaciones (gigabytes) |
---|---|---|---|
10 | 70 | 6.5 | 6 |
15 | 105 | 9,75 | 9 |
30 | 210 | 19,5 | 18 |
A medida que avance el experimento, se producirán archivos POD5 de todas las lecturas. Si decide identificar las bases de sus datos, el programa MinKNOW utilizará esas lecturas para generar datos de secuenciación, que luego se almacenarán en archivos FASTQ o BAM.
Registro de cambios
Fecha | Versión | Cambios realizados |
---|---|---|
2024-07-31 | V19 | En la sección “Tipos de archivos”, se ha actualizado la información sobre generación de datos en archivos POD5, FASTQ y BAM. |
2024-04-24 | V18 | - En las “Características técnicas del ordenador”, se han actualizado las recomendaciones de sistema operativo para Windows, macOS y Linux. - - Se han actualizado las recomendaciones de la CPU y GPU, que ahora incluyen Apple Silicon M1 y M2. |
2024-02-20 | V17 | - En el apartado "Recomendaciones informáticas", se ha eliminado la opción de alto rendimiento; también se han eliminado las referencias al muestreo adaptativo. |
2023-09-8 | V16 | - Se ha añadido una tabla con tamaños de archivos a la sección "Tipos de archivos". - Pequeñas correcciones y aclaraciones a lo largo del documento. |
2023-08-23 | V15 | - Se ha añadido una nueva sección:"Recomendaciones informáticas" - Se ha añadido una nueva sección: "Cómo conectar el MinION Mk1B a un ordenador sin un puerto USB-A" - Se ha añadido un parágrafo introductorio a la sección "Características técnicas del ordenador" - Se ha eliminado la nota "El dispositivo MinION, utilizado con el cable USB 3.0, tiene marca CE. Si el usuario desea utilizarlo con un cable USB-C, puede, pero ello invalida la marca CE y tal vez se produzcan errores al utilizar un adaptador". |
2022-08-04 | V14 | - En la "Lista de comprobación", se han modificado las características técnicas de la información de telemetría, el análisis de EPI2ME y las actualizaciones del programa. - Se ha eliminado la sección "Conexión a la red". - En la sección "Tipos de archivos" se ha añadido información sobre archivos POD5 y BAM. Se ha borrado temporalmente la tabla de comparación de tamaños de archivos. - La sección "Programa incluido" se ha eliminado. - Pequeñas correcciones y aclaraciones a lo largo del documento. |
2023-06-28 | V13 | - Se ha añadido la compatibilidad con Ubuntu 20.04 - Las características técnicas del ordenador se han modificado de "recomendadas" a "necesarias". Se han actualizado las características técnicas de la CPU Intel para requerir al menos 4 núcleos y 8 hilos. Se ha añadido la GPU Ampere a las recomendaciones de GPU. - Se ha reformulado el requisito de almacenamiento en estado sólido - Se ha revisado la cantidad de espacio de almacenamiento requerido para 1 Gigabyte de datos secuenciados. - En la sección ""Conexión a la red", se ha actualizado el intervalo IP de los Servicios web de Amazon (AWS) conforme al intervalo IP global de CloudFront. |
2022-04-21 | V12 | En la sección de características técnicas del ordenador, se ha actualizado el enlace al portal de mirror.oxfordnanoportal.com a cdn.oxfordnanoportal.com. |
2021-09-10 | V11 | Se ha suprimido la compatibilidad —errónea— con Ubuntu 20.04 |
2021-09-08 | V10 | Se ha añadido Windows 10 a la lista de sistemas operativos compatibles con la identificación de bases habilitada por GPU. |
2021-07-22 | V9 | En la tabla de requisitos mínimos, se han añadido dos nuevos campos: "Información de telemetría, análisis de EPI2ME" y "Actualizaciones del programa" |
2021-06-30 | V8 | - Se ha suprimido la lista de comprobación al principio de este documento - División de los requisitos informáticos entre Recomendados (GPU) y Mínimos (CPU) - Se han actualizado las recomendaciones de sistemas operativos para Windows (10), Mac OS (Mojave, Catalina) y Linux (18.04 y 20.04) - Actualización de las recomendaciones de CPU a i7 y i9, Xeon o mejor con más de 4 núcleos - Actualización de la descripción y uso de archivos .fast5 en la sección de MinKNOW - Actualización de la imagen de EPI2ME Agent - Se ha añadido una tabla de tamaños de archivos .fast5 y FASTQ con rendimientos de celdas de flujo diferentes |
2020-12-23 | V7 | - Se ha suprimido el requisito para acceder a la dirección IP 106.187.40.102 106.187.40.102 - Se han actualizado las GPU NVIDIA externas, compatibles con Tesla V100, Quadro GV100, Jetson TX2 y Jetson Xavier |
2020-10-23 | V6 | Actualización de la compatibilidad de OSX |
2020-07-03 | V5 | Actualización de la imagen 1 a 4.0.8 UI |
2020-05-18 | V4 | Se ha suprimido la compatibilidad de Bluetooth con MinIT |
2020-2 | V3 | Se ha añadido información acerca de la identificación de bases en GPU utilizando Guppy |