Un estudio conducido por el Instituto de Biología Integrativa de Sistemas (I2SysBio, UV-CSIC) ha identificado un número significativo de errores en las secuencias de ciertas mutaciones del virus SARS-CoV-2. Esto se observó al comparar datos de GISAID, la mayor base de datos utilizada durante la pandemia, con información obtenida de la secuenciación directa de genomas. Según CSIC, los resultados revelan debilidades en las bases de datos públicas y ayudarán a mejorar la vigilancia del virus, así como los métodos de detección y los procesos clínicos de intervención.
Publicado en la revista Virus Evolution, el estudio aporta una nueva perspectiva sobre la habilidad del virus SARS-CoV-2 para mutar e infectar a los humanos. Se ha descubierto que muchos de los supuestos errores de mutación en la proteína spike del virus, una de las partes más variables del genoma y clave en la infección de células humanas, se originaron durante el procesamiento en grandes bases de datos genéticas. Las herramientas informáticas empleadas en el análisis de millones de secuencias virales pueden inducir a error, sugiriendo incorrectamente que el virus corrige ciertas mutaciones con mayor frecuencia.
Al cotejar los datos procesados con los obtenidos directamente de la secuenciación genómica, el equipo ha logrado una visión más precisa de los cambios genéticos del virus. Mireia Coscollà Devís, investigadora del CSIC en I2SysBio y líder del proyecto, señaló que el procesamiento diferencial de secuencias en el GISAID por distintos laboratorios ha introducido distorsiones significativas en algunos marcadores.
Aunque la investigación destaca la importancia de revisar meticulosamente los datos genéticos para evitar conclusiones equivocadas, en España no se cuenta con una recopilación centralizada de datos de secuencias de patógenos, ni con políticas de intercambio de datos anonimizados entre instituciones de salud y científicas, detallaron las fuentes. Esta carencia dificulta el seguimiento y la respuesta a enfermedades infecciosas, incluyendo la resistencia a antimicrobianos, como indicó Fernando González-Candelas, catedrático de Genética de la Universitat de València.
El estudio, liderado por el I2SysBio con participación del Instituto de Biomedicina de Valencia (IBV, CSIC) y el Instituto de Investigación Sanitaria La Fe (IIS-La Fe), ha sido financiado por el Ministerio de Ciencia, Innovación y Universidades, la Unión Europea a través de NextGenerationEU/PRTR, la Generalitat Valenciana y el Fondo Social Europeo. Los trabajos computacionales se realizaron en el clúster de computación de alto rendimiento Garnatxa del Instituto de Biología Integrativa de Sistemas.