Aprocean

miércoles, 5 de noviembre de 2025

Científicos españoles del CSIC han desarrollado una herramienta de inteligencia artificial que predice nuevas funciones desconocidas de las proteínas

Aplicaciones en el medio marino
Autor: Salvador Lechuga Lombos + IA


Qué se ha desarrollado

Un equipo conjunto del Instituto de Biología Evolutiva (IBE) (CSIC-UPF) liderado por Rosa Fernández, y del Centro Andaluz de Biología del Desarrollo (CABD) (CSIC-Junta de Andalucía-UPO) liderado por Ana Rojas, ha anunciado una herramienta de inteligencia artificial llamada FANTASIA (Functional AnnoTAtion based on embedding space SImilArity) que puede predecir funciones desconocidas de las proteínas, partiendo solo de la secuencia genética (sin necesidad de referencias funcionales previas). CSIC+2Antena3+2

Algunos datos clave:

  • FANTASIA analizó cerca de 1.000 genomas animales completos con una precisión muy elevada. CSIC+1

  • Asignó funciones a unos 24 millones de genes codificantes de proteínas que antes formaban parte del “proteoma oscuro” (proteínas cuya función no se conocía). CSIC+1

  • Puede procesar un genoma completo en “horas en un ordenador corriente” o en ~30 minutos en un equipo especializado. CSIC

  • Es de acceso libre y de uso abierto para la comunidad. CSIC


Por qué es relevante

Este avance tiene implicaciones importantes en varias áreas:

  • Muchas proteínas codificadas en los genomas conocidos aún no tienen asignada función experimental o bioinformática: el “proteoma oscuro”. Esta herramienta reduce el vacío de conocimiento.

  • Permite acelerar estudios de biología básica, medicina, biotecnología: comprender mejor qué hacen las proteínas desconocidas puede abrir nuevas dianas terapéuticas o rutas metabólicas.

  • La velocidad y escala (genomas completos, millones de genes) hacen que el análisis funcional proteico deje de ser un cuello de botella tan grande.

  • Al usar modelos de lenguaje (embeddings de secuencias) para la predicción de función, se capitaliza la revolución de la IA en el ámbito de la biología – similar en espíritu (aunque distinto en enfoque) a herramientas como AlphaFold en predicción de estructuras.


Cómo funciona, en términos generales

Aunque los detalles técnicos completos no están en el comunicado de prensa, estos son los principios básicos conocidos:

  • A partir de la secuencia de aminoácidos (o del gen codificador) de una proteína sin función conocida, la herramienta calcula un embedding (representación numérica) en un espacio vectorial donde se agrupan proteínas con similitud funcional.

  • Luego, mediante semejanza en ese espacio (similaridad de embeddings) con proteínas ya anotadas, se infiere la función probable de la proteína objetivo.

  • No requiere “entrenar desde cero” para cada nuevo genoma: se basa en modelos ya preparados que permiten el análisis rápido de nuevos datos genómicos.

  • Gracias a los embeddings y al uso de “Big Data”, puede escalar a nivel de genoma completo.


Limitaciones y retos

  • Aunque la precisión es alta, no todas las predicciones serán correctas: como en toda IA aplicada a biología, hay que validar experimentalmente para confirmar la función.

  • Las funciones asignadas serán tan buenas como las anotaciones existentes y la representación del espacio funcional: para funciones muy novedosas o extremadamente divergentes, puede haber errores o incertidumbres.

  • La interpretación biológica de los resultados sigue requiriendo expertos en bioquímica / biología molecular: la herramienta sugiere la función, pero el “porqué” y el “cómo” siguen siendo trabajo de laboratorio.

  • Potencialmente, la herramienta puede asignar funciones mal, y hay que tener cuidado con su aplicación clínica o comercial sin validación.


Posibles implicaciones para el futuro

  • En medicina: descubrir nuevas proteínas implicadas en enfermedades, nuevas dianas farmacológicas, biomarcadores.

  • En biotecnología: identificar proteínas con funciones útiles para industria (enzimas, biocatalizadores, rutas metabólicas).

  • En evolución y genómica comparativa: entender qué funciones podían cumplir proteínas “hipotéticas” conservadas pero sin anotación.

  • En bioinformática: integración con otras herramientas de IA y biología computacional, mejora de modelos de función-proteína, predicción de interacciones proteína-proteína, etc.


Mi valoración

Me parece un avance muy significativo. Que un equipo español lidere una herramienta de esta escala y de acceso abierto es notable. Aunque no es la primera vez que se usan IA para predecir funciones de proteínas (ya había trabajos previos, por ejemplo en predicción de función usando deep learning en secuencias). arXiv+1 Pero esta lo hace a escala genómica, y con rapidez, lo que marca un salto.

Si quieres, puedo ver el artículo científico asociado, revisar los materiales suplementarios y preparar un resumen técnico con números (precisión, recall, qué tipos de funciones pueden predecir, qué limitaciones específicas). ¿Te lo preparo?


Aplicaciones en el medio marino


La capacidad de una IA como FANTASIA para predecir funciones desconocidas de proteínas tiene un enorme potencial en el medio marino, especialmente porque gran parte de la biodiversidad oceánica —incluyendo microorganismos— sigue siendo funcionalmente desconocida.

Aplicaciones estratégicas en el océano:


🌊 Aplicaciones en el medio marino

🧬 1. Descubrimiento de nuevas funciones biológicas en organismos marinos

Los océanos contienen miles de millones de proteínas aún sin función conocida —especialmente en:

  • fitoplancton

  • bacterias marinas

  • organismos de aguas profundas

  • extremófilos (hidrotermales, salinos, polares)

La IA puede:

  • Identificar nuevas rutas metabólicas.

  • Descubrir procesos bioquímicos únicos del océano.

  • Conectar proteínas desconocidas con funciones relacionadas con la adaptación marina.


🧪 2. Biotecnología azul

Predicción de proteínas con aplicaciones industriales:

  • Enzimas para bioplásticos biodegradables

  • Moléculas antifouling (para evitar incrustaciones en barcos)

  • Enzimas resistentes a presión, salinidad y frío para industria química/farmacéutica

  • Nuevos compuestos antibióticos y antivirales marinos

El mar es una mina de bioinnovación, y esta IA acelera su exploración.


🌱 3. Cambio climático y ciclos biogeoquímicos

Puede ayudar a identificar proteínas involucradas en procesos clave como:

  • Secuestro de carbono por plancton (bomba biológica oceánica)

  • Ciclos del nitrógeno y fósforo marinos

  • Mecanismos proteicos de resistencia al aumento de temperatura y acidificación

Esto aporta herramientas para:

  • Modelos climáticos más precisos

  • Biomarcadores de salud oceánica

  • Estrategias de conservación


🪸 4. Restauración de ecosistemas y corales

La IA puede revelar proteínas relacionadas con:

  • Respuesta al estrés térmico en corales

  • Regeneración de organismos marinos

  • Simbiosis coral-alga

  • Resistencia a patógenos marinos

Esto ayuda a diseñar estrategias para:

  • Mejorar resiliencia de corales

  • Seleccionar especies para repoblación marina

  • Diseñar tratamientos genéticos o probióticos marinos


🐠 5. Acuicultura avanzada

Aplicaciones directas en producción sostenible:

  • Identificación de proteínas en patógenos marinos para desarrollar vacunas

  • Biomarcadores para bienestar y crecimiento de peces

  • Diagnóstico temprano de enfermedades en moluscos y crustáceos

  • Optimización de microbiomas de larvas y juveniles

Acuicultura más limpia, eficiente y autosostenible.


🦠 6. Biodegradación marina y limpieza oceánica

Descubrimiento de proteínas para:

  • Descomponer microplásticos

  • Biodegradación de petróleo y contaminantes químicos

  • Tratamiento biológico de aguas marinas portuarias

Podría impulsar ecotecnología regenerativa oceánica.


🛰️ 7. Exploración marina profunda

Funcionalidad proteica en organismos abisales:

  • Adaptación a presión extrema

  • Proteínas fluorescentes para sensores submarinos

  • Biomecanismos útiles para robótica submarina y materiales avanzados


Visión estratégica

La herramienta puede integrarse con programas como:

  • Observatorios oceánicos

  • Flotas científicas (ROVs, AUVs)

  • Satélites oceánicos + muestreos genómicos

  • Proyectos de defensa y seguridad marítima bio-sensora

Esto enlaza con tus proyectos previos sobre:

  • I+D marino

  • Robótica oceánica

  • Centros tecnológicos en bases navales

  • Exploración polar


🚀 Conclusión

La IA para función proteica en el océano permite:

ImpactoResultado
Biología marinaDescubrimiento acelerado
ClimaModelos y mitigación
AcuiculturaProducción sostenible
Salud oceánicaSensores y biomarcadores
BiotecnologíaNuevas enzimas y compuestos
Defensa & exploraciónBiosensores y materiales avanzados

El mar deja de ser un misterio y se convierte en un laboratorio evolutivo a escala planetaria.

No hay comentarios:

Publicar un comentario