Top Qs
Línea de tiempo
Chat
Contexto
KEGG
De Wikipedia, la enciclopedia libre
Remove ads
Conocida como KEGG,(Enciclopedia de Genes y Genomas de Kioto) es una colección de bases de datos en línea de genomas, rutas enzimáticas, enfermedades, fármacos y sustancias químicas . La base de datos KEGG puede ser utilizada para la investigación y la educación en bioinformática, incluido el análisis de datos en genómica, metagenómica, metabolómica y otros estudios ómicos, modelado y simulación en biología de sistemas e investigación traslacional en el desarrollo de fármacos. A partir de julio de 2011, KEGG ha cambiado a un modelo de suscripción y el acceso a través de FTP que ya no es gratis.
Remove ads
Introducción
Resumir
Contexto
En la base de datos de KEGG, Kyoto Encyclopedia of Genes and Genomes, fue iniciado por el programa del genoma humano japonés en 1995.[1] Los desarrolladores consideran a KEGG de ser una "representación informática" del sistema biológico.[2] La base de datos KEGG puede ser utilizada para la modelización, simulación, navegación y extracción de datos. Formando parte del enfoque biología de sistemas.
El proyecto de la base de datos KEGG fue iniciado en 1995 por Minoru Kanehisa, profesor del Instituto de Investigación Química de la Universidad de Kioto, en el marco del entonces vigente Programa Japonés del Genoma Humano.[3][4] Previendo la necesidad de un recurso informático que permitiera la interpretación biológica de los datos de secuencias genómicas, comenzó a desarrollar la base de datos KEGG PATHWAY. Se trata de una colección de mapas de vías KEGG dibujados manualmente que representan el conocimiento experimental sobre el metabolismo y otras funciones de la célula y el organismo.
Cada mapa de vías contiene una red de interacciones y reacciones moleculares y fue diseñado para vincular los genes del genoma con los productos génicos (principalmente proteínas) de la vía. Esto permite el análisis denominado mapeo de vías KEGG, mediante el cual el contenido génico del genoma se compara con la base de datos KEGG PATHWAY para examinar qué vías y funciones asociadas probablemente están codificadas en el genoma.
Según sus desarrolladores, KEGG es una «representación informática» del sistema biológico.[5] El elemento integra los componentes básicos y los diagramas de cableado del sistema; más específicamente, los componentes genéticos de genes y proteínas, los componentes químicos de moléculas pequeñas y reacciones, y los diagramas de cableado de las redes de interacción y reacción molecular. Este concepto se materializa en las siguientes bases de datos de KEGG, categorizadas en sistemas, genómica, química e información de salud.
Remove ads
Bases de datos en KEGG
Resumir
Contexto
KEGG mantiene cinco bases de datos principales las cuales cuentan con características y funciones diferentes, tal cual se muestra en la siguiente tabla:[6]
Remove ads
Bases de datos
Resumir
Contexto
Información de sistemas
En KEGG, la base de datos de diagramas de cableado es considerado su elemento central, ya que articula e integra la información de los demás recursos. Consiste en una colección de mapas de vías que integran diversas entidades, como genes, proteínas, ARN, compuestos químicos, glicanos y reacciones químicas, así como genes relacionados con enfermedades y dianas farmacológicas. Estos mapas se almacenan como entradas individuales en otras bases de datos del sistema.

Los mapas de rutas se clasifican en las siguientes secciones:
- Metabolismo
- Procesamiento de la información genética, que incluye:
- Procesamiento de la información ambiental, como:
- Procesos celulares, como:
- Crecimiento celular
- Muerte celular
- Funciones de la membrana celular
- Sistemas orgánicos, entre ellos:
- Enfermedades
- Desarrollo de fármacos
Mapas metabólicos
Resumir
Contexto
La sección de metabolismo incluye mapas globales que permiten una visión general del metabolismo, además de los mapas específicos de rutas metabólicas. Los mapas globales, aunque son de baja resolución, son utilizados, por ejemplo, para comparar las capacidades metabólicas de diferentes organismos en estudios de genómica, así como de distintas muestras ambientales de metagenómica.
Módulo KEGG
En contraste con los mapas globales, los módulos KEGG almacenados en la base de datos KEGG MODULE son diagramas de mayor resolución que describen unidades funcionales específicas dentro de las rutas metabólicas. Estos módulos representan conjuntos de reacciones que están conservadas en determinados grupos taxonómicos, como rutas metabólicas particulares o complejos moleculares.[10]
Los módulos KEGG se definen como conjuntos de genes característicos que se vinculan a funciones metabólicas o fenotípicas específicas. Debido a esto, son herramientas clave para la interpretación automatizada de datos genómicos y metagenómicos, ya que permiten inferir capacidades funcionales directamente a partir de la presencia de genes en un genoma o en un metagenoma.[11]
Una base de datos que complementa a KEGG PATHWAY (Base de datos de rutas KEGG) era KEGG BRITE (Base de datos BRITE de KEGG), una base ontológica que se desarrolla dentro del mismo proyecto KEGG. A diferencia de KEGG PATHWAY, que se enfoca en representar gráficamente rutas metabólicas y redes de señalización mediante interacciones y reacciones moleculares, KEGG BRITE organiza la información de manera jerárquica, permitiendo la clasificación estructurada de genes, proteínas, fármacos, enfermedades, compuestos químicos y otros elementos biológicos.[12]
Además KEGG BRITE proporciona una visión sistemática y funcional de los componentes biológicos a través de árboles jerárquicos y relaciones funcionales entre entidades, lo que facilita su análisis desde una perspectiva más global o comparativa. Por ejemplo, permitiendo agrupar proteínas por familias funcionales, al clasificar fármacos según su mecanismo de acción o vincular genes con enfermedades según su función biológica.[13]
En este sentido, KEGG BRITE complementa a KEGG PATHWAY al añadir una capa adicional de organización conceptual, más centrada en la ontología y la taxonomía funcional, mientras que KEGG PATHWAY se centra en los detalles de las interacciones bioquímicas específicas.
Remove ads
Información genómica
Resumir
Contexto
Varios meses después del inicio del proyecto KEGG en 1995, se publicó el primer genoma bacteriano completamente secuenciado.[15]
Este primer genoma fue el de Haemophilus influenzae, marcando un hito en la biología molecular al ser el primer genoma de una bacteria completamente descifrado. Este logro fue liderado por el Dr. Craig Venter en el Instituto de Investigación Genómica (The Institute for Genomic Research).[16]
Desde entonces, todos los genomas completos publicados, tanto de eucariotas como de procariotas, han sido incorporados a KEGG . La base de datos KEGG GENES contiene información a nivel de genes y proteínas, mientras que KEGG GENOMES recopila información a nivel de organismo para estos genomas.
La base de datos de KEGG GENES (Base de datos de genes KEGG) consiste en un conjunto de genes correspondientes a los genomas completos, y cada gen recibe anotaciones que los vinculan a los diagramas de ruta (KEGG PATHWAY), módulos (KEGG MODULE) y jerarquías de BRITE.
Estas relaciones se establecen utilizando el concepto de ortólogos. Los mapas de rutas de KEEG se elaboran con base en evidencia experimental proveniente de organismos específicos, pero están diseñados para ser aplicables a distintos seres vivos, como humanos, y ratones, que suelen compartir rutas idénticas formadas por genes funcionalmente equivalentes, llamados ortólogos.
Todos los genes de KEGG GENES (Base de datos de genes KEGG) están agrupados de ortólogos dentro de la base de datos KEGG ORTHOLOGY (KO) (Base de datos de ortología KEGG).[17]Debido a que los nodos (es decir, productos génicos) de los mapas de rutas de KEGG, así como los módulos KEGG (Base de datos de módulos KEGG) y las jerarquías BRITE (Base de datos BRITE de KEGG), reciben identificadores KO (Clasificación ortológica de KEGG), se pueden establecer correspondencias automáticas entre estos elementos y los genes presentes en un genoma determinado.[18]

Además de ser una base de datos, KEGG también ofreció herramientas bioinformáticas:
Una vez que los genes de un genoma determinado se identifican y anotan con los genes de un genoma, se pueden asignar a los ortólogos correspondientes (KO), lo que permite mapear sistemáticamente las capacidades funcionales del organismo dentro del marco KEGG (Enciclopedia de Genes y Genomas de Kioto).
Estructura integradora del sistema KEGG
En la parte superior del sistema se encuentra KEGG, que actúa como núcleo integrador de distintas bases de datos biológicas. A partir de este núcleo se ramifican tres bases fundamentales:
- KEGG PATHWAY, encargada de representar rutas metabólicas e interacciones bioquímicas.
- KEGG MODULE, que contiene unidades funcionales más específicas, como rutas metabólicas conservadas o complejos enzimáticos.
- KEGG BRITE, que organiza de forma jerárquica entidades biológicas mediante clasificaciones ontológicas.[20]
Estas tres bases están interconectadas con:
- KEGG GENES, que proporciona anotaciones genéticas a nivel de gen y proteína.
- KEGG GENOME, que agrupa la información por organismo.[12]
Finalmente, la base de datos KEGG Orthology (KO) funciona como un conector evolutivo y funcional, al agrupar genes ortólogos en conjuntos equivalentes. Esto permite transferir funciones entre especies y realizar análisis automáticos de anotación funcional.[21]
Este sistema se representa comúnmente en forma de diagrama, lo cual ofrece una visión clara de cómo KEGG integra diferentes niveles de información biológica, desde genes individuales hasta rutas metabólicas completas.
Remove ads
Información química
Resumir
Contexto
Los mapas de vías metabólicas del KEGG se dibujan para representar los dos aspectos de la red metabólica: la red genómica, la cual explica cómo las enzimas codificadas por el genoma se conectan para catalizar reacciones consecutivas, y la red química, que explica cómo las estructuras químicas de los sustratos y productos se transforman mediante estas reacciones.[22][23]

Un conjunto de genes enzimáticos en el genoma se identifica en las redes de relaciones enzimáticas al superponerse a los mapas de las vías de KEGG, que a su vez caracterizan con las redes de transformación de la estructura química, lo que permite interpretar el potencial biosintético y de biodegradación del organismo. Por otro lado, un conjunto de metabolitos identificados en el metaboloma facilitó la comprensión de las vías y los genes enzimáticos implicados.[4]
Las bases de datos de la categoría de información química, denominadas colectivamente KEGG LIGAND, se organizan recopilando el conocimiento de la red química. Al inicio del proyecto KEGG, KEGG LIGAND constaba de tres bases de datos: KEGG COMPOUND especializado en compuestos químicos, KEGG REACTION que engloba las reacciones químicas de los compuestos que aparecen en KEGG COMPOUND, y finalmente KEGG ENZIME para reacciones de carácter enzimático;[24][25] estas bases de datos funcionan de manera similar, solo hace falta introducir uno de los varios nombre de un compuestos de tu interés, reacción química o reacciones de nomenclatura enzimática, y se obtendrá un listado de diferentes compuestos que posean cualquier combinación en su nombre que posea similitud con la búsqueda realizada, desde el compuesto que deseabas (de existir y recibir el nombre que se busco), hasta compuestos con un nombre más complejo; por ejemplo: en el caso de buscar la palabra alcohol en KEGG COMPOUND, aparecerán desde los compuestos más básicos hasta los más complejos que deriven de la combinación de cualquier nombre que posea alcohol, similar a como se muestra en la siguiente tabla de los resultados de búsqueda:[24]
Por otro lado, para KEGG REACTION el proceso de búsqueda es bastante similar, al igual que sus resultados:[26]
Así se ven los resultados de búsqueda en KEGG REACTION para la palabra alcohol, ordenados por número de entrada en su base de datos, su número de identificación en esta base de datos, el nombre que recibe esta reacción, y su proceso.
Para KEGG ENZIME, el resultado de búsqueda se puede dividir en dos partes, en primera instancia el listado de enzimas que estén relacionadas con la búsqueda realizada, y posterior a la selección de dicha enzima, una tabla de datos generales de la misma.[27]
Actualmente, existen bases de datos adicionales: KEGG GLYCAN para glicanos y dos bases de datos auxiliares de reacciones químicas denominadas RPAIR y RCLASS
RPAIR contiene los pares sustrato-producto implicados en las reacciones enzimáticas, es decir, descompone cada reacción bioquímica en uno o más pares de compuestos (substrato y producto), Cada reacción presente en KEGG REACTION se subdivide en uno o más RPAIR, que representan parejas explícitas entre moléculas involucradas en la reacción, uno de estos pares es identificado como el "principal" si aparece en los mapas de rutas metabólicas de KEGG, mientras que los otros pueden ser secundarios (cofactores, ligasas, etc.). Por su parte RCLASS clasifica reacciones enzimáticas, incluyendo no solo aquellas completamente caracterizadas (como las que tienen número EC), sino también reacciones putativas, es decir, reacciones químicas que aún no han sido descritas experimentalmente o cuya ecuación está incompleta. KEGG COMPOUND también se ha ampliado para incluir diversos compuestos, como xenobióticos, además de metabolitos.[26][28][29]
Remove ads
Información de salud
Resumir
Contexto
En KEGG, las enfermedades se consideran estados perturbados del sistema biológico causados por factores genéticos y ambientales, y los fármacos se consideran diferentes tipos de perturbadores. La base de datos KEGG PATHWAY incluye no solo los estados normales, sino también los estados perturbados de los sistemas biológicos. Sin embargo, no es posible trazar mapas de las vías de la enfermedad para la mayoría de las enfermedades debido a que hasta ahora no se han descrito completamente para todos los fármacos los mecanismos moleculares implicados. La base de datos KEGG DISEASE adopta un enfoque alternativo, que simplemente cataloga los factores genéticos y ambientales conocidos de las enfermedades. Estos catálogos podrían eventualmente conducir a diagramas de conexiones más completos de las enfermedades.[29][30]
Remove ads
Aplicaciones
Resumir
Contexto
INFORMACION SANITARIA
La información sanitaria en KEGG constituye una categoría especializada que integra conocimiento biomolecular sobre enfermedades humanas, fármacos y compuestos relacionados con la salud, permitiendo analizar cómo estos interactúan dentro de las redes moleculares del organismo. Esta sección facilita la vinculación entre datos clínicos y datos genómicos, brindando una perspectiva integral para el estudio de patologías y su tratamiento.[31]
Gracias a esta estructura, KEGG permite trazar conexiones entre enfermedades, medicamentos y vías metabólicas o de señalización, lo cual resulta fundamental para el análisis de mecanismos moleculares de enfermedades, la farmacogenómica y el diseño racional de terapias.[32]
La información sanitaria se organiza principalmente en tres bases de datos clave:
- ENFERMEDAD (KEGG DISEASE)
KEGG considera las enfermedades como estados alterados del sistema biológico, originados por factores genéticos, ambientales o ambos. Esta base de datos no se limita a listar enfermedades, sino que también asocia genes implicados, proteínas alteradas y otras moléculas clave, permitiendo identificar qué redes celulares o rutas metabólicas están perturbadas en condiciones patológicas. Aunque no todas las enfermedades cuentan con un mapa visual completo, KEGG DISEASE permite establecer asociaciones útiles para la investigación biomédica y la anotación funcional de genomas.[32]
- MEDICAMENTO (KEGG DRUG)
Esta base de datos incluye información detallada sobre fármacos aprobados en Japón, Estados Unidos y Europa, clasificados según su estructura química, mecanismo de acción, blancos moleculares (targets), y enzimas involucradas en su metabolismo. Cada medicamento se encuentra vinculado a vías metabólicas relevantes, genes, proteínas y enfermedades asociadas, lo cual facilita un enfoque sistémico en el análisis farmacológico y apoya la investigación en farmacogenómica y medicina personalizada.[31]
- ENTORNO (KEGG ENVIRON)
KEGG ENVIRON contiene información sobre compuestos relacionados con la salud humana que no son medicamentos aprobados como tal, incluyendo suplementos dietéticos, ingredientes de productos naturales, contaminantes ambientales y otras sustancias bioactivas. Esta base resulta útil para evaluar la influencia de factores externos sobre la salud y la biología molecular, complementando el estudio de enfermedades complejas.[31]
En conjunto, estas bases de datos conforman KEGG MEDICUS, una categoría integral que también incluye los prospectos clínicos de medicamentos comercializados en Japón, permitiendo acceder a información regulatoria y de uso terapéutico. KEGG MEDICUS representa así un puente entre la biología de sistemas y la práctica médica, útil tanto para investigadores como para profesionales de la salud.
Remove ads
Referencias
Enlaces externos
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads