International Chemical Identifier
identificatiecode voor chemische verbindingen Van Wikipedia, de vrije encyclopedie
identificatiecode voor chemische verbindingen Van Wikipedia, de vrije encyclopedie
De International Chemical Identifier, afgekort InChI, is een tekstuele identificatiecode voor chemische stoffen, vooral bedoeld om moleculen ondubbelzinnig en op een voor mensen leesbare manier te coderen, waarbij het zoeken naar die stof in databanken en via het web gemakkelijker zou worden gemaakt.
De InChI werd ontwikkeld tussen 2000 en 2005 door de IUPAC en het National Institute of Standards and Technology (NIST). Zowel het formaat als de algoritmen zijn niet-propriëtair en de software is gratis ter beschikking gesteld onder de open-source-LGPL-licentie. De naam InChI is echter wel een handelsmerknaam van de IUPAC.[1]
Chemische stoffen worden door de InChI beschreven als zes lagen van informatie: de atomen, de bindingen ertussen, tautomerie, isotopen, stereochemie en lading. Niet alle lagen zijn verplicht; informatie over tautomerie hoeft bijvoorbeeld niet toegevoegd te worden indien dit niet van toepassing is op de molecule in kwestie. De InChI bevat geen informatie over de driedimensionale coördinaten van de atomen of de bindingsorde. Twee tautomere vormen van dezelfde molecule worden dus door dezelfde InChI beschreven, een pluspunt ten opzichte van alternatieven zoals SMILES.
InChI's verschillen van CAS-nummers in drie aspecten:
InChI's kunnen dus gezien worden als verkorte, geformaliseerde versies van de IUPAC-namen van stoffen.
Het InChI-algoritme zet structurele informatie om in een unieke InChI-identifier in drie stappen:
Elke InChI begint met de tekenreeks "InChI=" gevolgd door het versienummer, op dit moment 1. De resterende informatie is opgevat als een sequentie van lagen en sublagen, waarbij elke laag een specifieke soort informatie weergeeft. Lagen en sublagen worden gescheiden door een delimiter "/" en beginnen met een karakteristieke letter als prefix (dit geldt niet voor de sublaag "brutoformule" binnen de hoofdlaag). De zes lagen met hun belangrijkste sublagen zijn:
Dit delimiter-prefix-formaat heeft als groot voordeel dat men gemakkelijk een wildcard-zoekopdracht kan gebruiken om InChI's te vinden die alleen in bepaalde lagen overeenkomen.
CH3CH2OH ethanol |
InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
L-ascorbinezuur |
InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.