Acide désoxyribonucléique
molécule présente dans toutes les cellules vivantes / De Wikipedia, l'encyclopédie encyclopedia
Cher Wikiwand IA, Faisons court en répondant simplement à ces questions clés :
Pouvez-vous énumérer les principaux faits et statistiques sur Acide désoxyribo-nucléique?
Résumez cet article pour un enfant de 10 ans
« ADN » redirige ici. Pour les autres significations, voir ADN (homonymie).
Pour les articles homonymes, voir DNA.
L'acide désoxyribonucléique, ou ADN, est une macromolécule biologique présente dans presque toutes[alpha 1] les cellules ainsi que chez de nombreux virus. L'ADN contient toute l'information génétique, appelée génome, permettant le développement, le fonctionnement et la reproduction des êtres vivants. C'est un acide nucléique, au même titre que l'acide ribonucléique (ARN). Les acides nucléiques sont, avec les peptides et les glucides, l'une des trois grandes familles de biopolymères essentiels à toutes les formes de vie connues.
Les molécules d'ADN des cellules vivantes sont formées de deux brins antiparallèles enroulés l'un autour de l'autre pour former une double hélice. On dit que l'ADN est bicaténaire, ou double brin. Chacun de ces brins est un polymère appelé polynucléotide. Chaque monomère qui le constitue est un nucléotide, lequel est formé d'une base nucléique, ou base azotée — adénine (A), cytosine (C), guanine (G) ou thymine (T) — liée à un ose — ici, le désoxyribose — lui-même lié à un groupe phosphate. Les nucléotides polymérisés sont unis les uns aux autres par des liaisons covalentes entre le désoxyribose d'un nucléotide et le groupe phosphate du nucléotide suivant, formant ainsi une chaîne où alternent oses et phosphates, avec des bases nucléiques liées chacune à un ose. L'ordre dans lequel se succèdent les nucléotides le long d'un brin d'ADN constitue la séquence de ce brin. C'est cette séquence qui porte l'information génétique. Celle-ci est structurée en gènes, qui sont exprimés à travers la transcription en ARN. Ces ARN peuvent être non codants — ARN de transfert et ARN ribosomique notamment — ou bien codants : il s'agit dans ce cas d'ARN messagers, qui sont traduits en protéines par des ribosomes. La succession des bases nucléiques sur l'ADN détermine la succession des acides aminés qui constituent les protéines issues de ces gènes. La correspondance entre bases nucléiques et acides aminés est le code génétique. L'ensemble des gènes d'un organisme constitue son génome.
Les bases nucléiques d'un brin d'ADN peuvent interagir avec les bases nucléiques d'un autre brin d'ADN à travers des liaisons hydrogène, qui déterminent des règles d'appariement entre paires de bases : l'adénine et la thymine s'apparient au moyen de deux liaisons hydrogène, tandis que la guanine et la cytosine s'apparient au moyen de trois liaisons hydrogène. Normalement, l'adénine et la cytosine ne s'apparient pas, tout comme la guanine et la thymine. Lorsque les séquences des deux brins sont complémentaires, ces brins peuvent s'apparier en formant une structure bicaténaire hélicoïdale caractéristique qu'on appelle double hélice d'ADN. Cette double hélice est bien adaptée au stockage de l'information génétique : la chaîne oses-phosphates est résistante aux réactions de clivage ; de plus, l'information est dupliquée sur les deux brins de la double hélice, ce qui permet de réparer un brin endommagé à partir de l'autre brin resté intact ; enfin, cette information peut être copiée à travers un mécanisme appelé réplication de l'ADN au cours duquel une double hélice d'ADN est recopiée fidèlement en une autre double hélice portant la même information. C'est en particulier ce qui se passe lors de la division cellulaire : chaque molécule d'ADN de la cellule mère est répliquée en deux molécules d'ADN, chacune des deux cellules filles recevant ainsi un jeu complet de molécules d'ADN, chaque jeu étant identique à l'autre.
Dans les cellules, l'ADN est organisé en structures appelées chromosomes. Ces chromosomes ont pour fonction de rendre l'ADN plus compact à l'aide de protéines, notamment d'histones, qui forment, avec les acides nucléiques, une substance appelée chromatine. Les chromosomes participent également à la régulation de l'expression génétique en déterminant quelles parties de l'ADN doivent être transcrites en ARN. Chez les eucaryotes (animaux, plantes, champignons et protistes), l'ADN est essentiellement contenu dans le noyau des cellules, avec une fraction d'ADN présent également dans les mitochondries ainsi que, chez les plantes, dans les chloroplastes. Chez les procaryotes (bactéries et archées), l'ADN est contenu dans le cytoplasme. Chez les virus qui contiennent de l'ADN, celui-ci est stocké dans la capside. Quel que soit l'organisme considéré, l'ADN est transmis au cours de la reproduction : il joue le rôle de support de l'hérédité. La modification de la séquence des bases d'un gène peut conduire à une mutation génétique, laquelle peut, selon les cas, être bénéfique, sans conséquence ou néfaste pour l'organisme, voire incompatible avec sa survie. À titre d'exemple, la modification d'une seule base d'un seul gène — celui de la β-globine, une sous-unité protéique de l'hémoglobine A — du génotype humain est responsable de la drépanocytose, une maladie génétique parmi les plus répandues dans le monde.
L'ADN « permet de constituer, par un enroulement en double hélice, des molécules de grande taille (macromolécules) constituant ainsi les chromosomes qui codent l'information génétique des êtres vivants »[1].
L'ADN est un long polymère formé par la répétition de monomères appelés nucléotides. Le premier ADN a été identifié et isolé en 1869 à partir du noyau de globules blancs par le Suisse Friedrich Miescher. Sa structure en double hélice a été mise en évidence en 1953 par le Britannique Francis Crick et l'Américain James Watson à partir des données expérimentales obtenues par les Britanniques Rosalind Franklin (en fait volées à cette dernière) et Maurice Wilkins (qui les a communiquées). Cette structure, commune à toutes les espèces, est constituée de deux chaînes polynucléotidiques hélicoïdales enroulées l'une autour de l'autre autour d'un axe commun, avec un pas d'environ 3,4 nm pour un diamètre d'environ 2,0 nm[2]. Une autre étude mesurant les paramètres géométriques de l'ADN en solution donne un diamètre de 2,2 à 2,6 nm avec une longueur par nucléotide de 0,33 nm[3]. Bien que chaque nucléotide soit très petit, les molécules d'ADN peuvent en contenir des millions et atteindre des dimensions significatives. Par exemple, le chromosome 1 humain, qui est le plus grand des chromosomes humains, contient environ 220 millions de paires de bases[4] pour une longueur linéaire de plus de 7 cm.
Dans les cellules vivantes, l'ADN n'existe généralement pas sous forme monocaténaire (simple brin) mais plutôt sous forme bicaténaire (double brin) avec une configuration en double hélice[2]. Les monomères constituant chaque brin d'ADN comprennent un segment de la chaîne désoxyribose–phosphate et une base nucléique liée au désoxyribose. La molécule résultant de la liaison d'une base nucléique à un ose est appelée nucléoside ; l'adjonction d'un à trois groupes phosphate à l'ose d'un nucléoside forme un nucléotide. Un polymère résultant de la polymérisation de nucléotides est appelé polynucléotide. L'ADN et l'ARN sont des polynucléotides.
L'ose constituant le squelette de la molécule est le 2’-désoxyribose, dérivé du ribose. Ce pentose alterne avec des groupes phosphate en formant des liaisons phosphodiester entre les atomes no 3’ et no 5’ de résidus de désoxyribose adjacents[5]. En raison de cette liaison asymétrique, les brins d'ADN ont un sens. Dans une double hélice, les deux brins d'ADN sont de sens opposés : ils sont dits antiparallèles. Le sens 5’ vers 3’ d'un brin d'ADN désigne conventionnellement celui de l'extrémité portant un groupe phosphate –PO32− vers l'extrémité portant un groupe hydroxyle –OH ; c'est dans ce sens qu'est synthétisé l'ADN par les ADN polymérases. L'une des grandes différences entre l'ADN et l'ARN est le fait que l'ose du squelette de la molécule est le ribose dans le cas de l'ARN à la place du désoxyribose de l'ADN, ce qui joue sur la stabilité et la géométrie de cette macromolécule.
La double hélice d'ADN est stabilisée essentiellement par deux forces : les liaisons hydrogène entre nucléotides d'une part, et les interactions d'empilement des cycles aromatiques des bases nucléiques d'autre part[6]. Dans l'environnement aqueux de la cellule, les liaisons π conjuguées de ces bases s'alignent perpendiculairement à l'axe de la molécule d'ADN afin de minimiser leurs interactions avec la couche de solvatation et, par conséquent, leur enthalpie libre. Les quatre bases nucléiques constitutives de l'ADN sont l'adénine (A), la cytosine (C), la guanine (G) et la thymine (T), formant respectivement les quatre nucléotides suivants, composant l'ADN :
Classification et appariement des bases nucléiques
Les quatre bases nucléiques de l'ADN sont de deux types : d'une part les purines — adénine et guanine — qui sont des composés bicycliques comprenant deux hétérocycles à cinq et six atomes respectivement, d'autre part les pyrimidines — cytosine et thymine — qui sont des composés monocycliques comprenant un hétérocycle à six atomes. Les paires de bases de la double hélice d'ADN sont constituées d'une purine interagissant avec une pyrimidine à travers deux ou trois liaisons hydrogène :
- une adénine interagit avec une thymine à travers deux liaisons hydrogène ;
- une guanine interagit avec une cytosine à travers trois liaisons hydrogène.
En raison de cette complémentarité, toute l'information génétique portée par l'un des brins de la double hélice d'ADN est également portée à l'identique sur l'autre brin. C'est sur ce principe que repose le mécanisme de la réplication de l'ADN, et c'est sur cette complémentarité entre bases nucléiques que reposent toutes les fonctions biologiques de l'ADN dans les cellules vivantes.
L'ADN de certains virus, tels que les bactériophages PBS1 et PBS2 de Bacillus subtilis, le bactériophage φR1-37 de Yersinia[7] et le phage S6 de Staphylococcus[8], peut remplacer la thymine par l'uracile, une pyrimidine habituellement caractéristique de l'ARN mais normalement absente de l'ADN, où on ne le trouve que comme produit de dégradation de la cytosine.
Appariements non canoniques entre bases nucléiques
Les bases nucléiques s'apparient le plus souvent en formant les paires de bases dites « Watson-Crick » correspondant à deux ou trois liaisons hydrogène établies entre deux bases orientées anti sur les résidus de désoxyribose. Des liaisons hydrogène peuvent cependant également s'établir entre une purine orientée syn et une pyrimidine orientée anti : il s'agit dans ce cas d'un appariement Hoogsteen. Une paire de bases Watson-Crick est susceptible d'établir en plus des liaisons hydrogène de type Hoogsteen avec une troisième base, ce qui permet la formation de structures à trois brins d'ADN.
- Appariements AT et GC : Watson-Crick (à gauche) et Hoogsteen (à droite).
- Appariements Hoogsteen et Watson-Crick entre trois bases.
Sens, antisens et ambisens
Seul l'un des brins d'un segment d'ADN constituant un gène est transcrit en ARN fonctionnel, de sorte que les deux brins d'un gène ne sont pas équivalents : celui qui est transcrit en ARN fonctionnel est dit à polarité négative et porte une séquence antisens, tandis que le brin complémentaire — qui peut également être transcrit en ARN, mais non fonctionnel — est dit à polarité positive et porte une séquence d'ADN sens. Le brin transcrit en ARN fonctionnel est parfois appelé brin codant, mais cette désignation n'est valable qu'au sein d'un gène donné car les deux brins d'une même double hélice d'ADN peuvent coder différentes protéines ; on parle alors de brins ambisens[9],[10],[11]. Des ARN sont également transcrits à partir des séquences d'ADN sens — avec par conséquent des séquences d'ARN antisens — aussi bien chez les procaryotes que chez les eucaryotes, mais leur rôle biologique n'est pas entièrement élucidé[12] ; l'une des hypothèses est que ces ARN antisens pourraient intervenir dans la régulation de l'expression génétique à travers l'appariement entre séquences d'ARN sens et antisens, qui sont, par définition, complémentaires[13].
La distinction entre brins d'ADN sens et antisens est brouillée dans certains types de gènes chevauchants, assez rares chez les procaryotes et les eucaryotes mais plus fréquents sur les plasmides et chez les virus, dans lesquels les deux brins d'un même segment d'ADN encodent chacun un ARN fonctionnel différent[14]. Chez les bactéries, ce chevauchement peut jouer un rôle dans la régulation de la transcription des gènes[15] tandis que, chez les virus, les gènes chevauchants accroissent la quantité d'information génétique susceptible d'être encodée dans la petite taille du génome viral[16].
Supertours et surenroulement
L'ADN relâché peut être linéaire, comme c'est typiquement le cas chez les eucaryotes, ou circulaire, comme chez les procaryotes. Il peut cependant être entortillé de façon parfois complexe sous l'effet de l'introduction de tours d'hélice supplémentaires ou de la suppression de tours dans la double hélice. La double hélice d'ADN ainsi surenroulée sous l'effet de supertours positifs ou négatifs présente un pas respectivement raccourci ou allongé par rapport à son état relâché : dans le premier cas, les bases nucléiques sont arrangées de façon plus compacte ; dans le second cas, elles interagissent au contraire de façon moins étroite[17]. In vivo, l'ADN présente généralement un surenroulement légèrement négatif sous l'effet d'enzymes appelées ADN topoisomérases[18], qui sont également indispensables pour relâcher les contraintes introduites dans l'ADN lors des processus qui impliquent que la double hélice soit déroulée pour en séparer les deux brins, comme c'est notamment le cas lors de la réplication de l'ADN et lors de sa transcription en ARN[19].
Propriétés physicochimiques de la double hélice
Les liaisons hydrogène n'étant pas des liaisons covalentes, elles peuvent être rompues assez facilement. Il est ainsi possible de séparer les deux brins de la double hélice d'ADN à la façon d'une fermeture à glissière aussi bien mécaniquement que sous l'effet d'une température élevée[20], ainsi qu'à faible salinité, à pH élevé — solution basique — et à pH faible — solution acide, qui altère cependant l'ADN notamment par dépurination. Cette séparation des brins d'un ADN bicaténaire pour former deux molécules d'ADN monocaténaires est appelé fusion ou dénaturation de l'ADN. La température à laquelle 50 % de l'ADN bicaténaire est dissocié en deux molécules d'ADN monocaténaire est dite température de fusion ou température de semi-dénaturation de l'ADN, notée Tm. On peut la mesurer en suivant l'absorption optique à 260 nm de la solution contenant l'ADN : cette absorption augmente au cours du désappariement, ce qu'on appelle hyperchromicité. Les molécules d'ADN monocaténaire libérées n'ont pas de configuration particulière, mais certaines structures tridimensionnelles sont plus stables que d'autres[21].
La stabilité d'une double hélice d'ADN dépend essentiellement du nombre de liaisons hydrogène à briser pour en séparer les deux brins. Par conséquent, plus la double hélice est longue, plus elle est stable. Cependant, les paires GC étant unies par trois liaisons hydrogène au lieu de deux pour les paires AT, la stabilité de molécules d'ADN bicaténaires de même longueur croît avec le nombre de paires GC qu'elles contiennent[22], mesuré par leur taux de GC. Cet effet est renforcé par le fait que les interactions d'empilement entre bases nucléiques d'un même brin d'ADN sont plus fortes entre résidus de guanine et de cytosine, de sorte que la séquence de l'ADN influence également sur sa stabilité. La température de fusion de l'ADN dépend par conséquent de la longueur des molécules, de leur taux de GC, de leur séquence, de leur concentration dans le solvant et de la force ionique dans celui-ci. En biologie moléculaire, on observe que les segments d'ADN bicaténaire dont la fonction implique que les deux brins de la double hélice puissent s'écarter facilement possèdent un taux élevé de paires AT[23] : c'est le cas de la séquence TATAAT typique de la boîte de Pribnow de certains promoteurs.
Géométrie de la double hélice
Les deux brins de l'ADN forment une double hélice dont le squelette détermine deux sillons. Ces sillons sont adjacents aux paires de bases et sont susceptibles de fournir un site de liaison pour diverses molécules. Les brins d'ADN n'étant pas positionnés de façon symétrique par rapport à l'axe de la double hélice, ils définissent deux sillons de taille inégale : le grand sillon est large de 2,2 nm tandis que le petit sillon est large de 1,2 nm[24]. Les bords des bases nucléiques sont plus accessibles dans le grand sillon que dans le petit sillon. Ainsi, les protéines, telles que les facteurs de transcription, qui se lient à des séquences spécifiques dans l'ADN bicaténaire le font généralement au niveau du grand sillon[25].
Il existe de nombreux conformères possibles de la double hélice d'ADN. Les formes classiques sont appelées ADN A, ADN B et ADN Z, dont seules les deux dernières ont été observées directement in vivo[5]. La conformation adoptée par l'ADN bicaténaire dépend de son degré d'hydratation, de sa séquence, de son taux de surenroulement, des modifications chimiques des bases qui le composent, de la nature et de la concentration des ions métalliques en solution, voire de la présence de polyamines[26].
- L'ADN B est la forme la plus courante de la double hélice dans les conditions physiologiques des cellules vivantes[27]. Il ne s'agit cependant pas d'une conformation définie par des paramètres géométriques stricts mais plutôt d'un ensemble de conformations apparentées survenant aux niveaux d'hydratation élevés observés dans les cellules vivantes. Leur étude par cristallographie aux rayons X révèle des diagrammes de diffraction et de diffusion caractéristiques de paracristaux moléculaires très désordonnés[28]. La forme B est une hélice droite avec des paires de bases perpendiculaires à l'axe de l'hélice passant au centre de l'appariement de ces dernières. Un tour d'hélice a une longueur d'environ 3,4 nm et contient en moyenne 10,4 à 10,5 paires de bases, soit environ 21 nucléotides, pour un diamètre de l'ordre de 2,0 nm. Les bases sont orientées en position anti sur les résidus de désoxyribose, lesquels présentent un plissement endocyclique C2’-endo du cycle furanose. Les deux sillons de cette configuration ont une largeur typique de 2,2 nm pour le grand et de 1,2 nm pour le petit[24].
- L'ADN A s'observe dans les échantillons d'ADN plus faiblement hydraté, à force ionique plus élevée, en présence d'éthanol ainsi qu'avec les hybrides bicaténaires d'ADN et d'ARN. Il s'agit d'une double hélice droite dont l'axe ne passe plus par les paires de bases. Cette double hélice est plus large, avec un diamètre de l'ordre de 2,3 nm mais un pas de seulement 2,8 nm pour 11 paires de bases par tour d'hélice. Les bases elles-mêmes demeurent orientées en position anti sur les résidus de désoxyribose, mais ces derniers présentent un plissement endocyclique C3’-endo.
- L'ADN Z est plus contraint que les formes A et B de l'ADN et s'observe préférentiellement dans les régions riches en paires guanine–cytosine lors de la transcription de l'ADN en ARN. Il s'agit d'une double hélice gauche, dont l'axe s'écarte significativement des paires de bases. Cette double hélice est plus étroite, avec un diamètre d'environ 1,8 nm et un pas d'environ 4,5 nm pour 12 paires de bases par tour d'hélice. Les pyrimidines sont orientées en position anti sur les résidus de désoxyribose, dont le cycle furanose possède en leur présence un plissement C2’-endo, tandis que les purines sont orientées en position syn sur des résidus de désoxyribose qui possède en leur présence un plissement endocyclique C2’-exo. La forme Z de l'ADN serait notamment provoquée in vivo par une enzyme appelée ADAR1[29],[30],[31].
Paramètre | ADN A | ADN B | ADN Z |
---|---|---|---|
Sens de l'hélice | droite | droite | gauche |
Motif répété | 1 bp | 1 bp | 2 bp |
Angle de rotation par paire de bases | 32,7° | 34,3° | 60°/2 |
Nombre de paires de bases par tour d'hélice | 11 | 10,5 | 12 |
Pas de l'hélice par tour | 2,82 nm | 3,32 nm | 4,56 nm |
Allongement de l'axe par paire de bases | 0,24 nm | 0,32 nm | 0,38 nm |
Diamètre | 2,3 nm | 2,0 nm | 1,8 nm |
Inclinaison des paires de bases sur l'axe de l'hélice | +19° | −1,2° | −9° |
Torsion moyenne (propeller twist) | +18° | +16° | 0° |
Orientation des substituants des bases sur les résidus osidiques | anti | anti | Pyrimidine : anti, Purine : syn |
Plissement / torsion endocyclique du furanose (Sugar pucker) | C3’-endo | C2’-endo | Cytosine : C2’-endo, Guanine : C3’-endo |
Géométries particulières et configurations remarquables
- Jonction de Holliday — Une jonction de Holliday est formée lors de la recombinaison homologue entre deux molécules d'ADN portant la même information génétique (chromosomes homologues, chromatides sœurs, etc.). Cette jonction présente une configuration cruciforme avec souvent des séquences symétriques qui lui permettent de se déplacer dans un sens ou dans l'autre. Sa résolution est effectuée par un complexe enzymatique appelé résolvase (EC 3.1.22.4) et peut conduire à un enjambement entre les deux molécules, aboutissant à un échange de matériel génétique[35].
- ADN en épingle à cheveux — Les séquences d'ADN palindromiques peuvent se replier en formant des structures dites tige-boucle ou en épingle à cheveux[36]. Certaines répétitions, particulièrement les répétitions de trinucléotides (CAG)n ou (CTG)n peuvent former des épingles à cheveux imparfaites dans lesquelles les résidus de cytosine et de guanine sont appariés tandis que les résidus d'adénine ou de thymine ne le sont pas[37].
- ADN H ou ADN triplex — Cette forme d'ADN tricaténaire (triple brin) pourrait jouer un rôle dans la régulation fonctionnelle de l'expression des gènes en modulant leur transcription en ARN.
- ADN G ou G-quadruplex — L'extrémité des chromosomes linéaires est constitué d'une région spécialisée appelée télomère dont la fonction principale est de permettre la réplication de l'extrémité des chromosomes à l'aide d'une enzyme spécifique, la télomérase, dans la mesure où les enzymes qui répliquent l'ADN ne peuvent recopier l'extrémité 3' des chromosomes[38]. Ces structures protègent les extrémités des chromosomes et empêchent les systèmes de réparation de l'ADN de les considérer comme endommagées[39]. Dans les cellules humaines, les télomères sont généralement constitués d'ADN monocaténaire répétant des milliers de fois la simple séquence TTAGGG[40]. Ces séquences riches en résidus de guanine forment des « G-quartets » résultant de l'appariement Hoogsteen entre quatre résidus de guanine ; l'empilement de ces structures à quatre résidus de guanine forme un G-quadruplex à la structure particulièrement stable[41]. Ces structures sont également stabilisées par la chélation d'ions métalliques au centre de chaque G-quartet[42].
- ADN ramifié — L'ADN s'effile à une extrémité de la double hélice lorsque les séquences de ses deux brins cessent d'y être complémentaires : les deux brins s'écartent l'un de l'autre et la molécule adopte une configuration en Y. L'ADN peut alors se ramifier si un troisième brin possède une séquence susceptible de s'apparier avec les deux extrémités libres des deux brins effilés. Il se forme alors une structure en Y intégralement bicaténaire. Il est possible d'envisager des ramifications plus complexes avec de multiples branches[43].
- ADN H ou triplex
(3e brin en jaune)
- ADN effilé
- ADN ramifié
- Ramifications mutliples
Modifications des bases nucléiques
L'expression génétique de l'ADN dépend de la façon dont l'ADN est conditionné dans les chromosomes en une structure appelée chromatine. Certaines bases peuvent être modifiées lors de la formation de la chromatine, les résidus de cytosine des régions peu ou pas exprimées génétiquement étant généralement fortement méthylées, et ce majoritairement aux sites CpG. Les histones autour desquelles l'ADN est enroulé dans les chromatines peuvent également être modifiées de façon covalente. La chromatine elle-même peut être modifiée par des complexes de remodelage de la chromatine. De plus, la méthylation de l'ADN et la modification covalente des histones sont coordonnées pour affecter la chromatine et l'expression des gènes[45].
Ainsi, la méthylation des résidus de cytosine produit de la 5-méthylcytosine, qui joue un rôle important dans l'inactivation du chromosome X[46]. Le taux de méthylation varie entre organismes, le nématode Caenorhabditis elegans en étant totalement dépourvu tandis que les vertébrés ont environ 1 % de leur ADN contenant de la 5-méthylcytosine[47].
Les pyrimidines ont une structure moléculaire très similaire. Ainsi, la cytosine et la 5-méthylcytosine peuvent être désaminées pour produire l'uracile (qui n'est pas une base faisant partie du code de l'ADN) et la thymine, respectivement. La réaction de désamination pourrait par conséquent favoriser les mutations génétiques[48],[49].
Il existe également d'autres bases modifiées dans l'ADN, résultant par exemple de la méthylation de résidus d'adénine chez les bactéries[50] mais également chez des nématodes (Caenorhabditis elegans[51]), des algues vertes (Chlamydomonas[52]) et des drosophiles[53]. La 5-hydroxyméthylcytosine est un dérivé de la cytosine particulièrement abondant dans le cerveau des mammifères[54]. Des organismes tels que les flagellés Diplonema et Euglena et le genre Kinetoplastida, contiennent par ailleurs une pyrimidine glycosylée issue de l'uracile et appelée base J[55],[56] ; cette base modifiée agit comme signal de terminaison de transcription pour l'ARN polymérase II[57],[58]. Un certain nombre de protéines qui se lient spécifiquement à la base J ont été identifiées[59],[60],[61].
Lésions de la double hélice
L'ADN peut être endommagé par un grand nombre de mutagènes qui modifient sa séquence. Ces mutagènes comprennent les oxydants, les alkylants, les rayonnements électromagnétiques énergétiques tels que les ultraviolets et les rayons X et gamma, ainsi que les particules subatomiques des rayonnements ionisants tels que ceux résultant de la radioactivité voire des rayons cosmiques. Le type de dommages produits dépend du type de mutagène. Ainsi, les rayons ultraviolets sont susceptibles d'endommager l'ADN en produisant des dimères de pyrimidine en établissant des liaisons entre bases adjacentes d'un même brin d'ADN[63]. Les oxydants tels que les radicaux libres ou le peroxyde d'hydrogène produisent plusieurs types de dommages, comme des modifications de bases, notamment de la guanosine, et des cassures de la structure bicaténaire[64]. Une cellule humaine typique contient environ 150 000 bases endommagées par un oxydant[65]. Parmi ces lésions dues à des oxydants, les plus dangereuses sont les ruptures bicaténaires parce que ce sont les plus difficiles à réparer et qu'elles sont susceptibles de produire des mutations ponctuelles, des insertions et des délétions au sein de la séquence d'ADN, ainsi que des translocations chromosomiques[66]. Ces mutations sont susceptibles de provoquer des cancers. Les altérations naturelles de l'ADN, qui résultent par exemple de processus cellulaires produisant des dérivés réactifs de l'oxygène, sont assez fréquentes. Bien que les mécanismes de réparation de l'ADN résorbent l'essentiel de ces lésions, certaines d'entre elles ne sont pas réparées et s'accumulent au fil du temps dans les tissus postmitotiques des mammifères. L'accumulation de telles lésions non réparées semble être une importante cause sous-jacente du vieillissement[67],[68].
De nombreux mutagènes s'insèrent dans l'espace entre deux paires de bases adjacentes selon un mode qu'on appelle intercalation. La plupart des intercalations sont le fait de composés aromatiques et de molécules planes, telles que le bromure d'éthidium, les acridines, la daunorubicine ou la doxorubicine. Les bases doivent s'écarter afin de permettre l'insertion du composé d'intercalation, ce qui provoque une distorsion de la double hélice par désenroulement partiel. Ceci bloque à la fois la transcription et la réplication de l'ADN, entraînant cytotoxicité et mutations[69]. En conséquence, les composés d'intercalation peuvent être cancérogènes et, dans le cas du thalidomide, tératogènes[70]. D'autres composés tels que le benzo[a]pyrène diol époxyde et l'aflatoxine forment avec l'ADN des adduits qui provoquent des erreurs lors de la réplication[71]. Cependant, en raison de leur aptitude à bloquer la transcription et la réplication de l'ADN, d'autres toxines semblables sont également utilisées en chimiothérapie contre les cellules à prolifération rapide[72].