Označavanje gena
From Wikipedia, the free encyclopedia
Remove ads
Označavanje gena, obilježavanje gena ili anotacija gena i/ili DNK/genoma je postupak identifikacije lokacije gena i svih kodirajućih regija u genomu i utvrđivanje njihovog djelovanja. Oznaka (bez obzira na kontekst) je dodatak u obliku objašnjenja ili komentara. Jednom kada se genom sekvencira, potrebno ga je označiti da bi to imalo smisla.[1]
Za obilježavanje DNK, prethodno nepoznata sekvenca predstavljanja genetičkog materijala obogaćena je informacijama koje se odnose genomski položaj do granica intron – egzon, regulacijska sekvenca , ponavljanja, imena gena i proteinskih proizvoda. Ova oznaka pohranjena je u genomskim bazama podataka kao to su Informatika o mišjem genomu, FlyBaza i WormBaza. Obrazovni materijali o nekim aspektima bioloških anotacija iz 2006 Gene Ontology anotacijskog kampa i slični događaji dostupni su na web lokaciji Gene Ontology.[2]
Nacionalni centar za biomedicinsku ontologiju (www.bioontology.org) razvio je alate za automatizirano označavanje[3] oznaka baze podataka na osnovu tekstnih opisa tih zapisa.
Kao općeniti metod, dcGO[4] ima automatiziranu proceduru za statističko zaključivanje asocijacija između pojmova ontologije i proteinskih domena ili kombinacija domena iz postojećih zapisa na nivou gena/proteina.
Remove ads
Proces
Anotacija genoma sastoji se od tri glavna koraka:[5]
- identificiranje dijelova genoma koji ne kodiraju proteine
- identificiranje elemenata na genomu, proces koji se naziva predviđanje gena
- vezanje bioloških informacija sa ovim elementima.
Alati za automatsko bilježenje pokušavaju izvršiti ove korake računarskom analizom, za razliku od ručne anotacije (tzv. kuracije ili nadgledanja) koja uključuje ljudsku stručnost. U idealnom slučaju, ovi pristupi koegzistiraju i nadopunjuju se u istoj oznaci kanala.
Jednostavan metod anotacije gena oslanja se na alate pretraživanja zasnovane na homologiji, poput BLAST, za traženje homolognih gena u određenim bazama podataka, a rezultirajuće informacije se zatim koriste za označavanje gena i genoma.[6] Međutim, kako se informacije dodaju na platformu za označavanje, ručni bilježnici postaju sposobni ukloniti odstupanja između gena kojima se daje ista bilješka. Neke baze podataka koriste informacije o kontekstu genoma, ocjene sličnosti, eksperimentalne podatke i integracije drugih resursa za pružanje anotacija genoma kroz svoj pristup podsistemima. Ostale baze podataka (npr. Ensembl oslanjaju se na kurirane izvore podataka, kao i na niz različitih softverskih alata u svom automatiziranom kanalu za oznake genoma.[7]
Strukturno označavanje sastoji se od identifikacije genomskih elemenata:
- ORF-ovi i njihova lokalizacija
- Struktura gena
- Kodirajuće regije
- Lokacija regulacijskih motiva
Funkcijske oznake sastoje se od vezanja bioloških informacija o genomskim elementima.
- Biohemijska funkcija
- Biološka funkcija
- Uključene regulacije i interakcije
- Ekspresija
Ovi koraci mogu uključivati i biološke eksperimente i analizu in silico . Pristupi zasnovani na proteogenomici koriste informacije iz eksprimiranih proteina, često izvedenih iz analize masenom spektrometrijom, za poboljšanje genomskih zapisa.[8]
Razvijeni su razni softverski alati koji omogućavaju da se gledaju i dijele komentari o genomu; naprimjer, MAKER.
Anotacija genoma ostaje glavni izazov za naučnike koji istražuju ljudski genom, sada kada su uglavnom dovršene sekvence genoma više od hiljadu ljudi (The 100.000 Genomes Project, UK) i nekoliko model organizama.[9][10] Identificiranje lokacija gena i drugih genetičkih kontrolnih elemenata često se opisuje kao definiranje biološke "liste dijelova" za sklop i normalan rad organizma.[6] Nauka je još uvijek u ranoj fazi procesa definiranja ovog popisa dijelova i razumijevanja kako se svi dijelovi "uklapaju".[11]
Označavanje genoma aktivno je područje istraživanja i uključuje niz različitih organizacija u zajednici nauka o životu, koje objavljuju rezultate napora u javnim biološkim bazama podataka, dostupnim putem Interneta i drugih elektronskih sredstava. Evo abecednog popisa tekućih projekata relevantnih za označavanje genoma:
- Enciklopedija DNK elemenata (ENCODE)
- Entrez Gene
- Ensembl
- GENCODE
- Gene Ontology konzorcij
- GeneRIF
- RefSeq
- Uniprot
- Projekt anotacija kičmenjaka i genoma (Vega).
Na Wikipediji, anotacije genoma počele su se automatizirati pod pokroviteljstvom portala Gene Wiki kojim upravlja bot koji prikuplja genetičke podatke iz istraživačkih baza podataka i kreira genske isječke na na toj osnovi.[12]
Remove ads
Reference
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads