Nacionalni centar za biotehnološke informacije

From Wikipedia, the free encyclopedia

Nacionalni centar za biotehnološke informacijemap

Nacionalni centar za biotehnološke informacije (NCBI)[1][2] je dio Nacionalne medicinske biblioteke Sjedinjenih Država (NLM), ogranka Nacionalnog instituta za zdravstvo (NIH). Djelatnost mu odobrava i finansira vlada Sjedinjenih Država. Osnovan je 1988., na osnovu zakona koji je sponzorirao senatora Claude Pepper. NCBI se nalazi u gradu Bethseda, Maryland.

Kratke činjenice NACIONALNI CENTAR ZA BIOTEHNOLOŠKE INFORMACIJE, Skraćenica ...
NACIONALNI CENTAR
ZA
BIOTEHNOLOŠKE INFORMACIJE
Thumb
Logo NCBI-a
SkraćenicaNCBI
Datum osnivanja1988 .
VrstaDomaćin i uređivač niza baza podataka, relevantnih za biotehnologiju i biomedicinu i važan je resurs za alate i usluge iz oblasti bioinformatike.
StatusAktivan
Glavno sjedišteBethesda, Maryland, SAD
38.9959°N 77.0989°W / 38.9959; -77.0989
JezikEngleski
Br. volonteraPo potrebi
Veb-sajtwww.ncbi.nlm.nih.gov
Zatvori

NCBI je domaćin niza baza podataka, relevantnih za biotehnologiju i biomedicinu i važan je resurs za alate i usluge iz oblasti bioinformatike. Glavne baze podataka uključuju GenBank za sekvence DNK i PubMed, bibliografsku bazu podataka o biomedicinskoj literaturi. Ostale baze podataka uključuju bazu podataka NCBI Epigenomics. Sve ove baze dostupne su na mreži putem pretraživača Entrez. NCBI je režirao David Lipman,[2] jedan od originalnih autora programa poravnavanja sekvence BLAST [3] i široko cijenjena ličnost u bioinformatici. Vodio je također intramuralni istraživački program, uključujući grupe koje su vodili Stephen Altschul (još jedan koautor BLAST-a), David Landsman, Eugene Koonin, John Wilbur, Teresa Przytycka i Zhiyong Lu. David Lipman odstupio je sa svoje funkcije u maju 2017.[4]

GenBank

NCBI bio je odgovoran za stavljanje na raspolaganje GenBank DNK baza podataka o sekvencama od 1992.[5] GenBank se koordinira sa pojedinačnim laboratorijama i drugim bazama podataka o sekvencama, poput onih iz Evropske molekulske biološke laboratorije (EMBL) i DNK banke podataka Japana (DDBJ).[5]

Od 1992., NCBI je narastao tako da pruža i druge baze podataka pored GenBank-a. NCBI pruža gensku, bazu podataka molekulskog modeliranja (3D proteinske strukture) *OMIM,

  • dbSNP (baza podataka polimofizama jednog nukleotida),
  • Zbirku referentnih sekvenci,
  • Mapau ljudskog genoma i
  • Taksonomski pretraživač. Koordinira s Nacionalnim institutom za rak, kako bi osigurao Projekt anatomije genoma raka. NCBI dodjeljuje jedinstveni identifikator (taksonomski ID) svakoj vrsti organizma.[6]

NCBI ima softverske alate koji su dostupni putem internet pretraživača ili putem FTP-a. Naprimjer, BLAST je program pretraživanja sličnosti niza. Može uporediti sekvence sa GenBank DNK bazom podataka za manje od 15 sekundi.

NCBI "polica za knjige" (Bookshelf)

NCBI Bookshelf[7] je kolekcija slobodno dostupnih, online verzija odabranih biomedicinskih knjiga koje se mogu preuzeti. Polica s knjigama pokriva širok spektar tema, uključujući molekulsku biologiju, biohemija, ćelijsku biologiju, genetiku, mikrobiologiju, stanja bolesti s molekulske i ćelijske tačke viđenja, metode istraživanja i virusologiju. Neke knjige su mrežne verzije prethodno objavljenih knjiga, dok druge, poput "Pauza za kafu" (Coffee Break), potpisuje i uređuje osoblje NCBI. "Polica za knjige" je nadopuna spremišta Entrez PubMed, sažetaka recenziranih publikacija, a u tom sadržaju Bookshelf pruža utvrđene perspektive o evoluiranim područjima proučavanja.

BLAST

Osnovni alat za pretraživanje lokalnog poravnanja (Basic Local Alignment Search Tool – BLAST) je algoritam koji se koristi za izračunavanje sličnosti bioloških sekvenci , kao što su nukleotidne sekvence DNK i aminokiselinske sekvence proteina .[8] BLAST je moćan alat za pronalaženje sekvenci sličnih istraživanoj sekvenci u istom ili u različitim organizmima. Pretražuje datu sekvencu upita u NCBI bazama podataka i serverima i objavljuje rezultate natrag u pregledniku osobe u izabranom formatu. Ulazne sekvence za BLAST uglavnom su u FASTA ili Genbank formatu, dok se izlaz može isporučivati u različitim formatima, kao što su HTML, XML formatiranje i običan tekst. HTML je zadani izlazni format za NCBI-ovu web stranicu. Rezultati za NCBI-BLAST su predstavljeni u grafičkom formatu sa svim pronađenim pogocima, tabelomm sa identifikatorima sekvenci za slaganje koje imaju povezane podatke o bodovanju, zajedno sa poravnanjima za sekvencu od interesa i podudarnostima primljenim sa njihovim analognim BLAST rezultatima.[9]

Entrez

Entrez globalni sistem pretraživanja za više baza podataka koristi se u NCBI za sve glavne baze podataka, kao što su nukleotidne i proteinske sekvence, proteinske strukture, PubMed, Taxonomy, Complete Genomes, OMIM i nekoliko drugih.[10] Entrez je sistem za indeksiranje i pronalaženje koji sadrži podatke iz različitih izvora za biomedicinska istraživanja. NCBI je distribuirao prvu verziju Entreza 1991., sastavljenu od nukleotidnih sekvenci iz PDB i GenBank, proteinskih sekvenci iz SWISS-PROT-a, prevedenih u GenBank, PIR, PRF, PDB i povezanih sažetaka i citata iz PubMed-a. Entrez je posebno dizajniran za integriranje podataka iz nekoliko različitih izvora, baza podataka i formata u jedinstveni informativni model i sistem pretraživanja koji mogu efikasno dohvatiti relevantne reference, sekvenci i struktura.[11]

Gene

Gene je implementiran u NCBI kako bi se okarakterizirale i organizirale informacije o genima. Služi kao glavni čvor za genomske karte, ekspresije, sekvence, funkcije proteina, strukture i podatke o homologiji. Svakom zapisu gena dodjeljuje se jedinstveni GeneID koji se može pratiti kroz cikluse revizije. Geni su ovdje uspostavljeni zapisi za poznate ili predviđene gene, koji su razgraničeni položajima na mapi ili nukleotidnim sekvencama. Gene ima nekoliko prednosti u odnosu na svog prethodnika, LocusLink, uključujući bolju integraciju s drugim bazama podataka u NCBI, širi taksonomski opseg i poboljšane opcije za upite i pronalaženje koje pruža Entrez sistem.[12]

Protein

Protein je baza podataka o proteinima koja održava tekstni zapis za pojedinačne proteinske sekvence, izvedene iz mnogih različitih resursa, poput projekta NCBI referentne sekvence (Reference Sequence – RefSeq), GenBank, PDB i UniProtKB/SWISS-Prot. Evidencije proteina prisutne su u različitim formatima, uključujući FASTA i XML i povezane su s drugim resursima NCBI-a. Protein korisnicima pruža relevantne podatke kao što su geni, sekvence DNK/RNK, biološke puteve, podatke o ekspresiji i varijacijama i literaturom. Također pruža unaprijed određene skupove sličnih i identičnih proteina za svaku sekvencu, kako je izračunao u BLAS-u. Baza podataka strukture NCBI sadrži 3D skupove koordinata za eksperimentalno određene strukture u PDB-u koje unosi NCBI.

Baza podataka konzerviranih proteinskih domena (CDD) sadrži profile sekvenci koji karakteriziraju visoko konzervirane domene unutar proteinskih sekvenci. Takođe ima zapise iz vanjskih izvora, kao što su SMART i Pfam. Postoji još jedna baza podataka u bazi proteina, poznata kao baza proteinskih klastera, koja sadrži skupove proteinskih sekvenci koje su grupirane prema maksimalnom poravnanju između pojedinačnih sekvenci, kako je izračunao BLAST.[13]

Baza podatala Pubchem

Baza podataka PubChem u NCBI je javni resurs za molekule i njihove aktivnosti protiv bioloških ispitivanja. PubChem je pretraživ i za pronalaženje informacija dostupan mu je Entrez sistem.[14]

Također pogledajte

Reference

Vanjski linkovi

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.