Банка на податоци за белковини
From Wikipedia, the free encyclopedia
Remove ads
Банка на податоци за белковини (англиски: Protein Data Bank, PDB) — база на податоци на тридимензионални структури на биолошки макромолекули, како што се белковините и нуклеинските киселини. Податоците главно се добиваат со рендгенска кристалографија, NMR спектроскопија или крио-електронска микроскопија и после поднесувањето од страна на истражувачите стануваат слободно достапни на Интернет преку мрежните места на организациите членки (PDBe,[1] PDBj,[2] и RCSB[3]). PDB е надгледувана од страна на организацијата наречена Worldwide Protein Data Bank, wwPDB.
Remove ads
PDB е клучен извор на информации во областа на структурната биологија, како што е структурната геномика. Повеќето големи научни списанија и некои донаторски агенции, бараат од научниците да ги поднесат структурите добиени од нивните истражувања на PDB. Многу други бази на податоци користат белковински структури депонирани во PDB. На пример, SCOP и CATH ги класифицираат белковинските структури, додека PDBsum обезбедува графички преглед на записите во PDB со користење на информации од други извори, како што е Онтологија на гени (анг. Gene ontology - GO).[4][5]
Remove ads
Историја
Иницијацијата на PDB се случила како резултат на конвергенцијата на две нешта: 1) мала, но растечка колекција на податоци за белковински структури добиени со дифракција на Х-зраци; и 2) новодостапното (1968 година) прикажување на молекуларна графика за визуелизација на овие структури во 3-D. Во 1969 година, со спонзорството на Волтер Хамилтон од Брукхејвенската национална лабораторија, Едгар Мејер (Тексашки А&М универзитет) започнал да пишува софтвер за складирање на податотеки со атомски координати во еден заеднички формат за да ги направи достапни за геометриска и графичка евалуација. До 1971 година, една од Мејеровите програми, SEARCH, им овозможила на истражувачите далечински пристап до информации од базата на податоци за офлајн проучување на белковински структури.[6] SEARCH бил инструментален во овозможувањето на вмрежувањето, а на тој начин го одбележал функционалниот почеток на PDB.
Банката на податоци за белковини, била објавена во октомври 1971 година во списанието Nature New Biology[7] како заеднички потфат на Кембричкиот центар за кристалографски податоци во Обединетото Кралство и Брукхејвенската национална лабораторија во САД.
По смртта на Хамилтон во 1973 година, Том Кецл го презел водството на PDB во следните 20 години. Во јануари 1994 година, Џоел Сусман од израелскиот Научен институт Вајзман бил назначен за раководител на PDB. Во октомври 1998 година,[8] PDB била префрлена на Истражувачката соработка за структурна биоинформатика (Research Collaboratory for Structural Bioinformatics - RCSB); трансферот завршил во јуни 1999 година. Нов директор била Хелен М. Берман од Рутгерс универзитетот (една од менаџерските институции на RCSB, а другата е Суперкомпјутерскиот центар во Сан Диего при Калифорнискиот универзитет во Сан Диего).[9] Во 2003 година, со формирањето на wwPDB (од анг. Worldwide Protein Data Bank), PDB станала меѓународна организација. Основачки членки се PDBe (Европа),[1] RCSB (САД) и PDBj (Јапонија).[2] Банката на податоци за биолошка магнетна резонанца (Biological Magnetic Resonance Data Bank - BMRB)[10] се приклучила во 2006 година. Секоја од четирите членки на wwPDB може да игра улога на центар за депонирање, центар за обработка на податоци и дистрибутивен центри за податоци на PDB. Обработката на податоците се однесува на фактот што персоналот на wwPDB го прегледува и анотира секој поднесен запис.[11] Потоа податоците автоматски се проверуваат за веродостојност (изворниот код[12] за овој софтвер за валидација е достапен за јавноста, без надомест).
Remove ads
Содржина


PDB базата на податоци се ажурира неделно (UTC+0 среда). Исто така, PDB листата[13] исто така се ажурира неделно. До 17 октомври 2018 година, тековната листа е следна:
- 120,052 структури во PDB имаат податотека за структурен фактор.
- 9,734 структури имаат NMR податотека.
- 3,486 структури во PDB имаат податотека за хемиски шифт.
- 2,531 структури во PDB имаат 3DEM мапна податотека депонирана во електронско-микроскопската банка на податоци (Electron Microscopy Data Bank - EMDB)
Овие податоци покажуваат дека повеќето структури се определени со дифракција на Х-зраци, но околу 10% од структурите сега се добиваат со јадрено магнетно резонантна спектроскопија на белковини. Кога се користи дифракција на Х-зраци, се добиваат приближни вредности за координатите на атомите на белковината, додека проценките за растојанијата помеѓу парови на атоми на белковината се добиваат со NMR експерименти. Затоа, конечната конформација на белковината се добива, во вториот случај, со решавање на геометриски проблем. Неколку структури на белковини се одредуваат со крио-електронска микроскопија.
Значењето на податотеките на структурниот фактор, споменато погоре, е дека, за PDB структурите определени со дифракција на Х-зраци кои имаат структурна податотека, може да се набљудува мапата на електронска густина. Податоците за таквите структури се складираат на „опслужувачот за електронска густина“.[14][15]
Во минатото, бројот на структури во PDB има пораснато со приближно експоненцијална стапка; во 1982 година биле надминати 100 регистрирани структури, во 1993 година биле надминати 1000 структури, во 1999 година 10,000 структури, а во 2014 година 100,000 структури.[16][17] Сепак, од 2007 година, стапката на акумулација на нови белковински структури се чини дека го достигнала своето плато.
Remove ads
Формат на податотека
Форматот на податотеката кој првично бил користен од PDB бил наречен формат на PDB-датотека (анг. Protein Data Bank (pdb) file format). Овој оригинален формат бил ограничен од ширината на компјутерските перфорирани картички до 80 карактери по линија. Околу 1996 година, форматот „макромолекуларен кристалографски информациски податотека“, mmCIF, кој е екстензија на CIF форматот, започнал постепено да се внесува. MmCIF сега е главниот формат на PDB архивата.[18] XML верзија на овој формат, наречена PDBML, била опишана во 2005 година.[19] Податотеките за структури можат да се преземат во кој било од овие три формати. Всушност, поединечните податотеки лесно се преземаат во графички пакети со користење на веб-адреси:
- За PDB формат на податотеки се користи, на пример,
http://www.pdb.org/pdb/files/4hhb.pdb.gz
илиhttp://pdbe.org/download/4hhb
- За PDBML (XML) податотеки се користи, на пример,
http://www.pdb.org/pdb/files/4hhb.xml.gz
илиhttp://pdbe.org/pdbml/4hhb
„4hhb“ е PDB назнака. Секоја структура објавена во PDB добива азбучнобројчена назнака со четири знаци, нејзината PDB ID. (Ова не може да се користи како назнака за биомолекули, бидејќи честопати неколку структури за истата молекула - во различни средини или конформации - се содржани во PDB со различни PDB IDs.)
Прикажување на податоците
Структурните податотеки може да се гледаат со користење на еден од неколкуте бесплатни и со отворен код компјутерски програми, вклучувајќи ги Jmol, Pymol, Visual molecular dynamics (VMD) и RasMol. Други неслободни шервер програми вклучуваат ICM-прелистувач,[20] MDL Chime, UCSF Chimera, Swiss-PDB Viewer,[21] StarBiochem[22] (интерактивен молекуларен прегледник заснован на Java со интегрирано пребарување на основа на податоци за белковини), Sirius visualization software и VisProt3DS (алатка за визуелизација на белковини во 3D стереоскопски преглед во анаглит и други режими) и Discovery Studio. Мрежната страница RCSB PDB содржи опсежна список на бесплатни и комерцијални програми за визуелизација на молекули и приклучоци за прелистувач.
Remove ads
Поврзано
- Кристалографска база на податоци
- Структура на белковините
- Предвидување на структурата на белковините
- База на податоци за белковински структури
- PDBREPORT ги наведува сите аномалии (и грешки) во PDB структурите
- PDBsum — екстрахира податоци од други бази на податоци за PDB структури
- Proteopedia — колаборативна 3D енциклопедија за белковини и други молекули
Наводи
Надворешни врски
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads