Топ питань
Часова шкала
Чат
Перспективи

GenBank

база даних ДНК-послідовностей З Вікіпедії, вільної енциклопедії

GenBank
Remove ads

GenBank — публічно доступна база даних нуклеотидних послідовностей і супровідних анотацій для більш як 300 000 видів. Дані вносяться як окремими лабораторіями, так і великомасштабними проектами повного секвенування геномів, Патентне відомство США також доповнює GenBank послідовностями із виданих патентів. Розробкою і розповсюдженням GenBank займається Національний центр біотехнологічної інформації. Ця база даних разом із DDBJ та ENA (англ. European Nucleotide Archive), з якими вона щоденно обмінюється даними, входить до Міжнародної співпраці баз даних нуклеотидних послідовностей. Станом на серпень 2014 року GenBank містив 939 775 079 106 пар основ[1].

Thumb
Сотий реліз GenBank на CD диску

GenBank можна використовувати через систему Entrez NCBI, яка інтегрує інформацію із широкого спектра баз даних NCBI. NCBI Nucleotide поділений на три розділи: CoreNucleotide (основна частина), dbEST (Expressed Sequence Tags) і dbGSS (Genome Survey Sequences). Сервіс BLAST дозволяє порівнювати послідовності GenBank між собою та із послідовностями з інших джерел[2][3].

Remove ads

Поділ на розділи

Узагальнити
Перспектива

GenBank категоризує послідовності до кількох розділів в залежності від організму джерела або способу отримання даних[1].

Більше інформації Розділ, Опис ...

Поділ на розділи за організмами є історичним і не відображає сучасної класифікації. Через це, а також тому, що частина послідовностей певного організму можуть перебувати у розділі за технологією (наприклад, EST або HTG), для пошуку даних за організмом слід використовувати NCBI Taxonomy Browser [Архівовано 19 травня 2020 у Wayback Machine.].

Remove ads

Ідентифікатори і номери доступу послідовностей

Кожному запису, що складається із послідовності і супутньої інформації, присвоюється унікальний номер доступу, спільний для трьох баз даних, що співпрацюють (GenBank, DDBJ, ENA). Цей номер можна знайти у рядку ACCESSION відповідного запису. Він не змінюється впродовж всього часу існування запису, навіть якщо дані оновлюються. Натомість, зміни відображаються за допомогою суфікса номера доступу, що позначає версію. Початковою версією послідовності завжди є '.1'. Кожній версії нуклеотидної послідовності також присвоюється унікальний NCBI ідентифікатор — GI, його можна знайти у рядку VERSION, наприклад U49845.1 GI:1293613. Коли дані про послідовність оновлюються, нова версія отримує інший GI, а версія номера доступу інкрементується. З номером доступу без вказання версії можна знайти найновіші дані. Записи GenBank рекомендується цитувати із використанням номера доступу із вказанням версії[1].

Remove ads

Завантаження вмісту

Що два місяці NCBI випускає новий повний реліз GenBank, який можна безкоштовно завантажити через FTP. Крім того, щоденно виходять оновлення також вільні до завантаження[1].

Примітки

Посилання

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads