상위 질문
타임라인
채팅
관점
유전자 패밀리
위키백과, 무료 백과사전
Remove ads
유전자 패밀리(gene family)는 단일 유전자의 복제에 의해 형성된 여러 유사한 유전자의 집합이며, 일반적으로 유사한 생화학적 기능을 가진다. 이러한 패밀리 중 하나는 인간 헤모글로빈 소단위체를 위한 유전자이다. 10개의 유전자는 α-글로빈 및 β-글로빈 유전자좌라고 불리는 다른 염색체의 두 클러스터에 존재한다. 이 두 유전자 클러스터는 약 5억 년 전 전구 유전자가 복제된 결과로 발생한 것으로 생각된다.[1]

유전자는 공유하는 뉴클레오타이드 또는 단백질 서열을 기반으로 패밀리로 분류된다. 계통 발생적 기술을 보다 엄격한 시험으로 사용할 수 있다. 코딩 서열 내 엑손의 위치는 공통 조상을 추론하는 데 사용될 수 있다. 유전자에 의해 암호화된 단백질의 서열을 알면 연구자들은 DNA 서열 간의 유사성 또는 차이점보다 더 많은 정보를 제공하는 단백질 서열 간의 유사성을 찾는 방법을 적용할 수 있다.
유전자 패밀리의 유전자가 단백질을 암호화하는 경우, 단백질 패밀리라는 용어는 유전자 패밀리와 유사한 방식으로 자주 사용된다.
특정 계통에서 유전자 패밀리의 확장 또는 축소는 우연히 발생할 수도 있고 자연 선택의 결과일 수도 있다.[2] 이 두 가지 경우를 실제로 구별하는 것은 종종 어렵다. 최근 연구는 통계 모델과 알고리즘 기술의 조합을 사용하여 자연 선택의 영향을 받는 유전자 패밀리를 감지한다.[3]
HUGO 유전자 명명 위원회(HGNC)는 유전자 패밀리 구성원(유사성 또는 기능에 따라)에 대한 "줄기"(또는 "뿌리") 기호를 사용하여 명명 체계를 만들고, 개별 구성원을 구별하기 위한 계층적 번호 매기기 시스템을 사용한다.[4][5] 예를 들어, 페록시레독신 패밀리의 경우 PRDX가 루트 기호이며, 패밀리 구성원은 PRDX1, PRDX2, PRDX3, PRDX4, PRDX5 및 PRDX6이다.
Remove ads
기본 구조
요약
관점

게놈 조직의 한 수준은 유전자를 여러 유전자 패밀리로 그룹화하는 것이다.[6][7] 유전자 패밀리는 공통 조상을 공유하는 관련 유전자 그룹이다. 유전자 패밀리의 구성원은 파라로그 또는 오르토로그일 수 있다. 유전자 파라로그는 동일한 종 내에서 유사한 서열을 가진 유전자이며, 유전자 오르토로그는 다른 종에서 유사한 서열을 가진 유전자이다. 유전자 패밀리는 크기, 서열 다양성 및 배열에서 매우 가변적이다. 패밀리 내 유전자의 다양성과 기능에 따라 패밀리는 다유전자 패밀리 또는 슈퍼패밀리로 분류될 수 있다.[6][8]
다유전자 패밀리는 일반적으로 유사한 서열과 기능을 가진 구성원으로 구성되지만, 높은 수준의 발산(서열 및 기능 수준에서)이 유전자를 유전자 패밀리에서 제거하는 결과를 초래하지는 않는다. 패밀리의 개별 유전자는 동일한 염색체에 가까이 배열되어 있거나 다른 염색체의 게놈 전체에 분산되어 있을 수 있다. 서열의 유사성과 중복되는 기능으로 인해 패밀리의 개별 유전자는 종종 조절 제어 요소를 공유한다.[6][8] 일부 경우, 유전자 구성원은 동일하거나 거의 동일한 서열을 가진다. 이러한 패밀리는 필요에 따라 짧은 시간 내에 엄청난 양의 유전자 산물을 발현할 수 있다. 다른 패밀리는 다른 세포 유형에서 또는 유기체 발달의 다른 단계에서 유사하지만 특정한 산물을 발현할 수 있다.[6]
슈퍼패밀리는 단일 다유전자 패밀리보다 훨씬 크다. 슈퍼패밀리에는 여러 다유전자 패밀리와 단일 개별 유전자 구성원을 포함하여 최대 수백 개의 유전자가 포함된다. 많은 수의 구성원은 슈퍼패밀리가 일부 유전자는 군집되어 있고 일부는 멀리 퍼져 있어 널리 분산될 수 있도록 한다. 유전자는 서열과 기능이 다양하여 다양한 수준의 발현과 별도의 조절 제어를 나타낸다.[6][8]
일부 유전자 패밀리에는 확립된 유전자 서열과 밀접하게 유사하지만 비기능적인 DNA 서열인 위유전자도 포함된다.[9] 여러 유형의 위유전자가 존재한다. 비처리 위유전자는 시간이 지남에 따라 돌연변이를 얻어 비기능적이 된 유전자이다. 처리 위유전자는 레트로트랜스포존에 의해 게놈 내에서 이동된 후 기능을 상실한 유전자이다.[8][9] 유래된 유전자 패밀리에서 고립된 위유전자는 고아 유전자라고 불린다.[6]
Remove ads
형성
요약
관점
유전자 패밀리는 조상 유전자의 여러 복제 후 돌연변이와 발산으로 인해 발생했다.[6] 복제는 계통 내에서 발생할 수 있다(예: 인간은 침팬지에서 한 번만 발견되는 유전자의 두 복사본을 가질 수 있음) 또는 종 분화의 결과일 수 있다. 예를 들어, 인간과 침팬지의 조상에 있던 단일 유전자는 이제 두 종 모두에서 발생하며 종 분화를 통해 '복제'된 것으로 생각할 수 있다. 종 분화를 통한 복제의 결과로 유전자 패밀리는 15개의 다른 종 각각에 하나의 복사본이 있는 15개의 유전자를 포함할 수 있다.
중복
유전자 패밀리의 형성에는 네 가지 수준의 중복이 존재한다. 1) 엑손 중복 및 엑손 셔플링, 2) 전체 유전자 중복, 3) 다유전자 패밀리 중복, 4) 전체 게놈 중복. 엑손 중복 및 셔플링은 변이와 새로운 유전자를 발생시킨다. 유전자는 여러 염색체에 걸쳐 슈퍼패밀리를 형성하도록 다유전자 패밀리를 형성하기 위해 중복된다. 전체 게놈 중복은 모든 유전자와 유전자 패밀리의 복사본 수를 두 배로 늘린다.[6] 전체 게놈 중복 또는 배수성은 자가배수성 또는 이배수성일 수 있다. 자가배수성은 동일한 게놈의 중복이며, 이배수성은 두 개의 밀접하게 관련된 게놈 또는 다른 종의 잡종 게놈의 중복이다.[8]
중복은 주로 생식세포의 감수분열에서 불균등 교차 사건을 통해 발생한다. (1,2) 두 염색체가 잘못 정렬될 때, 유전자 대립형질의 교환인 교차는 한 염색체는 유전자 수가 확장되거나 증가하고 다른 염색체는 유전자 수가 수축되거나 감소하는 결과를 낳는다. 유전자 클러스터의 확장은 더 큰 유전자 패밀리로 이어지는 유전자 중복이다.[6][8]
재배치
다유전자 패밀리의 유전자 구성원 또는 슈퍼패밀리 내의 다유전자 패밀리는 조상 유전자의 복제 후 해당 유전자의 재배치로 인해 다른 염색체에 존재한다. 트랜스포존은 유전자 이동에 중요한 역할을 한다. 트랜스포존은 5' 및 3' 말단의 역반복 서열에 의해 인식된다. 두 트랜스포존이 염색체의 동일한 영역에 충분히 가까이 있을 때, 복합 트랜스포존을 형성할 수 있다. 트랜스포사제 단백질은 가장 바깥쪽 역반복 서열을 인식하여 DNA 부분을 절단한다. 두 트랜스포존 사이의 유전자는 복합 트랜스포존이 게놈의 새로운 영역으로 이동함에 따라 재배치된다.[6]
역전사는 유전자 이동의 또 다른 방법이다. 유전자의 mRNA 전사체는 역전사되거나 DNA로 다시 복사된다. mRNA의 이 새로운 DNA 복사본은 게놈의 다른 부분에 통합되어 유전자 패밀리 구성원이 분산된다.[8]
특정 유형의 다유전자 패밀리는 유전자 패밀리 및 유전자 패밀리 구성원의 이동과 관련이 있다. LINE(Long INterspersed Elements) 및 SINE(Short INterspersed Elements) 패밀리는 게놈 전체에 퍼져 있는 고도로 반복적인 DNA 서열이다. LINE은 역전사효소 단백질을 암호화하는 서열을 포함한다. 이 단백질은 LINE 및 SINE의 RNA 전사체를 DNA로 다시 복사하는 것을 돕고, 게놈의 다른 영역에 통합한다. 이는 LINE 및 SINE 패밀리의 성장을 자체적으로 영구화한다. 이러한 요소의 고도로 반복적인 특성 때문에 LINE 및 SINE은 가까이 있을 때 불균등 교차 사건을 유발하여 단일 유전자 중복 및 유전자 패밀리 형성을 초래한다.[6][8]
발산
아미노산의 치환을 초래하는 비동의 돌연변이는 중복 유전자 복사본에서 증가한다. 중복은 동일한 유전자의 여러 복사본을 생성하여 돌연변이가 용인되는 수준의 중복성을 제공한다. 하나의 기능하는 유전자 복사본이 있으면 다른 복사본은 유기체에 극도로 해롭지 않고 돌연변이를 획득할 수 있다. 돌연변이는 중복 유전자가 새롭거나 다른 기능을 획득하도록 한다.[8]
협력 진화
일부 다유전자 패밀리는 매우 균질하며, 개별 유전자 구성원이 동일하거나 거의 동일한 서열을 공유한다. 유전자 패밀리가 높은 균질성을 유지하는 과정은 협력 진화이다. 협력 진화는 불균등 교차 사건의 반복적인 주기와 유전자 전이 및 전환의 반복적인 주기를 통해 발생한다. 불균등 교차는 유전자 패밀리의 확장 및 수축으로 이어진다. 유전자 패밀리는 자연 선택이 작용하는 최적의 크기 범위를 가진다. 수축은 발산하는 유전자 복사본을 삭제하고 유전자 패밀리가 너무 커지는 것을 방지한다. 확장은 손실된 유전자 복사본을 대체하고 유전자 패밀리가 너무 작아지는 것을 방지한다. 유전자 전이 및 전환의 반복적인 주기는 유전자 패밀리 구성원을 점점 더 유사하게 만든다.[6]
유전자 전이 과정에서 대립 유전자 전환은 편향적이다. 돌연변이 대립 유전자가 균질성으로 유전자 패밀리 내에 퍼지는 과정은 유리한 대립 유전자가 집단 내에서 고정으로 퍼지는 과정과 동일하다. 유전자 전환은 일부 경우 유전적 변이를 생성하는 데도 도움이 된다.[10]
Remove ads
진화
게놈의 정보 저장 계층 구조의 일부인 유전자 패밀리는 다세포 유기체의 진화와 다양성에 큰 역할을 한다. 유전자 패밀리는 큰 정보 단위이자 유전적 가변성이다.[6] 진화적 시간 동안 유전자 패밀리는 복제되고 새로운 유전자로 다양화되는 유전자를 가지면서 확장 및 수축했으며, 유전자가 손실되기도 했다. 전체 유전자 패밀리는 또한 신생 유전자 탄생을 통해 손실되거나 획득될 수 있는데, 이는 유전자가 새로운 패밀리의 일부로 간주될 정도로 광범위한 발산에 의해 또는 수평적 유전자 이동에 의해 발생한다. 게놈당 유전자 수가 상대적으로 일정하게 유지될 때, 이는 유전자가 거의 동일한 속도로 얻어지고 손실됨을 의미한다. 유전자가 손실될 가능성이 더 높은 패턴과 여러 복사본으로 복제되고 다양화될 가능성이 더 높은 패턴이 있다.[11]
단일 유전자가 처음에 동일한 여러 복사본으로 적응적으로 확장되는 것은 자연 선택이 추가 유전자 복사본을 선호할 때 발생한다. 이는 환경 스트레스 요인이 종에 작용할 때 해당된다. 유전자 증폭은 박테리아에서 더 흔하며 가역적인 과정이다. 유전자 패밀리의 수축은 일반적으로 기능 상실 돌연변이의 축적에서 비롯된다. 유전자 전사를 조기에 중단시키는 무의미 돌연변이가 집단에 고정되어 유전자 손실로 이어진다. 이 과정은 환경 변화로 인해 유전자가 불필요해질 때 발생한다.[7]
기능적 패밀리
진화(구조적 유전자 패밀리)에 의한 분류 외에도 HGNC는 줄기 명명법에서 기능에 의한 "유전자 패밀리"도 만든다.[12] 결과적으로 줄기는 동일한 기능을 가지며 종종 동일한 단백질 복합체의 일부인 유전자를 지칭할 수도 있다. 예를 들어, BRCA1 및 BRCA2는 유방암에서의 역할 때문에 이름이 붙여진 관련 없는 유전자이며, RPS2 및 RPS3는 동일한 작은 소단위체에서 발견되는 관련 없는 리보솜 단백질이다.
HGNC는 또한 "유전자 그룹"(이전에는 "유전자 패밀리") 분류를 유지한다. 유전자는 여러 그룹의 구성원이 될 수 있으며, 모든 그룹은 계층 구조를 형성한다. 줄기 분류와 마찬가지로 구조적 및 기능적 그룹이 모두 존재한다.[4][5]
같이 보기
- 유전자 패밀리 목록
- 단백질 패밀리
각주
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
