RNA 이어맞추기

 

1. 개요
2. 발견
3. 메커니즘
3.1. 인트론 - 엑손 경계
3.2. 이어맞추기 반응
4. 이어맞추기 복합체(Spliceosome)
4.1. 자가 스플라이싱
4.2. 선택적 스플라이싱


1. 개요


[image]
전사 과정에서 나온 pre-mRNA를 성숙한 mRNA로 만드는 과정 중 하나. 이 과정을 통해 인트론이 제거되고 엑손끼리만 결합하게 된다. 원핵생물에서는 거의 일어나지 않고 진핵생물에서 주로 일어난다. RNA editing과는 다르다.
DNA에는 인트론(intron)과 엑손(Exon)이 있다. 인트론은 단백질에 대한 정보가 없는 non-coding 서열이고, 엑손은 대부분이 coding 서열이다. 원핵생물은 인트론이 거의 없지만[1], 진핵생물은 엑손 사이에 수많은 인트론들이 끼어들어가 있다. 하지만 RNA 중합효소는 엑손과 인트론을 구분하지 않고 모조리 RNA로 전사하는데, 그렇기에 원하는 단백질을 만들기 위해서는 반드시 인트론을 제거하고 엑손만을 남겨야 한다. 이때 쓰이는 가공 작업이 바로 RNA splicing이다.
고등생물로 가면 갈 수록 인트론의 수가 점점 늘어나기 때문에, 인트론과 엑손을 정확히 구분하는 것이 매우 중요해진다. 특히 사람의 경우는 전체 유전자 중 10% 내외만 엑손인 것으로 알려져있다.[2] 진핵생물은 이어맞추기 복합체(spliceosome)이라는 특수한 단백질이 전문적으로 이어맞추기를 한다.

2. 발견


20세기 중후반, 핵에 존재하는 mRNA가 세포질에 있는 mRNA보다 훨씬 길다는 사실은 유전학의 수수께끼 중 하나였다. 그러던 중 1977년 Richard J. Roberts와 Phillip A. Sharp는 각각 아데노바이러스(adenovirus) 연구를 통해 인트론[3][4]의 존재와 RNA splicing을 밝혀냈고, 당시 전사에 대해 갓 이해하고 있던 생명과학자들에게 큰 충격을 가져다주었다. 결국 두 과학자는 1993년 노벨생리학상을 받게된다.[5]
아데노바이러스는 대표적인 감기 바이러스로, 당시 진핵생물의 유전적 이해를 위해 실험에 사용되고 있었다. 아데노바이러스 안에는 하나의 DNA가 있고, 이 DNA 상에 아데노바이러스를 구성하는 단백질들이 코딩되어 있다. 처음에는 아데노바이러스 각 단백질들의 mRNA 5 말단을 조사해서 전사 개시 서열을 추측해 게놈 지도를 만드려는 실험이었다. mRNA에 DNA를 혼성결합(hybridizaiton) 시켜서 DNA의 어느 지점이 결합되는지를 확인하는 것이 실험 과정이었다. 그런데 이상한 일이 일어났다. mRNA에서는 서로 연속적이던 5 말단 서열이, DNA상으로는 따로 떨어져있었던 것이다. Roberts는 서로 분리(split)되어 있는 개시서열을 3군데 찾아냈고, 이를 tripartite leader라고 이름을 붙였다. 즉 DNA 상에 흩어져있는 3개의 leader들이 mRNA에서는 알 수없는 방식으로 합쳐져있다는 것이 밝혀진 것이다. 실험을 더 진행시켜보니, 똑같은 tripartite leader를 가졌는데 뒤에 오는 단백질 서열만 다른 mRNA들이 발견되었고, 이는 결국 인트론과 RNA 이어맞추기의 발견으로 이어지게 되었다.
직접 설명하는 영상을 보도록 하자. 영어 주의

3. 메커니즘



3.1. 인트론 - 엑손 경계


[image]
인트론과 엑손은 그 경계에 특정 서열을 가지고 있다.[6][7] 이 서열들은 대부분의 인트론, 엑손에서 공통되는 서열들로, 5' splice site(혹은 donor site), branch site, 3' splice site(혹은 acceptor site) 총 세 부분으로 나뉜다. 5' splice site는 인트론의 5' 말단을 의미하고, 3' splice site는 인트론의 3' 말단을 의미한다. branch site는 인트론의 중간에 위치하는데, 엄밀히 따지면 3' 말단에 더 가까이 있고 뒤로 폴리피리미딘 서열이 뒤따른다. 5' splice site의 GU 서열, 3' splice site의 AG 서열, branch site의 A 서열은 모든 진핵생물에서 가장 잘 보존된 서열이며 인트론에 반드시 포함되어있다. 이와 반대로 엑손은 단백질 정보를 담아야하기 때문에 덜 보존되어있다.
참고로 그림자료에서 R은 퓨린(A,G) 중 하나, Y는 피리미딘(C,U) 중 하나, N은 아무 염기 중 하나를 의미한다.

3.2. 이어맞추기 반응


[image]
인트론은 두번의 transesterification(에스테르 전이반응)에 의해 제거된다. branch site 아데노신(A)의 3'-OH(nucleophile)가 spliceosome(후술)의 도움을 받아 5' splice site 구아닌(G)의 인산기를 공격한다. 이렇게 G와 A가 인산디에스테르 결합으로 연결되어, 밧줄 매듭 모양의 루프를 만들게 된다. 이것을 '올가미(Lariat) 구조'라고 하고, A를 중심으로 세갈래길(3 way junction)이 만들어진다[8]. 그리고 G-A 연결에 의해 인트론 5'말단 쪽에 있던 exon이 절단된다.
절단된 5' 엑손의 3'-OH기는 인트론의 비스한 방식으로 3' splice site를 절단하고 결합한다. 이렇게 인트론 루프와 조합된 엑손이 생기고, 이어맞추기는 끝나게 된다.
RNA 사이에서도 이어맞추기가 일어나는 트랜스 스플라이싱도 있다. 그 매커니즘은 위와 같지만, 서로 분리되어 있던 RNA이기 때문에 올가미 모양(ρ[9]) 대신 Y자 모양의 인트론이 형성된다.

4. 이어맞추기 복합체(Spliceosome)


이어맞추기의 기본적인 반응은 위와 같지만, 실은 전사와 마찬가지로 여러 단백질들이 반응을 도와야 한다. 그 단백질들이 이루는 복합체를 ‘이어맞추기 복합체(Spliceosome)’라고 한다. 이어맞추기 복합체는 5여개의 RNA와 150여개의 단백질로 구성된 리보자임이고, 이 중에서도 RNA가 대부분의 역할을 수행한다. U1, U2, U4, U5, U6, 총 5개의 snRNA[10]가 있고, 이 들이 150여개의 단백질과 복합체를 이루면서 snRNP[11]가 된다. [12]
물론 이것은 주(major) 이어맞추기 복합체의 구성이며, U11, U12 등을 이용하는 부(minor) 이어맞추기 복합체도 존재한다. 그러나 연관된 단백질들만 다르고 매커니즘 자체는 동일하기 때문에, 이 문서는 주 이어맞추기 복합체만 설명한다.
[image]
이어맞추기 복합체는 1. 5’ splice site와 branch site를 인식하고, 2. 둘을 가까이 위치하도록 해서, 3. RNA의 절단 및 결합을 촉매하게 된다. 위 그림자료는 snRNA들이 mRNA와 상호작용하는 예시들이다. 이런 RNA 사이의 결합들과, 다른 단백질들의 결합으로 구조적인 재배열이 일어나게 된다. 특히 U2와 U6은 각각 다른 mRNA 자리를 인식하면서도 서로 상호작용함을 볼 수 있다. 이로인해 5’ splice site와 branch site가 가까이 위치할 수 있게 된다. 비유를 하자면, 서로 다른 장소에 있던 원수지간을 외나무다리에서 만나게 해, 싸움을 유도하는 셈이다.
이어맞추기 복합체는 어떤 식으로 이어맞추기 반응을 보조하는가? 위의 RNA-RNA 상호작용이 관여하므로, 위 그림자료를 참고하면서 보면 좋다.
[image]
우선 5’ splice site에 U1이 결합하고, branch site 근처의 피리미딘(Y) 연속서열과 3’ splice site를 U2AF[13]가 인식해서 결합한다. U2AF는 두 개의 서브유닛이 있는데, 65kDa 짜리는 피리미딘 연속서열을, 35kDa 짜리는 3’ splice site를 인식한다. U2AF는 BBP[14]를 데려와 branch site에 결합시킨다. 참고로 BBP가 인식하는 branch site 서열은 U2와 같다. 여기까지를 ‘E[15] 복합체’라고 부른다. BBP의 역할은 제대로 밝혀지지 않았다.
[image]
U2는 U2AF를 인식해서 BBP의 자리에 대신 결합한다. 이 때 ATP가 소모되며, branch site 아데노신(A)이 bulge[16]를 형성하게 된다. 어째서 bulge가 되는지는 위의 RNA-RNA 상호작용 그림자료를 참고하면된다. 여기까지는 ‘A 복합체’라고 한다.
[image]
U2AF는 떨어져나가고 U4, U5, U6으로 이루어진 tri-snRNP 입자가 U1과 U2 사이에 결합한다. 이 결합에 의해 인트론이 휘어지게 된다. U4와 U6은 RNA 서열이 서로 상보적으로 결합한 상태이기 때문에, U6과 U2 사이의 상호작용은 일어나지 않는다. U5는 RNA가 아닌 단백질간의 상호작용으로 약하게 결합한 상태이다. 여기까지를 ‘B 복합체’라고 부른다.
[image]
U6은 ATP를 소모하여 U1의 자리를 대체하게 된다. 그리고 U2와 U6 둘 사이를 가로막고 있던 U4가 빠져나가게 되면서, U2와 U6의 상호작용이 발생한다. 이 상호작용에 의해 다시 인트론 구조의 재배열이 생겨서 5’ splicte site와 branch site가 가까워진다. 그리고 이 상태를 ‘C 복합체’ 라고 부르는데, 이 때 에스테르 전이반응을 위한 활성 부위가 만들어진다[17]. 이전의 단계를 거쳐야만 RNA(U2, U6)에 의해 활성부위가 형성되기 때문에, 원치 않은 이어맞추기 반응을 방지할 수 있다.
[image]
이후 첫 번째 에스테르 전이반응이 발생하고, U5의 도움을 받아 두 번째 전이반응이 일어나서 이어맞추기가 끝나게 된다. C 복합체의 snRNP들은 제거된 인트론에 결합해있다가, 인트론이 빠르게 분해되면서 떨어져 나가 다른 이어맞추기 반응에 참여한다.
여기까지가 이어맞추기 복합체에 의한 이어맞추기 과정이다. 전체적인 반응은 이 문서를 참고하자. 물론 실제로는 저 경로를 일일이 차곡차곡 따르진 않는 게 함정. 당연하게도 생명체 내의 활동들은 물리나 화학처럼 엄격한 법칙에 의해 지배되는 것이 아니므로 각종 변종 반응들이 항상 도사리고 있다. 그래서 세포는 또 다른 기전들을 준비해놓았다.

4.1. 자가 스플라이싱


아 근데 왜 올가미 구조 만들어? 라 묻는다면 자가 스플라이싱 Rna 에서 기원했기 때문이다. tRNA 가공 과정에서는 그런거 없고 바로 이어주기가 가능하다. 근데 것도 그룹 별로 세부 과정이 약간달라서 찌꺼기가 올가미가 아닐 수 있다.

4.2. 선택적 스플라이싱


위와 같이 특정 유전자가 항상 Spliceosome으로 적절하게 인식돼서 똑같이 처리되는 것을 Constitutive splicing event 이라고 한다.
Alternative splicing은 말 그대로 전자와는 다르게 선택적으로 엑손을 인트론 취급한다든지 해서 여러 다른 mRNA 가 튀어나오는 스플라이싱을 칭한다. 그 결과, 하나의 유전자에서 여러가지 단백질이 탄생하게 된다.
이러한 Alternative splicing은 pre-mRNA 의 cis-acting RNA element에 의해 일어나게 되고, DNA 전사 조절에서의 조절요소 와 거의 똑같은 역할을 한다. 이는 spliceosome에 의해 인식되는 Splicing signal과 SREs로 구분된다.
SREs는 rna위의 위치에 따라서(엑손 위에있는지 인크론 위에 있는지), 그리고 그 기능에 따라서(엑손을 잘라내게끔 하는 silencer 와 그 반대인enhancer)에 따라 ESEs, ESSs, ISEs, ISSs 로 나뉜다. 또한 이러한 SREs 에 결합 조절하는 애들은 rna가 아니라 단백질만 확인되었다.

[1] 아예 없진 않다, 하지만 비율이 엄청 희박하다.[2] 즉 DNA 중에 5%만 유전자인데, 그것의 10% 내외만 엑손인 것이다. 즉, 전체 20억 염기 중, 엑손은 겨우 1000만개[3] 이 이름은 나중에 Walter Gilbert에 의해 붙여진 것으로, 처음에는 split gene이라고 불렸다.[4] Gilbert, Walter (1978). "Why genes in pieces". Nature 271 (5645): 501–501.[5] "Physiology or Medicine 1993 - Press Release". Nobelprize.org. Nobel Media AB 2014. Web. 27 Nov 2015. http://www.nobelprize.org/nobel_prizes/medicine/laureates/1993/press.html[6] Padgett RA, Grabowski PJ, Konarska MM, Seiler S, Sharp PA (1986). "Splicing of messenger RNA precursors". Annu. Rev. Biochem. 55: 1119–50.[7] Breathnach, R. and Chambon, P. (1981) Organization and expression of eucaryotic split genes coding for proteins. Annu. Rev. Biochem. 50, 349–383[8] A는 이미 branch site에서 두개의 염기와 결합한 상태라는 것을 상기해보자.[9] 단순히 모양을 표현한 것일 뿐, 실제 저 기호의 의미와는 관련 없음[10] small nuclear RNA로, 약 100~300bp의 길이다.[11] small nuclear ribonucleoprotein complex[12] 엄연히 말하자면, 이들이 결합한 중합체가 snRNP라 정의되는 것이 아니라, snRNP와 타 여러 단백질들이 결합하여 복합체를 이루고, 이것이 Spliceosome으로서 작용한다.[13] U2 auxiliary factor[14] branch-point binding protein[15] early[16] 그림처럼 볼록 튀어나온 형태[17] U2와 U6 둘이서 만드는 것으로 보인다.