단백질

 



蛋白質 / Protein
1. 개요
2. 어원
3. 특징
4. 구조
4.1. 단백질 구조의 차수
4.2. 구조 예측
5. 조성에 따른 분류
6. 번역 후 변형
7. 식품
7.1. 소화와 흡수, 아미노산 대사
8. 서브유닛
9. 기타
10. 관련 문서


1. 개요


아미노산(amino acid)들이 펩타이드(펩티드, peptide) 결합으로 연결된 분자. 자연에 존재하는 단백질은 대략 20가지의 아미노산으로 구성된다.
인간인체를 비롯하여 지구 상의 모든 생물체를 구성하는 구성물질 중 하나이다.

2. 어원


영어 'protein'은 그리스어로 '가장 먼저 중요한 것'을 뜻하는 'πρώτειος'(프로테이오스)에서 유래했다.
동아시아권에서 쓰는 한자어 '단백질'이나 '흰자질' 등은 독일어 'Eiweißstoff'(아이바이슈토프, 직역하면 흰자의 성분)를 번역한 것으로 달걀 흰자의 주성분이 단백질인 것에서 유래했다. 한자어 표현에 쓰인 '단'은 새알 단(蛋)자이다. 중국에서는 흔히 쓰이지만[1], 한국이나 일본 등 여타 한자문화권 국가에서는 잘 사용되지 않는 글자다. '단백질'이란 용어를 처음 번역해낸 일본에서도 영양학자 카와시마 시로가 '난백질'(卵白質)이라는 용어를 제안하기도 했지만 발음이 다르다보니 별로 안 쓰이고, 대신 '단백질'의 '단백'을 한자가 아닌 가나로 タンパク質 이라고 쓴다.

3. 특징


생물체 내에서 단백질은 만능이라 해도 좋을 정도로 다양하게 쓰인다. 생물체 내에서 일어나는 복잡한 화학반응을 일으키는 효소들은 대부분 단백질이다.[2] 근육과 같이 몸을 구성하는 역할도 한다. 뿐만 아니라 면역에 중요한 항체도 단백질로 이루어졌으며, DNA 사슬을 감아 뭉치고 2차적 유전정보를 저장하는 히스톤도 단백질이고, 연골, 피부, 가죽, 털, 비늘 등을 이루는 주성분 콜라겐과 케라틴도 단백질이다. 거기다 몇몇 호르몬까지도 단백질이다. 즉, 생물의 기본적인 DNA 복제서부터 생물의 외형 형성에 이르기까지 생명의 정수이자 필수 요소, 생명체의 거의 모든 것으로 작용하는 물질. '''생명 현상의 정수'''라고까지 일컬어지는 센트럴 도그마가 '''단백질의 합성 과정'''이라는 부분에서부터 얼마나 중요한지 알 수 있는 물질.
이런 다양한 기능을 발휘할 수 있는 이유는 20여종의 다양한 아미노산들이 역시 다양한 모양으로 엄청난 숫자가 모여서 무궁무진한 경우의 수로 기상천외한 결합을 하며 별의별 구조를 다 만들어낼 수 있기 때문이다.[3] 이렇게 만들어진 특수한 구조들은 일종의 나노머신과 같이 단백질의 특별한 기능을 수행하며[4], 이런 일을 가능하게 하는 힘은 대부분 전자기력이다. 리보스위치처럼 핵산과 같은 다른 물질이 특수한 기능을 하는 경우도 있지만 상대적으로 극소수이다.

4. 구조


[image]
'''헤모글로빈'''
분자량부터가 엄청난 데다가[5] 엄청나게 얽히고 꼬인 구조. 문제는 이게 하나라도 달라지면 단백질 자체의 성질도 바뀔 수 있는 입체구조의 거대분자이기 때문에 다른 물질처럼 원소기호와 선만으로 표현하는 것이 불가능하며, 위 그림처럼 '''단백질 전용의 분자구조 표현 방식'''을 쓴다.
인간 게놈 프로젝트가 완료되었음에도 기대 만큼의 성과가 나오지 않고 있는 것은 선택적 이어맞추기(alternative splicing)에 의해 유전체(genome)의 정보[6]에 비해 만들 수 있는 단백질의 종류가 정비례하지 않기 때문이다. 또한 단백질 거대분자의 복잡한 구조(꼬임) 때문에 유전정보만 가지고 단백질의 기능을 유추하는 것이 거의 불가능하다. 단지 아미노산의 배열순서만 알아서는 실제 결과물인 단백질 분자가 어떤 3차원적 형태를 갖는지 알 수 없는데,[7] 이 형태야말로 단백질 분자(효소)의 기능을 좌우하는 중요 요소이기 때문이다.[8] 때문에 관련 학문이 갖는 비중이 유전자 서열만 붙들고 파던 유전체학(genomics)에서 단백질 분자의 형태를 연구하는 단백질체학(proteomics)으로 옮겨가고 있다.
기본적으로 이황화 결합(-S=S-; Disulfide Bond)이 많을수록, 그로 순환(Cyclic)할수록 체내에서 안정한 것으로 알려져 있다.[9]

4.1. 단백질 구조의 차수


단백질의 구조는 펩타이드 결합된 아미노산들이 어떤 순서로 배열되어 있는지를 말한다. 일차구조(primary structure)는 단순히 아미노산의 서열을 늘어놓은 것이므로 '''폴리펩타이드'''라고 한다. DNA 같은 것과 달리 단백질은 서열 이외에도 다른 고유 구조를 가진다.
이차구조(secondary structure)는 국소적으로 아미노산들이 어떤 구조를 형성하는지 지칭한다. 알파나선베타병풍이 대표적. 단백질 전체가 아니라 아미노산들 사이의 아민기와 카르복실기[10] 사이의 국소적인 수소결합으로 인해 형성된 모습을 말하는 것이기 때문에 한 단백질 내에서도 여러 종류, 여러 개의 이차구조가 나타날 수 있다.
삼차구조(tertiary structure)는 이차구조처럼 부분적인 것이 아닌, 서열 전체의 3차원 구조를 말한다. 주로 서로 다른 아미노산의 R기 사이의 수소결합, 메탄기 사이의 상호작용, 반 데르 발스 힘, 이황화결합[11], 이온결합 등으로 형성된다. 여기서부터 단순한 아미노산이나 폴리펩티드의 '단위'가 아니라 한 개의 오롯한 단백질이라고 부를 수 있게 되며 그 단백질의 고유한 기능을 나타낸다.
사차구조(quaternary structure)도 있다. 이것은 여러 개의 단백질이 모여서 어떻게 복합체를 이루는지를 말한다. 예로는 DNA에서 RNA전사할 때 사용되는 RNA 중합효소 등이 있다. 엄청나게 많은 단백질들이 뭉친 복합체이다.[12]

4.2. 구조 예측


아미노산을 단량체로 하는 '''고분자''' 유기물이며, 아미노산의 중합으로 형성된 펩타이드가 단일 혹은 복수가 결합하여 형성된다. 생물체에서 단백질을 구성하는 아미노산의 종류는 총 20가지이다. 단백질의 특징 중 하나는 이런 구성된 아미노산의 종류와 순서에 따라, 예측하기도 어려운 다양한 구조를 갖는다는 것이다. 자세한 내용은 단백질 접힘 문서로.
보통 펩타이드 단위 하나당 수백에서 수천 개까지의 아미노산이 포함된다. 많은 아미노산으로 구성된 단백질은 인간으로는 상상하기도 어려운 구조를 가질 수 있다.[13] 수많은 과학자들이 유용한 단백질을 찾기 위해 고심하나 수가 워낙 많아 계속하여 찾을 것이다.
2020년 4월 기준으로 '''162,816 종류'''의 단백질의 구조가 밝혀졌다. # 물론, 이게 전부가 아니다. [14]
혹시 이 글을 읽는 위키러 중에 단백질 구조를 더 밝혀내고 싶은 위키러는 Fold It 항목으로.

5. 조성에 따른 분류


단백질은 아미노산이 줄줄이 이어진 사슬이 꼬이고 접히고 한 것만 있는 것이 아니다. 단백질에 다른 분자들[15]이 달라붙은 '''복합단백질'''도 있으며, 바로 위의 헤모글로빈도 복합단백질의 일종인 금속단백질이다. 헴 그룹에 있는 철이 금속이므로 금속단백질. 마찬가지로 산화철 때문에 붉은 헴 그룹 때문에 색소단백질에도 속한다. 복합단백질의 종류에는 약 7가지가 있다.
  • 핵단백질 : 핵산과 결합된 단백질. 대표적으로 히스톤 단백질이 있다.
  • 당단백질 : 당류가 달린 단백질. 당류 함량이 4% 이하이다.
  • 점성단백질 : 당단백질과 마찬가지로 당류가 달렸지만 함량이 4% 이상일 때 점성단백질이라고 한다. 그 유명한 글루코사민이 여기에 속한다.
  • 지질단백질 : 지질과 결합된 단백질. 대표적으로 동물세포의 인지질 이중층을 이루는 단백질과 뉴런의 수초(髓鞘; myelin sheath)가 있다.
  • 인단백질 : 인산이나 인지질 이외에 1% 전후의 핵산을 가지는 단백질.
  • 금속단백질 : 이쯤 되면 뻔하지만 금속이 달린 단백질. 아밀레이스헤모글로빈이 대표적이다.
  • 색소단백질 : 색소가 달린 단백질. 마찬가지로 헴그룹은 철 때문에 붉은 색을 띠므로 헤모글로빈은 여기에도 속한다.
위의 수십만 가지의 단백질 종류에 각각 다른 보결족들이 달릴 수 있다는 것을 생각해 보면 단백질의 종류는 사실상 '''무한하다'''고 보면 된다.

6. 번역 후 변형


소위 PTM(Posttranslational Modification)이라는 현상으로 인해 아미노산 서열이 같을지라도 구조와 기능이 달라질 수 있다.
단백질을 이루는 아미노산의 정보는 유전자에 저장되어 있으나, 단백질을 번역(Translation)한 뒤에 단백질에 인산이 붙거나, 당사슬이 붙거나, 지질이 붙는 등의 다양한 변화가 일어날 수 있으며 이는 입체적인 변화(Conformational Change)를 동반할 수 있기 때문에 생명현상의 여러가지 매커니즘에 주요한 역할을 차지하고 있다.
또한 자연에서 흔하게 존재하지 않는 아미노산(Unnatural Amino Acid)이 들어간 단백질을 만들 때 PTM이 일어나기도 한다.

7. 식품


단백질이 든 식재료라고 하여도 모두 똑같은 것은 아니다. [16] 주로 문제되는 것은, 단백질 자체의 경우 필수 아미노산의 비율이며 전체 단백질에서 필수아미노산 함량이 얼마나 높냐가 단백질의 질을 좌우하게 된다. 인간포유류이므로 포유류에 가까운 생물일수록 인간이 몸에서 만들어야 하는 단백질의 아미노산 비율과 흡사한 아미노산 비율을 가진 고기를 만든다. 동물성 단백질이 아무래도 대두를 제외한 콩류의 식물성 단백질(두부,간장 등)보다는 필수아미노산 비율이 높다.
이처럼 식물성 단백질은 동물성 단백질에 비해 필수 아미노산을 몇 종류 덜 지닌 경우가 많기 때문에 동물성 단백질을 완전 단백질, 식물성 단백질을 불완전 단백질이라고 부른다. 이 때문에 유튜브나 블로그 등지의 몇몇 영양사나 피트니스 트레이너 등이 식물성 단백질을 먹을 필요 없는 것 취급하기도 하는데, 상당히 편협한 관점이다. 이런 용어적 구분이 동물성 단백질이 식물성 단백질보다 더 상위의 단백질이라는 것을 의미하는 것은 아니며, 단백질 음식은 인체에 들어오면 소화되면서 아미노산 분자 형태로 잘게 쪼개지기 때문에 같은 양의 같은 아미노산이라면 인체 활용도는 동일하다. 따라서 '완전', '불완전'이라는 용어에 현혹되어 단백질의 서열을 매길 이유는 없으며, 동물성 단백질만 먹거나 식물성 단백질만 먹는 것 보다는 골고루 먹어주는 것이 몸에 훨씬 좋은 것은 당연지사.
단백질의 질을 평가하는 과학적인 방법의 가장 기본인 PDCAA(Protein Digestibility-Crrected Amino Acid Score)의 경우 필수 아미노산이 얼마나 골고루 잘 들어있냐를 평가하는 것인데, 1.0 만점을 받은 것들은 우유 단백질의 양대성분인 카제인유장(유청단백), 계란 흰자, 번데기(...), 대두 단백질이며, 대두 자체도 0.91로 상당히 높은 점수를 받고 있다.[17]
우리가 젤리를 만들 때 쓰는 젤라틴이나 피부 아래와 연골에 풍부한 콜라겐은 필수아미노산 함량이 낮은 편이다.
거기에 식품 전체를 볼 땐 포화지방이나 첨가물 등의 혼합 여부도 중요하다. 햄, 소시지 같은 가공육들은 하급한 단백질이라 나쁜 것이 아니라 단가를 싸게 하기 위해 포화지방, 밀가루 등을 섞고, 유해한 첨가제 등도 엄청 들어가기 때문에 나쁜 것. 이와 같은 식재료의 섭취를 금하거나 줄일 것을 권고하고 있다.

7.1. 소화와 흡수, 아미노산 대사


개요에도 설명이 되어 있지만, 단백질은 인체를 연구하는 데에 있어서 압도적인 중요성을 가진다. 물을 제외한 고형분 중 단백질의 함량이 가장 높고, 지방세포 등을 제외하면 나머지 성분도 복합단백질의 일종으로 보결족으로 달려있을 뿐이다. 말 그대로 몸의 대부분.
우리 몸은 끊임없이 노후 조직을 교체하고, 상처를 치료하고, 새 조직을 만들고 하느라고 단백질을 소모하고 있다. 그 말은 단백질의 지속적인 공급이 필요하다는 말이다. 재활용이 가능하지만 어느 정도 한계가 있다. 그래서 대부분을 음식으로부터 얻게 된다. 인간의 경우에는 대략 50%정도를 음식에게서 얻고, 나머지 절반은 25%씩 소화액으로부터의 흡수와 탈락한 상피조직을 소화하는 데서 온다.
'''맛있는 고기를 먹어서''' 몸에 필수적인 단백질을 공급하려 한다면 먼저 입에서 씹는 것에서부터 소화가 시작된다. 먼저 물리적으로 잘게 쪼개 표면적을 넓히고 화학적 소화가 쉬워지게 한다. 그리고 식도를 통해 내려가 위에서 펩신, 소장에서 트립신, 키모트립신 같은 단백질 소화 효소를 마주치면서 펩타이드 사슬이 끊어져 최종적으로는 폴리펩티드, 디펩티드들이 떠다니게 된다.[18]
이후 아미노산은 소장의 융털에서 흡수된다. Dipeptide, tripeptide는 H+와 아미노산은 Na+과 함께 능동수송된다. 이때 Dipeptide는 상피세포 내에서 peptidase에 의해 아미노산으로 바뀔수도 있다. 좀 더 큰 peptide는 transcytosis로 수송되기도 한다. 이렇게 흡수된 아미노산은 간문맥을 통해 간으로 이동하게 된다.
이렇게 흡수한 아미노산을 이용해 필요한 단백질을 만드는 과정을 아미노산 대사라고 한다. 조직단백질일 수도 있고, 효소나 호르몬, 항체 등의 다른 대사물일 수도 있다. 또는 에너지원으로 쓰기 위해서 부적절한 아미노기(-NH3)를 떼어 내는 탈아미노화 반응을 하기도 한다.
필요한 단백질을 만들기 위해서는 당연히 아미노산이 필요하지만, 항상 아미노산 밸런스가 완벽할 수는 없기에 어떤 아미노산은 많고 다른 아미노산은 적을 수가 있다. 이런 상황을 탈피하기 위해 우리 몸은 아미노기 전이 반응이란 것을 통해 남아도는 아미노산에서부터 새로운 필요한 아미노산을 만들어 낸다. 이렇게 만들어진 아미노산은 익숙한 전사와 번역 과정을 거쳐 단백질로 탈바꿈하게 된다.
탈아미노화 반응은 아미노산에 달려 있는 질소 부분을 떼어내는 반응인데, 이 과정에서 우리 몸에 매우 해로운 암모니아가 발생하게 된다. 암모니아는 우리가 익히 아는 오줌 속의 그것으로, 익숙하기에 그렇게 해롭지 않다고 생각할 수 있지만 과량 노출되면 사람을 죽일 수도 있는 위험한 물질이다. 이것을 어떻게 해서 독성을 없애고[19] 신장까지 데려간 후 오르니틴 회로를 통해 요소로 바꿔 밖으로 배설하게 된다.
이 과정에서 페닐알라닌을 타이로신으로 변환하는 데 문제가 생긴 PKU 환자들은 단백질 섭취가 극히 제한된다.

8. 서브유닛


'''Subunit''' / 소단위체(小單位體)
[image]
지금 나오는 이미지는 알파서브유닛 2개와 베타서브유닛 2개가 결합하여 사중체를 형성한 경우이다. 4차 구조 또한 3차 구조와 같은 종류의 힘에 의해서 유지된다.
서브유닛이란 단백질에 적용되는 개념이다. 한국어로 소단위, 소단위체라고 번역되나, 고등학교 수준이 아니고서야 잘 쓰이진 않는다. 단백질은 그 자체로 하나의 분자일 수도 있지만 여러 단백질이 모여 하나의 단백질 ‘복합체(complex)’를 이루어 기능의 다양성을 꾀하기도 한다. 이 복합체를 이루는 단백질 분자 하나를 ‘서브유닛’이라고 부른다.
이해하기 어렵다면 망치를 생각해보자. 우리는 망치 머리와 손잡이를 합쳐서, 따로 사용하는 것보다 훨씬 유용하고 편하게 쓸 수 있다. 망치 머리와 손잡이가 각각 망치 서브유닛 하나고, 둘이 합쳐져서 망치 복합체(...)를 이루는 것이다.
예를 들어 70S 리보솜(ribosome)에는 30S subunit과 50S subunit이 있다.[20]


9. 기타


단백질은 대부분 사슬의 시작과 끝을 가지고 있기 때문에 아민기(amine group, -NH2)와 카르복실기 말단(carboxyl group, -COOH)을 가지고 있으며, 이는 다른 물질을 단백질에 접합시킬 때 주요한 타겟 중 하나로 쓰이게 된다. 야채의 섭취없이 단백질을 과다 섭취되면 요산의 축적으로 통풍이 생길 수도 있다.[21]
  • 프리온의 경우 일반적인 가설에 따르면 핵산 등의 유전물질을 포함하지 않은, 100% 아미노산으로 구성된 단백질의 일종이다. 여기에서 구조가 이상하게 변형되어 버린 게 바로 변성 프리온.
  • 머리카락이나 손톱, 사람의 피부 조각도 단백질 덩어리인데, 때문에 개미를 비롯한 몇몇 벌레들이 이를 보면 환장해서 달려드는 경우를 볼 수 있다. 이거 기르는 한테 주면 그 쥐가 사람을 잘 따름에도 불구하고 떨어진 조각이라서인지 설화처럼 정말로 먹는다. 인간에겐 그저 떨어진 더러운 각질이나 찌꺼기에 불구하지만 얘들한텐 매우 풍부한 단백질원이기 때문.

10. 관련 문서


[1] 피단, 송화단 등의 단어만 봐도...[2] 섭취한 단백질을 아미노산으로 분해하는 효소도 단백질이고, 아미노산에서 단백질을 만드는 효소도 단백질이다.[3] 그러니까 레고 블럭 같은 식으로, 몇 가지 안되는 블럭 종류로 갖가지 것을 만들어 낼 수 있는 식으로 이해할 수 있다.[4] 효소 계열의 단백질 종류들은 정말 나노봇같은 역할들을 하지만, 액틴같은 단백질들은 건물의 골조 같은 수동적인 역할을 하는 경우도 있다. 여튼, 능동적이든 수동적이든 각자의 기능들이 있다.[5] 헤모글로빈의 분자량이 64,000 dalton (1 dalton은 1 proton의 질량)가량. 1(mole)의 질량이 대략 '''64 kg'''이라는 뜻이다. 질소 같은 것과 비교해 보자. 참고로 탄수화물포도당 한 분자의 분자량이 180 dalton 정도이다.[6] cDNA 정보[7] 전혀 사전 지식이 없는 언어의 단어 나열로 뜻을 유추해야하는 경우와 거의 유사하다.[8] 구조를 알아도 기능을 알 수는 없다.[9] 시스테인의 가지에 존재하는 티올(-SH; Thiol) 때문에 시스테인의 함량과 관계가 있다.[10] 자세한 항목은 작용기 문서로.[11] 두 개의 시스틴기(-SH) 사이의 결합[12] 또 다른 대표적인 예로는 3개의 긴 가닥으로 구성된 콜라겐과 4개의 소단위체로 구성된 헤모글로빈등이 있다.[13] 예를 들어 아미노산 10개로 구성된 단백질은 '''20^10'''종류의 구조가 있을 수 있다. 좌우 대칭을 빼더라도 엄청난 숫자이다.[14] 단, 해당표에는 핵산(nucleic acid)도 포함되어있다.[15] 금속, 핵산, 탄수화물 등등. 보결족이라고 부른다.[16] 단, 동물의 사료의 경우 저급 단백질(소화효소에 내성을 가지는 섬유상단백질, 대표적으로 '''깃털과 부리''')이 들어있는 경우가 많지만 한국에선 별도로 표기를 강제할 수가 없어 가격을 보고 따져봐야 하는 경우가 많다. 애완동물 사료라면 무조건 이름 있는 수입 제품을 사면 해결된다. 소 등의 경우에는 속편하게 요소를 먹이기도..[17] 대두 단백과 대두의 점수가 다른 것은, 콩기름과 같이 대두에 있는 단백질이 아닌 성분들(특히 탄수화물지방)이 PDCAA 평가 기준에 맞지 않아 점수를 까먹기 때문. #[18] 여담으로 트립신은 양성피드백 작용으로 자기 자신과 다른 효소들을 활성화시킨다. 일단 트립시노젠에서 엔테로키나아제가 스타트를 끊어 주면 그 후로는 자기 혼자 알아서 트립시노젠, 키모트립시노젠 기타 등등의 효소들을 활성화시킨다.[19] 글루타민이나 아스파라긴에 결합시켜 독성을 없애고 수송체로 사용한다.[20] 30S + 50S = 80S이 아닌가 생각을 하는 경우가 있겠지만, 실제로는 겹침과 결합 했을 때의 일부 중량 상실때문에 실제 중량은 이보다 적다.[21] 그런데 요산은 사실 단백질이 아닌 핵산이 원인물질이다.


분류