검수요청.png검수요청.png

인공단백질

위키원
이동: 둘러보기, 검색

인공단백질 (Artificial Proteins)은 실험실에서 합성하거나 설계하여 만든 단백질을 말한다. 이들은 자연에서 발견되는 단백질의 구조나 기능을 모방하거나, 때로는 전혀 새로운 기능을 가진 단백질을 만들기 위해 고안된다. 인공단백질의 개발은의학, 생명공학, 재료 과학 등 다양한 분야에서 응용될 수 있으며, 특정 질병의 치료제 개발이나 환경 문제 해결 등에 기여할 수 있다.

개요

인공단백질은 인공적으로 설계된 아미노산 배열을 갖는 단백질 또는 기존의 단백질을 바탕으로 화학적 및 유전공학적 방법으로 수정을 하여 기능을 변화시킨 것이다. 최근 인공단백질을 이용한 질병의 진단 및 치료가 활발하게 이루어지고 있으며 인공단백질의 원리와 응용 예를 이해하는 것은 더욱 개량된 신규 치료법의 개발 등에 중요하다.

인공단백질은 임의의 아미노산 배열을 갖기 때문에 인공단백질을 설계함에 있어서 아미노산 배열과 단백질의 고차원적 입체 구조와의 관계를 파악하는 것이 중요하다. 또한 단백질 구조 예측을 기반으로 하여 이론값과 실험값 사이의 높은 상관관계의 확보, 고기능성 단백질 복합체 합성 등에 대한 연구가 활발히 진행되고 있다. 궁극적으로는 인공단백질이 실제 생체 내에 존재하는 천연 단백질과 유사하거나 더욱 높은 기능을 나타내는 것 요구된다.

인공단백질 연구에 기여한 중요한 사건 중 하나는 특정 효소의 활성을 인위적으로 변경하는 데 성공한 연구이다. 이를 통해 단백질의 기능을 조절할 수 있다는 것이 입증되었고, 이후 단백질 설계 기술의 발전에 큰 영감을 주었다. 또 다른 중요한 사건은 컴퓨터 기반의 단백질 설계 알고리즘이 개발되어, 복잡한 단백질 구조를 효과적으로 예측하고 설계할 수 있게 된 것이다.

역사 및 배경

인공단백질의 개념은 20세기 중반부터 단백질의 구조와 기능에 대한 연구가 심화되면서 발전하기 시작했다. 초기에는 주로 자연에서 발견되는 단백질의 아미노산 서열을 변형하여 새로운 기능을 부여하는 연구가 이루어졌다. 2000년대에 들어서며, 컴퓨터 기반의 분자 설계와 합성 생물학 기술의 발전으로 인공 단백질 연구가 크게 진전되었다. 이를 통해 완전히 새로운 기능을 가진 인공 단백질을 설계하고 제작하는 것이 가능해졌다.

인공단백질 설계

인공단백질이란 인류에게 필요한 기능을 갖는 단백질을 인공적으로 설계하여 만들고 활용하는 첨단 바이오 기술을 말한다. 기존의 단백질 설계의 방식은 자연에 존재하는 단백질의 아미노산 서열을 일부 변경하여 구조와 기능을 변화시키는 것이다. 전산 단백질 설계는 생물물리학적 및 생화학적 원리에 기반을 두어 컴퓨터 프로그램과 알고리즘을 이용한다. 전산 단백질 설계는 일반적으로 알려진 구조에서 시작하여 활성 부위를 유지하고 서열 일부를 수정함으로써 미리 정의된 구조로 접히며 원하는 기능을 가지는 아미노산 서열 설계를 목표로 한다. 이를 통해 단백질의 안정성을 향상시키며 구조에 맞는 최적의 아미노산 서열을 찾으려고 노력한다. 이러한 인공단백질의 설계는 물론 유용하지만, 원하는 단백질과 유사한 주형을 가진 단백질에 자연에 존재하지 않는다면 원하는 단백질을 만들 수 없으며, 있다고 하더라도 특성과 기능 변화의 제한이 있다. 또한 정확도가 낮고, 에너지와 열역학의 관점에 중점을 두어서 고난도의 실험 기법을 요구하며, 소수의 그룹에 의해서만 주도된다는 단점이 있다.

설계 및 합성 방법

인공단백질은 주로 다음과 같은 방법으로 설계 및 합성된다.

  • 유전자 재조합 기술: 기존의 자연 단백질을 변형하여 새로운 기능을 추가하거나, 단백질의 안정성을 증가시키기 위해 유전자를 재조합한다.
  • 컴퓨터 기반 설계: 단백질의 3차원 구조와 기능을 컴퓨터 모델링을 통해 예측하고, 이를 바탕으로 새로운 단백질 구조를 설계한다. 이러한 방법은 구조 기반 설계(structure-based design)와 시퀀스 기반 설계(sequence-based design)로 나뉜다.
  • 데 노보 설계 (De Novo Design): 기존의 단백질을 참고하지 않고 완전히 새로운 단백질을 설계하는 방법이다. 이 접근법은 인공지능과 기계 학습 알고리즘의 도움을 받아 더욱 발전하고 있다.
  • 화학적 합성: 단백질의 기본 단위인 아미노산을 화학적으로 결합하여 새로운 단백질을 합성한다.

AI 기반 인공단백질 설계

AI 기술은 딥러닝을 이용하여 단백질 구조 및 기능 간의 관계 학습을 한다. 이를 통해서 단백질-리간드 상호결합을 예측하거나, 단백질-단백질 상호작용을 예측하거나, 인공단백질을 생성하는 등 여러 분야에서 활용된다. 이 중 AI를 기반으로 하는 인공단백질 설계는 기존 인공단백질 설계의 단점을 해결할 수 있다. AI 기술을 이용하는 경우 자연계에 존재하지 않거나 실험적인 방법으로는 설계 불가능한 단백질을 인공적으로 설계할 수 있다. 단백질을 구성하는 아미노산은 20종으로 굉장히 다양하고 복잡한 조합이 가능하나, 자연에 존재하는 단백질에는 한계가 있다. 이때 AI 기술을 이용한다면 훨씬 다양한 구조의 단백질을 설계해 볼 수 있다. 또한 딥러닝 모델을 통한 새로운 통찰력을 제시와 단백질 설계의 비교적 쉬운 접근성을 기대해 볼 수 있다.

인공단백질 설계 연구의 현재 목표는 표적 구조로 잘 접힐 수 있는 아미노산 서열을 찾는 데에 있다. 단백질 구조의 파악과 서열의 파악은 그 관계가 아주 깊다. 초기에는 실험적인 방식으로 인공단백질을 설계할 때 아미노산 서열을 먼저 파악하고, 그 서열을 바꾸는 방식으로 단백질을 설계했다. 이 경우 아미노산의 서열을 변화시키고 원하는 구조와 기능을 갖추었는지 살펴보는 과정을 반복해야하므로 시간과 비용이 많이 소요된다. 최근에는 데이터 처리 기술 및 인공지능의 발전으로 단백질 구조 예측의 정확도가 향상되었다. 이에 단백질 구조의 설계는 먼저 원하는 단백질의 구조를 파악하고, 이 구조에 가장 적합한 아미노산의 서열을 찾는 것을 목표로 진행된다

인공지능 기반 단백질 설계 도구 사례

첫 번째는 2022년 미국 워싱턴 대학의 PreteinMPNN(Protein message-passing neural network)이다. 이는 딥러닝 기 반 단백질 서열 설계 모델로서 단백질 구조로부터 구조 골격에 어울리는 아미노산 염기서열을 디자인하도록 개발된 도구이다. 이 모델은 원하는 구조의 아미노산 간의 거리 정보를 측정하여 인코더에 입력하면, 인코더가 시퀀스 디코더에서 가장 적합한 것으로 판단되는 아미노산을 계산하고 표현하는 방식으로 이루어진다. 표현 방식으로는 노드로 아미노산을 표현하고 에지로 아미노산 사이의 거리와 각도를 표현한다. 여기에 벡터로 노드의 경우 아미노산의 종류, 위치, 이차구조의 정보를 부여하고, 에지에 아미노산 사이 거리, 각도, 수소 결합의 정보를 부여한다. 이렇게 신경망을 이용하여 단백질 구조와 시퀀스 특징을 추출함으로써 각 아미노산의 위치에 대한 확률 분포를 예측한다. 연구팀은 ProteinMPNN의 성능을 평가하기 위하여 402개의 단백질에 대하여 모델이 디자인한 서열로부터 예측된 단백질 구조와 실험으로 확인된 구조(기존에 알고 있던 단백질의 구조)를 비교해보았다고 한다. 이때 ProteinMPNN을 이용한 경우 52.9%가 일치하였다고 하니, 기존에 비해 단백질 골격구조를 기반으로 아미노산 서열을 예측하는 능력이 우수하다는 것을 알 수 있다.

두 번째는 2023년 미국 워싱턴 대학에서 공개한 RFdiffusion이다. 이는 확산 모델을 사용하는 생성형 인공지능이다. 확산 모델이란 자가지도학습(Self-supervised Learning) 방법의 하나이다. 확산 모델의 과정에서 모델은 학습 데이터로 주어진 입력 이미지, 혹은 단백질 서열에 노이즈를 섞고(Forward diffusion) 다시 본래 입력 값을 추론하는(Reverse diffusion) 모델을 기초로 한다. 이는 역과정을 축적시켜서 생성 모델의 학습을 진행하는 것이라고 볼 수 있다. 확산 모델은 새로운 분자와 단백질 구조의 예측 및 설계 분야의 혁신을 주도하고 있다.

RFdiffusion의 연구팀은 세균과 바이러스 단백질의 특정 영역을 인식하는 항체를 디자인하게 한 후에 이를 실험실에서 합성하여 표적 단백질과의 결합을 확인해보았다. 단백질 결합의 성공률은 10% 이상으로 기존보다는 향상되었으나 아직 낮은 성공률을 가지고 있었다.

현재 인공지능 기반 인공 단백질 설계는 고정된 단백질 구조의 설계만 이루어진다는 점에 한계점이 있다. 실제로 생물체 내에서 효소의 활성 부위 등은 움직이기 때문에, 단백질의 기능적 위치나 상호작용 설계에 동적 모델 설계가 필요할 것으로 생각된다. 인공단백질 디자인을 이용하여 만들어진 인간면역결핍 바이러스(HIV)와 호흡기세포융합바이러스(PSV)의 단백질 백신이 임상 1상 진행 중인 점 등 AI 기반 인공단백질 설계는 유용하게 발전하고 있다. 이는 단백질 신약, 합성 생물학, 신소재 등 관련 분야의 우수한 결과물들을 인공 단백질 기반으로 창출할 수 있게 할 것이며, 큰 혁신을 가져올 것으로 기대된다.

AlphaFold

AlphaFold는 단백질의 구조를 예측하는 AI 시스템으로, 1차원 아미노산 서열로부터 단백질의 3차원 구조를 예측한다. OpenAI가 ChatGPT를 출시한 것처럼, AlphaFold의 출시와 오픈소스화는 전 세계 과학 커뮤니티에 큰 주목을 받았다. 단백질은 생명체의 기본 구성 요소이며, 그 모양은 기능과 밀접하게 연관되어 있어, 구조를 알면 단백질의 작동 방식을 더 잘 이해할 수 있다. AlphaFold는 이러한 지식을 전 세계와 공유하기 위해 AlphaFold Protein Structure Database를 구축했으며, 이를 통해 단백질 구조에 대한 지식이 대폭 확장되었다. 이 데이터베이스는 식물, 박테리아, 동물 등 다양한 생명체에 대한 단백질 구조를 포함하며, 이는 지속 가능성, 식량 안보, 소외된 질병 연구 등 중요한 문제에 대한 연구를 진전시킬 수 있는 새로운 기회를 제공한다.

AlphaFold는 단백질의 3D 구조를 몇 초 만에 예측할 수 있으며, 이는 과거에는 수개월 또는 수년이 걸리던 작업이다. 이 기술은 이미 핵 기공 복합체의 구조를 밝히는 등 중요한 발견을 가속화했다. 오늘날 AlphaFold는 50만 명 이상의 연구자들에 의해 사용되며, 플라스틱 오염, 항생제 내성과 같은 실제 문제에 대한 해결책을 가속화하는 데 기여하고 있다.

​이 AI 시스템의 성공은 인공지능이 과학적 발견을 가속화하고 인류를 발전시킬 수 있음을 입증한다. AlphaFold의 코드는 오픈소스로 공개되었으며, 생물학자들이 쉽게 접근하고 사용할 수 있도록 설계된 도구와 함께, 생물학 연구, 보안, 윤리 및 안전을 고려하여 전 세계와 이점을 공유하는 방법에 대한 신중한 접근 방식을 따랐다.

​이제 AlphaFold는 더욱 확장된 데이터베이스를 통해 생물학에 대한 우리의 이해를 극적으로 높일 잠재력을 가지고 있으며, 이는 생명 과학에 컴퓨팅과 AI 방법을 적용함으로써 가능한 것을 보여주는 중대한 발전이다. AlphaFold는 디지털 생물학 분야의 선구자로서, 과학적 발견을 발전시키고 생명의 기본 메커니즘을 이해하는 데 있어 AI의 엄청난 잠재력이 실현되기 시작한 것을 보여준다.

응용 분야

  • 의약 및 치료제 개발: 특정 질병에 맞는 맞춤형 치료제를 개발하기 위해 인공단백질을 사용한다. 예를 들어, 특정 암세포를 타겟으로 하는 단백질 치료제나 항체를 제작할 수 있다.
  • 진단 및 바이오센서: 특정 분자나 병원체를 감지하는 바이오센서에 활용되며, 이는 진단의 정확도를 높이는 데 기여한다.
  • 재료과학: 강력하고 유연한 생체 재료를 만들기 위해 인공단백질을 사용한다. 예를 들어, 거미줄의 특성을 모방한 강력한 인공 섬유를 제작할 수 있다.
  • 기능성 효소: 특정 화학 반응을 촉진하는 맞춤형 효소를 개발하여 산업 공정의 효율성을 높이기 위해 사용된다.

인공단백질의 미래

하나의 방향은 의학 분야에서의 응용 확대이다. 특히, 개인 맞춤형 의약품 개발, 특정 질병을 대상으로 한 정밀 치료제 개발 등이 주목받고 있다. 또한, 재료과학 분야에서는 인공단백질을 활용하여 더 강하고, 경량이면서도 환경 친화적인 새로운 재료를 개발하는 연구도 진행 중이다. 환경 보호와 관련해서는, 오염 물질을 분해하거나 제거할 수 있는 인공 효소의 개발을 통해 환경 정화 기술의 발전에 기여할 것으로 기대ㄷ한다. 예를 들어, 플라스틱 분해 효소나 대기 중의 이산화탄소를 흡수할 수 있는 단백질의 설계는 환경 문제 해결에 큰 기여를 할 수 있다.

또한 인공단백질 연구에서 주목해야 할 연구 분야 중 하나는 생체 모방(biomimicry) 기술이다. 자연에서 발견되는 복잡한 단백질 구조와 기능을 모방하여, 더 효율적이고 특수한 기능을 가진 인공 단백질을 설계하는 것이다. 또 다른 중요한 분야는 인공지능을 활용한 단백질 설계 기술의 발전이다. AI 기술을 통해 단백질 구조와 기능 간의 복잡한 관계를 더 정확하게 예측하고, 새로운 단백질을 더 효율적으로 설계할 수 있게 된다.

참고자료

같이 보기


  검수요청.png검수요청.png 이 인공단백질 문서는 바이오에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.  

  • 〈[url 제목]〉, 《사이트명》