검수요청.png검수요청.png

바이오 빅데이터

위키원
이동: 둘러보기, 검색

바이오 빅데이터환자 유전 정보, 의료 기록, 임상시험 결과 등 거대한 양의 생물학적 및 의료 데이터를 포함한다. 이 데이터의 힘을 활용해 바이오 연구원들과 의료 전문가들은 질병을 보다 정확하게 예측하고 맞춤형 치료 방법을 개발하며, 환자 건강 관리를 혁신적으로 개선할 수 있다.

바이오 빅데이터 분석 기술 발전에 힘입어 전에는 불가능했던 방식으로 환자 건강을 이해하고 예측하는 것이 가능해졌다. 예를 들어 유전자 분석을 통해 개인의 질병 발병 위험을 평가하고, 이 정보를 바탕으로 예방 조치를 취하거나 맞춤형 치료 계획을 수립할 수 있다. 이러한 접근 방식은 특히 암, 심혈관 질환, 당뇨병과 같은 만성 질환 관리에 혁명을 일으키고 있다.

개요[편집]

바이오 빅데이터는 생명과학 및 바이오 기술 분야에서 생성된 방대한 양의 데이터를 말하며, 이 데이터는 유전체, 단백질체, 대사체, 세포 및 조직 분석, 환자 기록, 환경 데이터 등 다양한 바이오 데이터를 포함한다. 바이오 빅데이터는 인공지능(AI), 머신러닝, 데이터 마이닝 등의 기술과 결합되어 생명현상의 이해, 질병 진단 및 치료법 개발, 신약 개발, 개인 맞춤형 의료 및 헬스케어 혁신에 기여하고 있다.

특징[편집]

대규모 데이터[편집]

바이오 빅데이터는 단일 실험이나 관찰에서도 수 테라바이트(TB)에서 페타바이트(PB)까지의 데이터를 생성할 수 있다. 예를 들어, 인간 유전체 데이터는 한 사람당 약 100기가바이트(GB)에 이르는 데이터를 생성한다.

다양성[편집]

데이터는 유전체 서열, 단백질 구조, 임상 연구 데이터, 이미징 데이터, 환경 데이터 등 다양한 형태로 존재하며, 서로 다른 데이터 형식을 통합하고 분석하는 것이 중요한 과제로 떠오르고 있다.

고속 생성[편집]

차세대 시퀀싱(NGS) 기술, 고해상도 이미징, 센서 기술 등으로 인해 데이터 생성 속도가 매우 빠르다. 이는 데이터 저장 및 처리 기술의 발전을 필요로 한다.

고정밀성[편집]

바이오 빅데이터는 질병의 분자적 원인, 유전자 변이와 표현형의 관계 등 정밀한 분석을 통해 고정밀 의학을 가능하게 한다.

주요 데이터 유형[편집]

유전체 데이터

유전자 서열 데이터를 포함하며, 인간 유전체 프로젝트와 같은 대규모 연구에서 생성된다. 개인의 유전자 변이, 질병 연관성 분석 등에 활용된다.

단백질체 데이터

단백질의 구조와 기능을 분석한 데이터를 포함하며, 신약 개발 및 질병 연구에 중요하다.

대사체 데이터

세포 내 대사 경로와 관련된 대사산물을 분석한 데이터로, 질병 진단 및 생리학적 상태를 이해하는 데 사용된다.

임상 데이터

환자의 전자의료기록(EMR), 병력, 치료 반응, 약물 부작용 등으로 구성된다.

이미징 데이터

의료 영상(MRI, CT 스캔 등) 및 세포, 조직 이미지를 포함하며, AI 기반 분석을 통해 병리학적 진단과 치료 계획을 지원한다.

환경 데이터

생물학적 및 환경적 요인 간의 상호작용을 연구하기 위해 기후, 토양, 수질 데이터 등을 포함한다.

활용 분야[편집]

정밀 의학

바이오 빅데이터는 환자의 유전자 및 환경적 요인에 기반한 맞춤형 치료법 개발에 사용된다. 예를 들어, 유방암 환자에 대한 유전자 변이 분석을 통해 특정 약물의 효과를 예측할 수 있다.

신약 개발

유전체 및 단백질체 데이터를 활용해 신약 후보 물질을 탐색하고, 약물 타겟을 발굴하며, 임상시험 결과를 분석한다.

질병 예측 및 진단

빅데이터를 기반으로 질병의 조기 발견 및 예측 모델을 개발할 수 있다. AI와 머신러닝 알고리즘은 다양한 바이오 데이터를 분석해 질병의 발생 가능성을 평가한다.

생물정보학

유전자, 단백질, 대사체와 같은 생물학적 데이터를 수집, 정리, 분석하는 데 중점을 둔다. 생물학적 데이터의 통합 분석을 통해 생명과학 연구를 가속화한다.

농업 및 환경

작물의 유전자 분석, 가축의 품종 개선, 환경적 스트레스 요인 연구 등에 사용된다.

의료 영상 분석

의료 영상 데이터를 분석해 질병을 진단하고 치료 효과를 평가한다. AI 모델은 종양 크기, 위치, 진행 상태를 정확히 측정하는 데 활용된다.

기술적 과제[편집]

  • 데이터 저장 및 관리 : 바이오 빅데이터의 대규모 데이터는 기존 데이터베이스의 용량과 효율성을 초과하므로, 클라우드 컴퓨팅과 같은 새로운 저장 기술이 필요하다.
  • 데이터 통합 및 표준화 : 서로 다른 형식의 데이터를 통합하고, 데이터 간의 상호운용성을 확보하는 것이 과제이다.
  • 데이터 분석 및 해석 : 대규모 데이터에서 의미 있는 정보를 추출하기 위해 고성능 컴퓨팅 및 AI 기술이 요구된다.
  • 개인정보 보호 및 윤리 : 환자의 유전자 데이터 및 의료 기록이 포함되어 있기 때문에 데이터의 보안과 윤리적 사용이 중요하다.

의료 바이오분야 빅데이터 분석 활용 사례[편집]

국민건강지수 모니터링 시스템[편집]

빅데이터하면 구글의 독감예측시스템을 다들 기억할 것이다. 몇 년 전 구글은 독감관련 검색어를 기반으로 어느 지역에 독감이 많이 발생하는지 미국지도와 함께 알려주는 시스템을 개발하였다. 이는 빅데이터의 유명한 사례 중 하나로 꼽고 있다.

이후 좀더 발전된 시스템으로 미국스포츠의학학회(ACSM, American College of Sports Medicine)에서 도시별 미국 건강지수를 매해 분석하고 리포트하고 있다. 국민의 체력뿐만 아니라 영양정보를 고려하여 건강수준을 도시 별로 비교할 수 있도록 미국건강지수(American Fitness Index)를 빅데이터를 활용하여 개발하였고 이를 헬스케어 분야에서 활용할 수 있도록 공개하고 있다.

이와 비슷하게 국민건강보험공단에서는 국민건강 주의 알람 시스템을 운영하고 있다. 주 질병인 감기, 눈병, 식중독, 천식, 피부염을 선정하여 알람 서비스를 제공하고 있다. 질병 별로 지역과 연령을 구분해 관심, 주의, 경계, 위험 4단계로 위험도를 표시하여 사전에 주의사항을 안내하고 사전 예방 캠페인을 진행하고 있다. 이는 기간별 진료데이터 및 SNS상의 키워드 빈도수를 근거로 질병을 예측하는 시스템이다.

더 나아가 올해는 국민의 건강수준을 분석하여 제공하는 과제를 시행하려고 한다. 건강보험 청구 및 의약품 처방조제 등 방대한 보건의료 정보뿐만 아니라 기후정보를 융합하여 계절성 질병까지 예측하는 시스템을 개발 계획 중에 있다. 이는 국가차원에서 질병위험도를 예측하여 잠재적인 문제를 사전에 파악 예방하려는 노력으로써 방대한 데이터를 활용한 국민건강 예방시스템이라 할 수 있다.

병원의 의료데이터 활용[편집]

병원에서는 환자의 진단정보, 의료차트, 간호기록, 유전체 및 개인 습관 등 다양한 의료데이터를 가지고 있으며 이런 데이터를 활용할 시스템이 없었다. 하지만 빅데이터 기술을 도입하면서 비정형데이터의 분석결과까지 포함하여 의료기술에 적용할 수 있게 되었다.

한 예로 삼성서울병원에서는 유전적, 의학적 현상, 평상시 생활 등 방대한 개인의 의료데이터를 기반으로 개인별 맞춤 치료서비스를 제공하고 있다. 즉, 빅데이터 기술을 활용하여 의료데이터를 분석하고 개인에 맞는 건강관리 및 치료방법을 제안하고 더 나아가 질병 또한 예측하는 서비스이다. 이 시스템은 치료중심이 아닌 건강관리 및 예방에 좀더 초점을 맞추고 있다.

또한, 2013년도에는 다음소프트와 함께 자살 예측 시스템도 개발하였다. 자살률에 영향을 주는 요소로 물가지수 및 실업률, 날씨, 유명인 자살 등 SNS의 데이터를 활용하여 자살률을 모니터링 할 수 있다. 삼성서울병원의 성공적 사례를 기반으로 국내의 여러 병원에서도 빅데이터 활용에 많은 관심을 보이고 있고 서울대병원 및 아주대 병원에서도 빅데이터 사례를 찾아 볼 수 있다.

제약회사 빅데이터 활용사례[편집]

제약회사에서도 빅데이터를 활용하고 있으며 신약개발, 임상실험, 판매/마케팅 영역까지 전 영역에 빅데이터를 적용하고 있다. 신약개발 시 제품개발 및 임상실험에 많은 돈을 투자해야 한다. 하지만 기존의 의약품의 대한 선호도 및 부작용 등 관련 데이터를 활용하면 제품개발비용을 어느 정도 줄일 수 있다. 또한, 마케팅에도 활용할 수 있다. 얼마나 판매가 될 것이며 수요대상 및 마케팅에 필요한 정보를 사전에 알 수 있어 투자비의 큰 절감효과를 볼 수 있다.

그 예로, 동아ST는 아주대 병원과 함께 복합제 개발과정에서 빅데이터 기술을 활용하였다. 처방전 및 약물의 부작용 사례를 통해 약 개발 시 비용과 리스크를 줄일 수 있었다. 예를 들면 일반적으로 관절염 약과 소화제를 같이 처방하는 경우가 많다. 따라서 이런 경우 복합제를 개발하는 편이 좋다. 개발 시 무작위로 여러 약을 혼합해서 실험을 하는 것보다 빅데이터 기술을 활용한 정확한 수요 및 의료기술을 포함한다면 비용과 리스크를 크게 줄일 수 있다.

IBM 왓슨(Watson)의 의료분야 활용[편집]

사람의 말을 이해하고 대답할 수 있는 IBM의 인공지능 슈퍼컴퓨터인 왓슨(Watson)은 방대한 의료데이터를 분석하여 환자를 진단하여 의사에게 치료법을 추천해준다. 수백만 건의 진단서, 환자 기록, 의료서적 등의 방대한 데이터를 바탕으로 왓슨 컴퓨터는 순식간에 분석을 통해 확률이 가장 높은 병명과 성공 가능성이 높은 치료법을 동시에 의사에게 조언을 한다. 그럼으로써 의사마다 다른 판단을 내릴 수 있는 경우 판단의 오차를 크게 줄이고 객관성을 높일 수 있다.

실제적으로 의료계에서는 환자의 상태를 파악하고 치료법까지 찾는데 며칠씩 걸리는 경우가 많다.하지만 왓슨은 몇 분만에 찾을 수 있어서 치료를 빨리 시작할 수 있게 되었다. 최근 발표에 의하면 IBM은 MD앤더스 암센터를 포함한 유명 암센터와 협력하여 암 진단과 치료법에 대해 연구하였고, 연구 결과 특정 암 진단을 하기 위해 한 명의 의사가 160시간 이상 걸리는 결과를 왓슨은 수분 만에 결과를 냈고 정확도도 96%에 달한다고 공개했다. 또한, MRI나 CT같은 영상정보를 판독하고 진단하는 기술도 많이 발달하였다고 발표했다.

부정적인 시각도 있다. 과연 왓슨이 의사를 대신할 수 있을지 많은 사람들이 의문을 갖고 있다. 저자는 왓슨의 의견을 바탕으로 최종 결정은 의사가 내려야 된다고 생각한다. 즉, 왓슨의 분석 결과는 단지 참고사항으로만 활용되어져야 한다.

바이오 분야에서 빅데이터 활용을 높이기 위해서는 관련 법 개선이 필요하다. 현재는 개인정보보호법 및 의료법에 의해 의료데이터를 활용이 어렵다. 또한, 국가에서 보유한 의료데이터는 의료사업에 공유가 어렵고 의료기관별 데이터의 표준화도 되어 있지 않아 활용은 더더욱 어렵다. 이에 반해 미국에서는 의료산업에 빅데이터를 활용하여 매년 100조원이 넘는 가치를 창출할 수 있다고 판단하여 의료기관은 서로 의료 데이터 및 약제 데이터 등 의료 데이터를 공유하고 있다.

개인의 의료정보 유출에 대한 큰 이슈사항이 있지만 이런 데이터의 활용으로 인해 더 큰 부가가치를 생산할 수 있다면 의료 데이터를 활용하는데 있어서 법 제도개선을 하여 개인의 정보유출을 최소화하고 국민의 건강에 도움이 되도록 빅데이터 기술이 많이 활용되었으면 한다.[1]

국가 통합 바이오 빅데이터 구축 사업[편집]

'국가 통합 바이오 빅데이터 구축 사업'은 정밀의료 기술개발 등 의료혁신과 바이오헬스 혁신성장을 위해 △임상정보 △유전체 등 오믹스 데이터 △공공데이터 △개인보유건강정보를 통합해 구축하고 연구 목적으로 개방하는 연구개발(R&D) 사업이다.

1단계 구축(2024~2028년)에서는 77만2000명 모집을 목표(4개부처 6065억8000만원)로 하고 있다.

2023년 6월 29일 예비타당성조사를 통과했으며, 이후 관계부처 TF 등 범부처 거버넌스 체계를 구축하고 학계, 의료계 및 산업계 민간위원이 참여하는 사업추진위원회를 구성해 본격적인 사업 추진을 준비 중이다.

이번 설명회는 올해 4월 본 사업 시작에 앞서 관심 있는 연구자 및 연구기관, 의료기관, 기업 등을 대상으로 공모과제별 상세 내용을 설명하고 다양한 의견을 청취하기 위해 마련됐다.

설명회는 △참여자 모집 및 임상정보·검체 수집, 인체자원제작 및 검체 운송(세션 1, 보건산업진흥원 사업단) △유전체 등 오믹스 데이터 생산 분석(세션 2, KOBIC) △데이터뱅크 구축 및 운영 및 바이오 빅데이터 플랫폼 구축 및 운영(세션 3, KHIS·KISTI) 등 주제별로 운영됐으며, 각 분야별로 사업 추진 내용을 상세히 설명하고 질의응답 시간을 가졌다.

정부는 2024년 4월부터 한국보건산업진흥원에 사업단을 설치해 본격적으로 사업을 추진하며, 이날 사업설명회에서 수렴된 다양한 의견을 바탕으로 과제 공모를 통해 수행기관을 선정하고 참여자를 모집하여 바이오 빅데이터를 구축할 계획이다.[2]

각주[편집]

  1. 김서연, 〈빅데이터시대 의료 바이오분야 빅데이터 분석 활용 사례〉, 《삼성SDS》, 2017-06-22
  2. 이승덕 기자, 〈‘국가 통합 바이오 빅데이터 구축’ 4월부터 본사업〉, 《의학신문》, 2024-03-28

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 바이오 빅데이터 문서는 바이오에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.