본문 바로가기

Astronomy

AI가 발견하는 외계행성: 머신러닝 천문학의 현주소

  머신러닝 알고리즘은 전통 천문학이 놓친 미세한 외계행성 신호를 포착하고 있다. 인공지능은 이제 천문학의 새로운 도구를 넘어, 인간 탐사 능력의 확장을 이끄는 지성으로 작동 중이다. 천체물리학, 데이터 과학, 계산천문학이 융합하는 이 지점에서 외계 생명체 탐색의 패러다임도 서서히 전환되고 있다. 본 글은 외계행성 탐사에서 AI가 수행하는 역할, 사용되는 기술, 실제 성과, 한계점과 미래 전망까지 심층적으로 고찰한다.

AI가 발견하는 외계행성: 머신러닝 천문학의 현주소

외계행성 탐색의 역사와 한계: 천문학의 전통적 방식

  인류는 오랫동안 외계 생명체의 존재 여부를 탐구해 왔고, 이 과정에서 외계행성 탐색은 핵심적인 연구 분야로 부상했다. 1995년, 최초의 외계행성인 51 Pegasi b가 발견되기 전까지, 천문학자들은 행성 탐사의 대부분을 이론적 모델에 의존했다. 그러나 도플러 효과 분석법, 트랜싯 방법(transit method), 중력렌즈 기법 등 다양한 관측 기술이 발전하면서, 태양계 외부에 존재하는 수천 개의 외계행성이 점차 드러나게 되었다.
  이러한 전통적 방식은 정교하지만 동시에 한계도 분명했다. 예를 들어, 트랜싯 방식은 별 앞을 지나가는 외계행성의 밝기 변화를 포착하지만, 이는 노이즈에 민감하고 방대한 관측 데이터를 일일이 분석해야 한다는 문제를 안고 있었다. 천문학자들이 하루에 분석할 수 있는 별의 수는 제한적이었고, 특히 미세한 밝기 변화나 주기성이 불명확한 신호는 ‘실패’로 분류되기 쉬웠다.
  이러한 한계를 극복하기 위해 등장한 것이 바로 머신러닝 기반의 데이터 분석 기술이다. 머신러닝은 비선형 데이터 내의 패턴을 식별하는 데 탁월하며, 반복적이고 대량의 데이터를 스스로 학습해 가며 인간보다 더 빠르고 정밀한 분석을 가능케 한다. 천문학자들은 더 이상 모든 데이터를 수작업으로 확인하지 않고, 알고리즘이 후보군을 선별하고 인간이 이를 검증하는 ‘AI-휴먼 하이브리드’ 시스템을 구축하기 시작했다.

머신러닝과 외계행성 데이터 분석의 융합: NASA와 구글의 사례

  천문학계는 이미 2010년대 중반부터 머신러닝 기법을 활용하여 기존의 관측 데이터를 자동 분석하는 시도를 본격화했다. 특히 NASA의 케플러 우주망원경(Kepler Space Telescope)이 보내온 방대한 데이터는 그 규모와 복잡성으로 인해 전통적인 분석 방식만으로는 한계가 분명했다. 이러한 문제의식 속에서 구글의 머신러닝 팀은 NASA 과학자들과 협력하여, 심층신경망(Deep Neural Network)을 활용한 외계행성 탐색 알고리즘을 구축하게 된다.
  이 협업의 대표적 성과는 2017년 발표된 Kepler-90i의 발견이다. 이 외계행성은 지구에서 약 2,500광년 떨어진 Kepler-90 항성계를 공전하는 가스형 행성으로, 당시까지 누락되었던 미세한 트랜싯 신호를 머신러닝 알고리즘이 찾아냈다. 이 발견은 인공지능이 단순한 보조 수단이 아니라, 새로운 과학적 발견의 주체로 기능할 수 있음을 입증한 사례였다.
  구글의 알고리즘은 과거의 외계행성 신호 패턴을 학습한 후, 케플러 데이터에서 유사한 패턴을 찾아내는 방식으로 작동하였다. 여기에는 합성곱 신경망(CNN)이 사용되었으며, 이는 이미지 분석에 뛰어난 성능을 보이는 구조로, 밝기 곡선(light curve) 데이터를 시각적 형태로 해석할 수 있게 했다. 이와 같이 머신러닝은 천문학자들이 놓칠 수 있는 미세한 패턴을 감지하여, 기존 데이터 속 '숨겨진 행성'을 찾아내는 데 성공하고 있다.
  또한, 이러한 시스템은 인간의 분석 편향을 제거하는 데도 기여한다. 예를 들어, 인간은 주기성이 분명하고 강한 신호에 더 주목하는 반면, 머신러닝은 '비정상적이지만 반복되는 미세한 노이즈' 속에서도 유의미한 패턴을 인식할 수 있다. 이는 과거의 천문학 연구가 본질적으로 경험 기반의 직관에 의존하던 것과는 대조되는 방식이며, AI가 천문학의 인식론적 전환을 주도하고 있음을 시사한다.

머신러닝 알고리즘의 유형과 그 과학적 기여

  외계행성 탐지에 사용되는 머신러닝 알고리즘은 단일한 구조로 구성되지 않는다. 오히려, 데이터의 성격과 목표 분석 방식에 따라 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 그리고 강화학습(Reinforcement Learning)까지 다양한 형태가 활용된다. 이 중 가장 많이 사용되는 형태는 지도학습으로, 기존에 외계행성으로 판정된 밝기 곡선 데이터를 학습 데이터로 삼아 새로운 관측 데이터의 특징을 분류하는 방식이다.
  한편, 비지도학습은 데이터 자체에 대한 사전 지식이 부족하거나 라벨링이 불가능한 경우 유용하게 사용된다. 예컨대, 수백만 개의 별에서 수집된 트랜싯 데이터를 클러스터링하여 ‘이상값’을 식별할 때, 비지도 알고리즘은 매우 효과적인 탐지 도구로 작동한다. 이 방식은 인간이 인지하지 못하는 변수 간 상관관계를 포착함으로써, 천문학 연구의 새로운 이론적 가설을 생성하는 데도 기여하고 있다.
  더 나아가 강화학습은 외계행성의 궤도 변화나 시간에 따른 트랜싯 신호의 변동성을 실시간으로 추적하는 데 사용된다. 이는 예를 들어, TESS(Transiting Exoplanet Survey Satellite)와 같은 관측 플랫폼이 실시간으로 관측 환경에 따라 분석 방식을 조정할 수 있도록 한다. AI는 일정한 보상 피드백을 통해 분석 전략을 자가 수정하며, 이는 향후 자율적 우주망원경 시스템의 기반 기술로도 응용될 수 있다.
  이처럼 머신러닝 알고리즘은 단순한 분석 도구가 아니라, 외계행성 탐사의 새로운 패러다임으로 진화하고 있다. 과거에는 수동적인 관측과 해석이 중심이었다면, 오늘날의 천문학은 데이터 기반의 예측, 자동화된 후보 선별, 실시간 신호 처리라는 복합적 흐름으로 전환되고 있다. 이러한 변화는 AI가 단순히 효율성을 높이는 수준을 넘어서, 천문학의 방법론 자체를 재구성하고 있음을 의미한다.

외계행성 탐사의 미래: AI 기반 자동망원경과 범은하적 데이터 분석

  향후 외계행성 탐사에서 가장 주목받는 변화는 인간의 개입 없이 AI가 자율적으로 관측, 분석, 판단을 수행하는 AI 기반 자동망원경 시스템의 보편화이다. 이미 ESA(유럽우주국)와 NASA는 AI를 탑재한 우주망원경 기획을 다수 추진하고 있으며, 지상망원경에서도 이러한 시도는 확산되고 있다.
  예를 들어, LSST(Legacy Survey of Space and Time)는 2020년대 중반부터 본격적으로 작동하며 매 3일마다 전 하늘을 스캔할 예정인데, 이로 인해 매일 수십 테라바이트의 이미지 및 곡선 데이터가 생성된다. 이러한 데이터는 인간의 분석 속도를 초과하므로, 실시간으로 AI가 분류하고 선별하여 ‘탐색 우선순위’를 제안하는 체계가 필수적이다.
  또한, AI는 단일 천문대의 데이터를 넘어 범우주적 관측 네트워크를 연계하여 분석하는 데도 중심적인 역할을 한다. 이른바 페더레이티드 러닝(Federated Learning) 구조를 활용하면, 각 관측소의 데이터를 통합하지 않고도 학습 모델을 공유하여 글로벌 분석이 가능하다. 이는 데이터 프라이버시를 유지하면서도 알고리즘의 정확성을 극대화할 수 있어, 다국적 협업 프로젝트에서 점차 중요해지는 기술이다.
  이와 같은 AI 중심의 외계행성 탐사 방식은 궁극적으로 ‘가설-실험’의 전통적 과학방법론을 넘어서는 새로운 탐색 모델을 제시한다. 머신러닝은 사전 가설 없이도 데이터에서 직접 구조와 관계를 추출할 수 있으며, 이는 인간의 인식 능력을 넘어서는 복잡한 패턴 탐색에 결정적인 도구가 된다. AI는 외계생명체 탐사의 전제인 ‘거주가능성(habitability)’의 조건도 재정의하고 있으며, 물리적 환경뿐 아니라 생물학적 신호의 변이 가능성까지 탐색할 수 있는 알고리즘 개발이 진행 중이다.

알고리즘의 신뢰성과 철학적 논쟁: AI가 ‘발견’의 주체가 될 수 있는가?

  AI가 과학적 발견의 전면에 나서게 되면서, 기존 과학철학이 제기해온 ‘발견의 주체’에 대한 논쟁이 새롭게 부상하고 있다. 전통적으로 과학은 인간의 직관과 이론, 그리고 실증적 방법을 통해 우주를 이해해 왔다. 그러나 AI는 가설 없이 데이터로부터 결과를 도출하며, 종종 인간이 설명할 수 없는 방식으로 발견을 수행한다.
  이러한 과정은 블랙박스 문제로 이어진다. 즉, 딥러닝 모델은 결과를 도출하지만 그 내부 연산과정이 인간에게 불투명하여, ‘왜’ 특정 행성이 발견되었는지 명확한 설명이 어려운 경우가 많다. 이는 과학적 설명의 핵심 요소인 ‘재현가능성’과 ‘이해가능성’이라는 기준에 도전하는 지점이다.
  철학자들은 이에 대해 AI가 과학적 발견의 ‘보조자’인지, 아니면 독립적인 ‘주체’인지에 대해 엇갈린 입장을 보인다. 인식론적 AI(Epistemic AI) 개념은 AI가 독립적으로 지식을 생산하는 존재로 간주할 수 있으며, 이에 따라 과학의 정의 자체를 수정해야 한다는 주장도 제기되고 있다.
  한편, AI의 편향성과 훈련 데이터의 문제도 간과할 수 없다. 외계행성 데이터는 지구 중심의 물리 조건에 기반하여 라벨링되는 경향이 있으며, 이는 AI의 판단에 특정한 방향성을 강제할 수 있다. 또한, 알고리즘은 훈련 데이터의 결함을 그대로 반영할 수 있으므로, 인간의 가치 판단 없이 자동화된 분석에 전적으로 의존하는 것은 과학적 오류의 가능성을 내포한다.
  따라서 향후 AI 천문학은 기술적 진보뿐 아니라, 과학철학, 윤리학, 데이터 거버넌스와의 긴밀한 대화가 필수적이다. AI가 수행하는 분석은 결과 이상으로 그 방식과 전제가 해명되어야 하며, 이는 새로운 형태의 과학적 책임을 요구한다. 결국, AI가 외계행성을 ‘발견’하는 시대는 도래했지만, 우리는 여전히 이 발견을 ‘이해’할 수 있을 것인가라는 근본적 질문과 마주하고 있다.