데이터가 넘쳐나는 시대, 생물학이 마주한 가장 오래된 문제
초파리의 구애 행동을 처음 채점하던 연구원 시절을 종종 떠올린다. 수컷 한 마리가 암컷을 뒤쫓으며 한쪽 날개를 펼쳐 진동시키고, 초파리 유전학자들은 그 떨림에 ‘사랑의 노래(courtship song)’라는 이름을 붙였다. 교과서 속에서 그것은 명료한 행동이다. 그러나 막상 모니터 앞에 앉으면 모든 경계가 흐물흐물해진다. 날개를 살짝 들었다 내린 동작은 노래의 시작인가, 그저 자세를 고친 것인가. 0.4초의 정적은 한 소절의 끝인가, 잠시 숨을 고른 것인가. 같은 영상을 본 두 사람이 전혀 다른 ‘구애 지수(courtship index)’를 적어 내는 일은 흔했다. 우리는 분명 같은 초파리를 바라보고 있었지만, 서로 다른 행동을 세고 있었던 것이다.
이 사소한 기억이, 최근 신경과학 매체 《더 트랜스미터(The Transmitter)》에 실린 한 편의 글을 읽으며 선명하게 되살아났다. 제목은 도발적이다. “열여덟 팀이 같은 신경생리 데이터를 분석하고, 완전히 다른 답을 얻었다.”
지난 3월 포르투갈 리스본의 샴팔리모 재단에서 ‘브레인핵(Brainhack)’이라는 해커톤이 열렸다. 마흔 명 남짓한 신경과학자들이 두세 명씩 열여덟 팀으로 나뉘어, 똑같은 뉴로픽셀(Neuropixels) 데이터를 받았다. 생쥐 열여덟 마리의 뇌 세 영역에서 동시에 기록한 단일 뉴런의 발화와 국소 장전위(local field potential)였다. 첫 번째 과제는 단순해 보였다. 세 영역 가운데 어디에서 ‘샤프웨이브 리플(sharp-wave ripple)’이 가장 빽빽하게 나타나는가. 리플은 해마에서 관찰되는 특징적인 고주파 진동으로, 기억의 응고와 깊이 얽혀 있다고 알려진, 신경생리학에서 가장 ‘단단한’ 측정 대상 중 하나다.

표면적으로 팀들은 합의에 이른 듯 보였다. 열일곱 팀 중 열두 팀이 “영역 간 리플 밀도에 차이가 없다”고 답했으니까. 그러나 이 합의는 신기루였다. 같은 결론에 도달한 팀들이 실제로 관찰한 리플의 개수는, 사실상 0개부터 분당 10개까지 흩어져 있었다. 누군가는 리플이 거의 없는 뇌를 보았고, 누군가는 리플로 가득 찬 뇌를 보았다. 그들이 우연히 같은 문장—”차이 없음”—을 적어 냈을 뿐, 본 것은 완전히 다른 세계였다. 글쓴이들의 질문은 서늘하다. 리플이 무엇인지조차 합의하지 못한다면, 우리는 그 밖에 또 무엇을 틀리고 있는 것일까.
더 깊이 들여다보면 문제는 더 커진다. 어느 팀도 엉터리 방법을 쓰지 않았다. 누군가는 학계가 합의한 표준 프로토콜을 따랐고, 누군가는 딥러닝 기반 탐지기를 돌렸으며, 누군가는 고전적인 대역통과필터와 문턱값 기법을 조금씩 다른 변수로 적용했다. 모두 ‘방어 가능한(defensible)’ 선택이었다. 그럼에도 절대값은 천차만별이었다. 더 어려운 질문들—한 영역의 활동이 다른 영역을 얼마나 예측하는지를 따지는 방향성 기능적 연결성, 두 뉴런이 우연 이상으로 함께 발화하는 정도를 보는 스파이크–스파이크 상호작용—에서는 답이 거의 동전 던지기처럼 모든 선택지에 고르게 흩어졌다. 더 불길한 것은, 이 결과가 2025년 베른슈타인 학회에서 열린 비슷한 해커톤을 거의 그대로 재현했다는 사실이다. 두 행사, 백 명이 넘는 연구자. 그럼에도 이 질문들에는 아직 합의가 없다.
흥미롭게도, 단 하나의 질문만은 깔끔하게 합의에 이르렀다. 신경 신호로부터 자극을 읽어 내는 ‘디코딩’ 정확도를 묻는 문제였다. 이유는 분명하다. 분류 정확도란 누가 계산해도 같은 방식으로 떨어지는, 잘 정의된 하나의 숫자이기 때문이다. 다시 말해, 불일치는 프로토콜의 일반적 잡음이 아니었다. 그것은 ‘개념’이 흐릿한 만큼 정확히 커졌다. 답이 하나의 명료한 숫자로 환원될 때 과학자들은 수렴했고, 답이 ‘리플이란 무엇인가’ 같은 정의의 문제일 때 산산이 흩어졌다.
사실 이 이야기는 새롭지 않다. 2020년, 로템 보트비닉-네저(Rotem Botvinik-Nezer)와 동료들은 《네이처》에 기념비적인 연구를 발표했다. 일흔 개 팀에게 똑같은 기능적 자기공명영상(fMRI) 데이터를 주고 분석을 맡겼더니, 단 두 팀도 같은 분석 절차를 밟지 않았고 결론은 사방으로 흩어졌다. 그 논문은 뇌영상 학계에 충격파를 던졌다. 그러나 전기생리학자들은 오랫동안 자신들만은 안전하다고 믿었다. 우리는 스파이크를 기록한다, 활동전위는 있거나 없거나 둘 중 하나인 이산적이고 셀 수 있는 사건이다, 혈류역학 반응을 모델링할 일도 영상 잡음과 씨름할 일도 없다—그렇게 ‘단단한 데이터’를 자부했다. 브레인핵의 결과는 바로 그 자부심을 겨눈다. 가장 단단한 데이터를 다룬다고 믿었던 분야에서조차, ‘무엇을 사실로 셀 것인가’를 묻는 순간 사실은 손가락 사이로 빠져나갔다.
Botvinik-Nezer, R., Holzmeister, F., Camerer, C. F., Dreber, A., Huber, J., Johannesson, M., … & Rieck, J. R. (2020). Variability in the analysis of a single neuroimaging dataset by many teams. Nature, 582(7810), 84-88.

그리고 바로 여기서, 이 문제가 내 분야이기도 한 빅데이터 시대 생물학 전체의 핵심으로 번진다. 우리는 데이터가 귀하고 측정이 병목이던 세계에서, 데이터가 넘쳐나고 ‘해석’이 병목인 세계로 건너왔다. 단일세포 RNA 시퀀싱에서 한 조직에 ‘세포 유형’이 몇 가지 있는지는 클러스터링 알고리즘과 해상도 변수에 달려 있다. 손잡이를 한 번 돌리면 여덟 가지가, 또 한 번 돌리면 스무 가지가 나온다. 커넥토믹스에서는 무엇을 하나의 ‘시냅스’로, 하나의 ‘연결’로 셀 것인가가 문제다. 초파리 행동 연구에서 자동 추적 소프트웨어는 객관성을 약속했지만, 모든 문턱값은 여전히 누군가의 선택이다. 하나의 데이터셋에 숨은 ‘답’의 개수는, 그 데이터를 가로지르는 방어 가능한 분석 경로의 개수와 같다. 통계학자 앤드루 겔먼이 ‘갈라지는 길들의 정원(garden of forking paths)’이라 부른 그것이다. 데이터가 많아질수록 갈림길도 많아진다. 빅데이터는 우리를 해석으로부터 구원하지 않았다. 오히려 해석이 끼어드는 지점을 폭증시키고, 그 지점들을 ‘객관적으로 보이는’ 코드 안에 감춰 버렸다.
이제 가장 불편한 대목으로 가자. 글쓴이들이 정확히 짚어 낸 것이기도 하다. 브레인핵의 연구자들에게는 어떤 이해관계도 없었다. 방어해야 할 가설도, 팔아야 할 서사도, 출판해야 할 논문도 없었다. 순수하게 사심 없는 분석이었다. 그런데도 결과는 혼돈이었다. 그렇다면 이 똑같은 분석의 자유를, 경력과 연구비와 정년 보장과 생존이 ‘새롭고 유의미하며 출판 가능한 결과’에 매달려 있는 현실의 과학 경제 속에 떨어뜨리면 어떻게 될까. 모든 갈림길은 ‘연구자의 자유도(researcher degree of freedom)’가 되고, 시스템은 p값이 0.05 아래로 떨어지는 길을 걸은 자에게 보상을 준다. 이것은 사기가 아니다. 어떤 데이터도 조작되지 않았다. 과학자는 학계가 정당하다고 인정하는 방법의 테두리 안에 끝까지 머무른다. 다만 분석이 대신 조작해 줄 뿐이다—조용히, 부인 가능하게, 점잖게. 데이터를 위조할 필요가 없다. 분석이 알아서 해 주니까.
나는 이 구조를 페이퍼밀과 약탈적 출판을 다루며 거듭 말해 왔다. 문제는 좀처럼 썩은 개인이 아니라, 부정한 선택을 가장 합리적인 선택으로 만들어 버리는 유인 구조라는 것. 연구자의 자유도는 과학자 개인의 도덕적 결함이 아니다. 그것은 그들을 고용한 시스템의 설계 결함이다.
물론 여기서 손쉬운 상대주의로 미끄러지고 싶은 유혹이 있다. 모든 결과는 결국 구성물일 뿐이니 각자의 진실을 고르라는 식의. 그것은 틀린 교훈이고, 이미 제조된 의심으로 흘러넘치는 시대에 위험하기까지 한 교훈이다. 옳은 교훈은 글쓴이들 자신이 제시한 원칙에 있다. 참된 발견이라면 임의의 선택을 견뎌 내야 한다. 어떤 결론이 문턱값을 표준편차 3에 두느냐 4에 두느냐에 따라 뒤집힌다면, 그 결론은 애초에 뇌에 관한 것이 아니며 당신만의 문턱값에 관한 것이었음이 분명하다. 방어 가능한 대안들을 가로질러도 흔들리지 않는 견고함(robustness), 그것이 빅데이터 시대에 ‘진짜 사실’이 갖춰야 할 새로운 서명이다. 과학은 여기서 객관성에 대한 권리를 잃는 것이 아니다. 객관성의 자리를 옮길 뿐이다—단 한 번의 측정에서, 합리적인 분석 전체의 공간을 가로지르는 답의 안정성으로. 글쓴이들이 시작한 콘2피스(CON²PHYS) 프로젝트가 겨냥하는 것이 바로 이 지점이다. 개념적 불확실성을 눈에 보이게 만드는 것. 공유된 출발점이 될 참조 분석 파이프라인, 어떤 라벨 아래 실제로 무엇이 계산되었는지를 기계가 읽을 수 있게 기록하는 표준, 그리고 손잡이를 돌릴 때마다 내 결과가 어떻게 움직이는지를 실시간으로 보여 주는 민감도 도구.
빅데이터의 세기에 생물학 앞에는 두 갈래 길이 놓여 있다. 한쪽 길에서 우리는 계산의 산출물을 신탁처럼 떠받든다. 정교한 파이프라인에서 나온 숫자이니, 객관적으로 보이니, 그저 믿고, 지나쳐 온 갈림길들은 조용히 묻는다. 그렇게 우리는 저마다 방어 가능하지만 한데 모으면 앞뒤가 맞지 않는 결과들의 도서관을 쌓아 올릴 것이다. 더 많이 출판하면서 더 적게 아는 과학을. 다른 쪽 길에서 우리는 모든 결과를 잠정적인 것으로 대한다. 그것을 낳은 임의의 선택에 무심하다는 것이 증명되기 전까지는. 우리의 갈림길을 보고하고, 우리의 변수를 공개하고, 지금 말하는 것이 뇌인지 아니면 그저 우리의 문턱값인지를 시험한다.
결국 데이터는 스스로 말하지 않는다. 한 번도 그런 적이 없었다. 다만 질문은 남는다. 데이터의 이름으로 말하는 것이 언제나 결국 ‘우리’라는 사실 앞에서, 우리는 정직할 수 있는가.
