의학분야에서 통계를 통해 무언가를 밝혀내고자 한다면, 가장 먼저 해야할 일은 무엇일까?
당연히 통계에 사용할 데이터를 수집하는 것이다.
데이터를 얻기 위하여 새로운 연구집단을 모집하여 실험을 진행할 수도 있지만, 기존의 데이터들을 여기저기서 긁어모아 그룹을 지정하고 유의미한 결과를 끌어낼 수 도 있다.
그렇다면 연구를 시작하기위해 데이터를 수집하는 방법에는 어떤 것들이 있을까?
분류 방법에는 물론 여러가지가 있겠지만,
먼저 Experimental Study (실험적 연구) 와 Observational Study (관찰적 연구)로 구분해 볼 수 있다.
Experimental Study VS. Observational Study
1. Experimental Study는 말 그대로 데이터 수집을 위해 통제변인과 대조변인을 포함한 모든 그룹을 직접 설정하여 실험을 진행하는 것이다.
임상시험의 경우가 대표적인 Experimental Study라고 할 수 있다.
실험 대상을 정해 그룹을 편성한 후 다른 조건에 (임상실험의 경우라면 약물투여의 유무) 따른 결과를 모니터링 하는 것이다.
이 때 각 그룹의 실험 대상자들은 충분히 randomize 되어야 한다. 예를 들어 Drug 그룹에는 여자가 많고 Placebo 그룹에는 남자가 많다면 그룹설정이 randomize되지 않았고, 약물이 성별에 따라 영향이 다르다면 제대로 된 결과를 얻을 수 없다.
이런 식으로 Experimental Study를 진행하면 당연히 인과관계를 보여주는 결과를 얻을 수 있다.
하지만 비용과 시간이 많이들수밖에 없다. 신약개발시 임상시험은 13년 이상, 1조 이상의 돈이 들어간다.
2. Observational Study는 다소 저렴한 비용으로 쉽게 데이터를 얻을 수 있다.
Observational Study는 통제되지 않은 조건에서 일어난 사건을 관찰하여 분석하는 방법이다.
A -> B 이다라는 인과관계를 정확히 밝힐 수는 없고 A와 B가 관련이 있구나 정도만을 이야기 할 수 있다.
어떠한 조건들이 영향을 미쳤는지 정확히 알 수 없기에 연구를 디자인하고 조사할때 더 신중해야 하고 잘못된 결론을 내릴 수 도 있다.
그러나 보통 experimental study에 비해 비용이 적게들고 단순하기에 많은 수를 대상으로 조사할 수 있다.
그렇다면 Observational Study에는 구체적으로 어떤 방법들이 있을까?
Observational Study의 종류
1. Case report & Case series
Case report란 어떤 새로운 사건들이 발생할때 그 사건들에 대해 관찰한 내용을 작성한 것을 말한다.
예를 들어, Covid-19가 처음 발병하기 시작했을때 의사들은 코로나바이러스라는 사실은 알지 못해도, 내원하는 환자들을 진단하고 증상들에 대한 case report를 만들어낸다. 이 각각의 case report 자체는 어떠한 통계적인 연구내용도 포함하지 않는 정말 그냥 관찰한 내용에 관한 리포트에 해당한다.
이러한 Case report가 쌓이고 그중 공통된 사항들이 계속 관찰되면 이들을 모아서 Case Series 연구를 진행할 수 있다.
예를 들어, 1980년 초, 미국에서는 이전에 볼 수 없던 특이한 환자들이 나타나기 시작했다. 건강한 젊은 사람들이 자꾸 뭔가 비슷한 증상을 나타내는데 원인을 알 수 없었다. 의사들이 이러한 사례들을 모아서 case series들을 발표했고, 이 case series들이 모여서 그것이 에이즈라는 새로운 병이라는 것이 밝혀졌다.
Case series는 이런 식으로 비슷한 case report들의 공통점을 찾아 연구하는 방법이다.
따라서 Case series에도 본격적으로 통계가 들어간다고는 할 수 없다.
2. Case-Control Studies
결과들을 관찰하고 그 결과에 따라 집단을 분리해서 집단의 history를 역추적하는 연구이다.
어떤 질병
어떤 새로운 결과가 흔치않은 경우일 때 Case-Control Studies를 사용한다.
유명한 예로 탈리도마이드(Thalidomide) 사건이 있다.
탈리도마이드 사건이란?
1950년대 후반부터 1960년대까지 전 세계 46개국에서 기형아수가 기하급수적으로 증가하기 시작했다.
이 기형아들은 공통적인 특징을 나타냈는데, 정신적으로는 건강하면서 양 팔이 제대로 발달하지 않거나 아예 결손되는 현상을 보였다. 이 원인을 밝혀내기 위하여 진행한 연구가 대표적인 Case-Control Study라고 할 수 있다. 연구자들은 같은 증상을 보이는 아이의 부모를 대상으로 원인을 역추적하였고, 임신 초기에 탈리도마이드를 복용한 경우 아기가 기형을 가진다는 것을 밝혀낼 수 있었다.
3. Cross-Sectional Survey
특정 시간에 일시적으로 일어나는 조사를 말한다.
지하철역 입구에서 설문지 들고 답변해달라는것과 같다.
저렴한 비용으로 데이터를 수집할 수 있지만, 인과관계를 정확하게 밝힐 수는 없고 신뢰도가 낮다.
예를 들어 당뇨와 심장병의 연관관계를 알기 위하여 설문조사를 했다고 하자.
조사한 시점에 심장병이 있는지, 당뇨가 있는지 조사를 하였다면 심장병 환자들은 심장병이 없는 사람보다 당뇨를 많이 가지고 있다는 결과를 얻을수 있을것이다.
하지만 심장병이 당뇨를 일으킨건지, 당뇨가 심장병 확률을 높이는 것인지는 절대 알 수 없다.
결국 Case-sectional study로는 연관성만을 알 수 있다.
4. Cohort Study (코호트 연구)
특정 그룹을 추적해나가면서 연구하는 것을 말한다.
시작할때는 아무도 증상을 가지고 있지 않다. 시간이 지나면서 누가 발병하는지 관찰하는것.
Cohort Study의 좋은 예로 미국에서 진행하였던 Framingham Heart Study (프레이밍햄 심장 연구) 가 있다.
프레밍햄 연구는 1948년 미국의 프레밍햄이라는 마을의 5000명 이상의 주민들을 대상으로 시작된 연구이다. 마을 사람들을 대상으로 심혈관 질환을 가진 사람들이 어떠한 식습관과 생활패턴을 가지는지 꾸준히 조사를 하여 심혈관질환에 영향을 주는 요인들을 알아내기 위한 실험이다. 이 이외에도 대상자들이 복용하는 약, 운동강도 등 다양한 변인들을 장기적으로 추적하고 있다.
프레이밍햄 연구는 1976년에 첫 대상자의 자녀들과 배우자 5000명 이상을 새로 등록하였고,
2002년에 이들의 3세대 까지 또 등록하여 연구를 진행하고 있다.
Cohort Study의 단점은, 잘 발병하지 않는 질병의 경우 많은 숫자의 추적대상이 필요하다는 것이다. 예를들어 Framingham 마을에서 단지증의 원인 대해 cohort study를 할수는 없었을 것이다. 탈리도마이드는 당시 미국 FDA에서는 승인되지 못했고 미국에서는 단지증이 희귀한 질병이었다.
댓글