Biomedical Engineering Scientist doctorbme

안녕하세요, @doctorbme 입니다. 오늘 살펴볼 연구는 수면제 처방(Sleep medication prescription) 과 임상적 의사결정(clinical decision making)에 대해서 어떠한 변수를 정의하고 활용하여, 실질적으로 처방이 어떻게 이루어지는가를 살펴보는 연구입니다.

논문 제목은 Predictive Modeling of Physician-Patient Dynamics That Influence Sleep Medication Prescriptions and Clinical Decision-Making와 같으며, Creative Commons 4.0 (CC-BY)가 걸려있어서 편하게 사용이 가능합니다.


Andrew L. Beam, Uri Kartoun, Jennifer K. Pai, Arnaub K. Chatterjee, Timothy P. Fitzgerald, Stanley Y. Shaw & Isaac S. Kohane, Predictive Modeling of Physician-Patient Dynamics That Influence Sleep Medication Prescriptions and Clinical Decision-Making, Scientific Reports volume 7, Article number: 42282 (2017)
doi:10.1038/srep42282


배경

이 논문에서는 의사-환자 역동(Physician-Patient dynamics)라는 다소 거창한 용어를 제시하고 있습니다. 어떠한 처방이 나가는 데에 의사의 성향과 환자의 성향이 같이 영향을 준다는 이야기이지요. 여기서 수면(sleep)을 선택한 이유는. 불면증(insomnia)과도 관련이 있고, 증상의 묘사가 적힌 임상 노트(clinicial note)를 통해 다양한 정보를 파악할 수 있으며, 불면증 자체도 간단하지는 않은 증상이자 질병이기 때문이라고 합니다.

이 연구에는 수면제로 좋은 효과를 보이지만 잠재적인 부작용을 나타낼 수 있는 졸피뎀(zolpidem)과, 항우울제에 속하지만 낮은 부작용으로 인해 (근거는 좀 더 빈약하지만) 수면 보조제로 쓰일 수 있는 트라조돈(trazodone)의 처방 패턴을 비교합니다. 이때 이러한 패턴은 1) 의사의 성향과 2) 환자의 에피소드적인 상황에 따라 변화할 수 있다고 합니다.


방법론

방법론은 크게 2가지를 사용합니다.
1) 통계적인 분포 (혹은 확률)을 구해 의사의 처방 성향을 구성
2) 자연어처리에서 쓰이는 Latent Dirichlet allocation(LDA)를 사용한 환자의 특성을 구성 (확률을 나타낸 변수)

위로 부터 도출한 2개 종류의 변수를 통해, Logistic Regression을 통해 zolpidem과 trazodone 중 어떤 약이 쓰일지에 대한 확률을 계산합니다.


데이터의 구성(Cohort selection)

1) Massachusetts General Hospital (MGH)나 Brigham and Women’s Hospital (BWH)에서 진료를 받은 314,292 명의 환자들기록을 바탕으로 제2형 당뇨를 진단 받았거나, 랩 데이터에서 hbA1C>6.5% 혹은 혈당이 200 mg/dl 인 환자를 골라냅니다.
2) 이 중 첫번째 수면제 처방이 존재하고, 이를 기준으로 12개월 이전까지 불면증으로 진단 받은 ICD-9 코드를 가지고 있는 환자나, 수면 장애를 가지고 있다고 임상 노트에 기록을 가지고 있는 환자를 골라냅니다.
3) 여기서 특이할만한 점은, 애초에 순수하게 수면장애만을 가진 환자를 골라내는 것이 아니라 당뇨와 관련된 환자를 포함시키는 것인데요, 이는 당뇨병 환자가 다른 여러 질병을 같이 가질 수 있고 따라서 풍부한 임상 노트를 가지고 있을 것으로 기대하며, 이에 따라 진료를 보는 의사들도 다양하게 분포될 것을 기대하기 때문입니다. 다시 말하자면, 너무 균일한 (homogeneous) 그룹은 오히려 쓸만한 변수를 도출하기 어렵다는 뜻으로 해석될 수 있습니다.
4) 따라서 504명의 임상 의사의 처방이 데이터셋에 포함됩니다.


논문의 그림1. 데이터셋(cohort)에 포함시키기 위한 (환자가 가져야할) 조건


의사의 처방 성향에 대한 변수 정의

이 연구에서 의사의 처방 성향에 대한 정의는 간단합니다.

i번째 의사에 대해서, 전체 수면제 처방 횟수(t+z) 에 대해, trazodone의 처방 횟수(t)의 비율을 구합니다. 이는 의사의 선호를 나타내며 p로 정의됩니다. 추후 Logistic Regression에서의 변수로 쓰입니다. 이 때 추가적으로 시간을 반영하여 특정 시점의 선호는, 과거의 선호만을 반영합니다.

논문의 그림3.
데이터셋에 포함된 의사들의 처방 선호를 나타냅니다. Trazodone만을 쓰는 의사들이 있어, 오른쪽 끝 부분에 peak가 하나 있습니다.


LDA를 통한 Topic modeling

환자의 증상을 기술하는 임상 노트에 관하여, LDA를 사용합니다. K=5 (토픽이 5개)일 때가 성능이 가장 좋았다고 하며, 그 중에서도 임상 노트를 통한 변수에서는 Topic 1만이 통계적으로 유의하게 관여하였습니다. 성능 평가를 할 때, Perplexity를 고려하지 않은 것은 의문입니다. 왠지 정답을 알고 평가한 느낌이 들기도 합니다.

논문의 표2.

여기서 Odds Ratio (승산비) 가 1 보다 크다는 의미는, 어떤 의사가 과거에 trazodone을 처방하는 (선호) 성향을 보였을 경우, 새로운 환자에 대해서 첫번째 수면제 처방을 trazodone으로 처방할 확률이 높다는 것을 의미합니다.


논문의 표2.

결국 trazodone이 처방될 확률은, 의사의 선호와 Topic 1에 의해 결정됩니다. (Topic 2~5까지는 유의하지 않다고 해석하여 제외됩니다.) 그러면 Topic 1이 무엇인지 한번 살펴보는 것이 필요합니다.

논문의 그림4. Topic 1에 대한 상위 20 여 개의 키워드를 나타냅니다.

이 Topic1의 구성 요소를 볼 때, 우울(depression)과 불안(anxiety)을 나타내는 토픽을 의미한다고 해석하고 있습니다. 즉, 의사들은 환자들이 우울이나 불안과 관련된 이야기를 풀어놓을 때 trazodone을 처방하는 확률을 증가시키는 영향을 미친다는 것입니다.


결론 및 제한점

  • 이 연구는 기존 통계적 변수가 자연어처리와 결합할 때, 어떻게 상보적으로 성능을 높이느냐를 보여줍니다. (Topic 1만을 변수로 쓰고, 의사 선호를 변수로 쓰지 않는 경우 AUC=0.54 정도 밖에 되지 않음을 지적합니다. 따라서 데이터는 상보적으로 사용되어야 합니다.) 하지만 LDA를 쓰지 않는 경우에도 AUC=0.764이기 때문에 K=5인 LDA의 AUC=0.769보다 성능 차이가 유의미하게 향상되는지 보기 어렵습니다.
  • 의사의 특성과 환자의 특성을 결합해서 보고자 하는 시도는 의미가 있습니다. 하지만 Topic 1이 너무 넓고 모호해서, 과연 환자의 특성을 세부적으로 구분하고 있는지는 사실 의문입니다.

하지만 그럼에도 불구하고, 의사의 특성을 정의하고, 환자의 특성을 정의한다음, 이를 연결해서 살펴보겠다는 관점은 앞으로도 시도되어야한다고 생각합니다. 의사의 특성이나 성향은 사실 연구에서 소외되는 측면이 있었기 때문에, 이를 제대로 정의하고 측정할 수 있는 연구는 인간으로서의 의사를 명확히 바라보는데에 도움을 줄 것이라 생각합니다.


투명배경.png

전문가들이 직접 쓰는 최초의 STEEM 의학 매거진

https://mediteam.us

아래 글들도 읽어보세요.
여행과 의학] 비행기를 타서 아프다면!? 환자인데 비행기에 타려면??
전문의 당뇨이야기] 안걸리면 이득! 당뇨에 걸리면 경제적으로 얼마나 손해인지 알려드립니다.
[의학] X-ray, CT, MRI, 초음파, 뭘 해야 할까? <영상 검사의 선택>
  • Tag
  • 0
  • 0
  • View@Mediteam.us 350
Prev Article : [연구윤리, 통계, Ethics] Don't worry, P-hacking (걱… Next Article : [BME, CS, radiology] 폐결절(pulmonary nodule)을 분류(c…
Comments :: Steem 에서 댓글 달기
Prev Article : [연구윤리, 통계, Ethics] Don't worry, P-hacking (걱… Next Article : [BME, CS, radiology] 폐결절(pulmonary nodule)을 분류(c…