MEDI:GATE NEWS 웨어러블·에어러블·니어러블 수면 측정 기기 성능 어떻게 다를까
사진: 게티이미지뱅크 [메디게이트뉴스 박도영 기자] 현재 시판 중인 수면 측정 기기를 직접 비교한 결과 특정 항목이나 하위그룹에 따라 성능 차이가 큰 것으로 나타났다. 예를 들어 어떤 기기는 수면 단계를 정확하게 구분하지 못하거나, 어떤 기기는 특정 단계로만 편향돼 예측하는 등이다. 슬립테크 기업 에이슬립이 20~25일 브라질 리우데자네이루에서 열린 월드슬립 2023(World Sleep 2023)에서 3개 구연 발표와 7개 초록을 발표했다. 여기에는 국내외에서 판매 중인 수면 측정 기기(Consumer sleep trackers, CSTs) 11종의 정확도를 비교한 연구 결과와 가정용 코골이 진단 모델, 미국과 한국의 수면 현황과 기술 사용에 대한 인식 등에 대한 연구가 포함됐다. 슬립루틴, 최소한의 편향으로 정확하고 일관된 수면 측정값 제공 CST 비교 연구는 미국 스탠퍼드의과대학 수면센터장인 클리트 쿠시다 교수와 분당서울대병원 정신건강의학과 윤인영 교수, 이비인후과 김정훈 교수 등이 참여했다. CST는 수면다원검사(PSG)의 저렴한 대안으로 판매되는 제품으로, 각 제품의 성능에 대한 자료는 나와있으나 동일한 참가자를 대상으로 동일한 환경에서 수행했을 때 다양한 CST의 성능을 종합적으로 검증한 연구는 제한적이다. 연구팀은 PSG와의 비교를 통해 다양한 유형의 CST 정확도 검증에 나섰다. 연구팀은 국내 3차병원(분당서울대병원)과 1차 수면 전문 클리닉(클리오닉 라이크케어 클리닉)에서 참자가 75명을 모집했다. 연구팀은 시중에 판매 중인 웨어러블 기기 5종(▲구글 픽셀 워치 ▲갤럭시 워치 5 ▲핏빗 센스 2 ▲애플 워치 8 ▲오아링 3)과 니어러블 기기 3종(▲위딩스 수면 추적 매트 ▲구글 네스트 허브 2 ▲아마존 헤일로 라이즈), 에어러블 기기 3종(▲슬립루틴 ▲슬립스코어 ▲필로우) 등 CST 11종을 분석했다. 참가자는 무작위로 두 그룹으로 나뉘어 PSG를 받는 동안 11개 CST 중 8개를 동시에 착용했다. 서로 간섭을 일으킬 수 있는 CST는 동시에 착용하지 않았다. 연구팀은 각 CST 결과를 PSG 결과와 비교 분석했다. 그 결과 4단계(Wake, Light, Deep, REM)로 구분된 수면 단계 추정 성능에서 에어러블 슬립루틴(SleepRoutine)이 매크로 F1 점수 0.6863점으로 가장 높았고, 니어러블 아마존 헤일로 라이즈(Amazon Halo Rise)가 0.6242점으로 뒤를 이었다. 발표에 따르면 구글 픽셀 워치(Google Pixel Watch)와 같은 웨어러블은 전반적으로 성능이 고른 편으로, 부착식 센서로 성능의 편차가 크지 않은 것으로 추정됐다. 특히 깊은(deep) 단계 추정에서 우수한 성능을 보였다. 각성(wake) 단계 성능은 슬립루틴이 큰 차이로 앞섰다. 전반적으로 얕은(light) 단계로 많이 예측했고, 각성 단계 성능이 다른 단계보다 떨어지는 경향이 있었다. 다음으로 얕은 단계와 깊은 단계를 헷갈려 하는 경우가 많았다. 어떤 기기는 특정 단계로만 편향돼 예측하는 경향도 보였다. 수면 효율과 수면 지연 시간, REM 수면 지연 시간을 포함한 수면 측정 추정 성능의 경우 웨어러블 갤럭시 워치 5(Galaxy Watch 5)와 에어러블 슬립루틴이 더 적은 편향을 보였고, 슬립루틴과 웨어러블 오우라 링 3(Oura Ring 3)은 비례 편향이 없었다. 슬립루틴은 최소한의 편향으로 정확하고 일관된 수면 측정값을 제공했다. 성별과 체질량지수(BMI), 수면 효율을 기준으로 한 하위 그룹 분석에서 슬립루틴은 모든 하위 그룹에서 다른 기기보다 일관되게 우수한 성능을 보였다. 연구팀은