페이지 선택

의료 영상 분야의 MLOps

MedCAD 사례 연구

의료 영상 분야의 실제 MLOps 활용 사례인 이 글은 Scopic이 엔드투엔드 MLOps 인프라를 통해 MedCAD의 머신러닝 워크플로우를 어떻게 혁신했는지, 그리고 이를 통해 모델 반복 속도를 높이고 의료 규정 준수를 위한 완벽한 추적성을 구현했는지를 보여줍니다.

한눈에 보는 결과

MLOps 영향 

50-60% 더 빠른 배송

자동화된 재학습 및 검증 워크플로우를 통해

탑승까지 소요되는 시간(분)

재현 가능한 환경을 갖춘 신입 엔지니어 

완벽한 추적성

모든 모델을 해당 데이터 세트, 코드 및 구성에 정확하게 연결합니다. 

규제 준비 완료

의료 품질 보증 및 규정 준수를 위한 완벽한 감사 추적 기능을 제공합니다.

수행된 서비스

MLOps

인프라
개발

머신
학습 및 파이프라인
자동화

클라우드
아키텍처
(AWS)

문맥

의료 분야에서 AI의 확장

메드캐드 이 시스템은 DICOM 스캔에서 3D 뼈 구조를 자동으로 분할하는 의료 영상 솔루션을 제공합니다. 여러 머신 러닝 모델이 함께 작동하여 복잡한 의료 데이터에서 고품질 뼈 표면을 추출함으로써 더욱 빠르고 안정적인 정형외과 모델링을 가능하게 합니다.

당면 과제는 명확했습니다. 새로운 데이터 세트가 단계적으로 추가되고 레이블링 규칙이 시간이 지남에 따라 진화하면서 모델 버전 전반에 걸쳐 일관성, 품질 및 재현성을 유지하는 것이 점점 더 어려워졌습니다. 이는 프로젝트의 확장성을 위협하는 심각한 문제점을 야기했습니다. 

버전 관리 문제

버전 관리 문제

어떤 데이터셋이나 모델이 어떤 결과를 도출했는지 체계적으로 추적할 방법이 없어 디버깅과 감사 작업이 거의 불가능합니다.

긴 반복 주기

긴 반복 주기

고객 데이터 업데이트 후 매번 이루어지는 수동 재교육은 반복적인 단계를 수반하여 납기 시간을 크게 늘리고 팀 생산성을 저하시켰습니다.

추적성 제한적

추적성 제한적

규제 목적상 모델 성능이나 데이터 계보를 감사하는 것이 매우 어려워 잠재적인 규정 준수 위험이 발생했습니다.

잦은 데이터 업데이트

잦은 데이터 업데이트

새로운 CT 스캔과 업데이트된 주석으로 인해 명확한 버전 관리 없이는 모델을 지속적으로 재학습해야 했습니다.

MedCAD는 진화하는 데이터 세트를 처리하고, 완벽한 추적성을 유지하며, 개발 주기를 가속화하는 동시에 의료 산업 표준을 충족할 수 있는 체계적인 접근 방식이 필요했습니다. 이러한 이유로 MLOps는 의료 영상 분야에 이상적인 사례 연구가 되었습니다. 

솔루션

엔드투엔드 MLOps 프레임워크

Scopic은 데이터 수집부터 배포 및 모니터링에 이르기까지 머신러닝 모델의 전체 수명주기를 간소화하는 포괄적인 MLOps 시스템을 설계하고 구현했습니다. 이 프레임워크는 데이터 과학 워크플로에 엔지니어링 원칙을 도입했습니다. 

사용하는 방법은 다음과 같습니다 

재현 가능한 환경 관리
uv 패키지 관리자를 사용하여 모든 개발 및 교육 환경을 표준화하여 가볍고 재현 가능한 설정을 구축했습니다. 이를 통해 모든 엔지니어와 교육 노드에서 동일한 종속성 버전을 사용하게 되며, 이는 팀 전체의 일관된 결과를 얻는 데 매우 중요한 요소입니다. 
데이터 버전 관리
데이터 및 모델 관리를 Git 워크플로처럼 작동하도록 DVC(데이터 버전 관리)를 통합했습니다. 각 모델은 학습에 사용된 정확한 데이터셋, 코드 및 구성과 연결됩니다. DVC의 버전 추적 기능을 사용하여 이전 실험을 다시 실행할 수 있으며, 여러 모델을 사용하는 파이프라인을 통합된 워크플로로 관리할 수 있습니다.
자동화된 실험 추적
우리는 모든 학습 실행이 자동으로 매개변수(학습률, 데이터 증강), Git 커밋 ID, 데이터셋 버전 및 평가 지표를 기록하는 중앙 집중식 실험 추적 시스템을 구축했습니다. 각 실행은 새로운 모델의 성능을 이전 기준선과 비교하는 자동 보고서를 생성합니다.
클라우드 인프라 교육
실험 단계에서는 학습이 로컬에서 실행되고, 전체 모델 학습 시에는 AWS EC2 GPU 인스턴스로 확장됩니다. 모든 데이터와 모델은 S3에 저장되며, 중앙 집중식 접근을 위해 Git 원격 저장소를 사용합니다.
표준화된 워크플로
우리는 전체 워크플로우를 반복 가능한 6단계로 체계화했습니다. 새로운 DICOM 데이터셋을 수집하고 전처리를 적용하는 단계, 데이터 버전을 관리하고 DVC 레코드를 업데이트하는 단계, 고정된 구성을 통해 학습 환경을 재구성하는 단계, GPU 가속을 사용하여 모델을 학습하는 단계, 표준화된 지표를 사용하여 자동으로 평가하는 단계, 그리고 가장 성능이 뛰어난 모델만 프로덕션 환경에 배포하는 단계입니다.

기술 스택

이 시스템은 최신 MLOps 도구 및 인프라를 활용합니다.

환경 관리
재현 가능한 종속성을 위한 uv 패키지 관리자
데이터 버전 관리
데이터 및 모델 추적을 위한 데이터 버전 관리

실험
추적

메타데이터 및 메트릭을 위한 DVC 로그를 사용하는 MLFlow
클라우드 인프라
확장 가능한 학습을 ​​위한 AWS EC2 GPU 인스턴스
스토리지
중앙 집중식 아티팩트용 원격 제어 장치
파이프라인 오케스트레이션
엔드투엔드 워크플로 자동화를 위한 파이프라인 

효과가 있었던 이유

MLOps 성공 요인

솔루션의 성공은 다음에 기인할 수 있습니다. 세 가지 핵심 요소:
체크.svg
자동화 우선

교육 및 평가 과정 전반에 걸쳐 수동 작업을 없앴습니다.

체크.svg
재현성 설계

모든 결과는 버전 관리되는 구성 요소를 사용하여 재현할 수 있습니다.

체크.svg
실질적인 확장성

복잡성 없이 자동화와 투명성의 균형을 이룹니다.

변화된 워크플로

MLOps 전후

데이터 업데이트 후 수동 재학습
데이터셋이나 모델에 대한 명확한 버전 관리 체계가 없음

과거 결과를 재현하기 어렵습니다.

모델 계보에 대한 가시성이 제한적입니다.

자동화된 재학습 및 검증 워크플로
모든 모델과 데이터셋에 대한 완벽한 추적성 확보

어떤 역사적 실험이든 한 번의 명령으로 재현할 수 있습니다.

규정 준수를 위한 명확한 감사 추적 기록

의료 분야에서 MLOps의 미래

MedCAD의 성공은 의료 AI 프로젝트에 있어 MLOps 인프라의 중요성을 입증합니다. 머신러닝 워크플로우에 엔지니어링 원칙을 도입함으로써 개발팀은 수동 조정 작업보다는 모델 개선에 집중할 수 있습니다.  

이제 당신 차례입니다:

AI 프로젝트에 MLOps를 구현하세요 

의료 영상 분야의 MLOps 사례 연구는 Scopic이 맞춤형 MLOps 인프라를 통해 머신 러닝 워크플로우를 어떻게 혁신할 수 있는지 보여줍니다. 귀사에서 어떤 가능성을 실현할 수 있는지 알아보고 싶으시다면, 무료 상담 예약

자주 묻는 질문 

MLOps란 무엇인가요?
MLOps(머신러닝 운영)는 DevOps 원칙을 머신러닝에 적용하여 대규모 ML 모델 학습, 버전 관리, 배포 및 모니터링을 위한 체계적인 워크플로우를 구축합니다. 
의료 AI에서 MLOps가 중요한 이유는 무엇일까요?
의료 분야에서는 규정 준수를 위해 완벽한 추적성과 재현성이 필수적입니다. MLOps는 개발 속도를 높이는 동시에 이러한 기준을 충족하는 데 필요한 감사 추적 및 버전 관리 기능을 제공합니다.
MLOps 구현에는 얼마나 시간이 걸립니까?
프로젝트 복잡성에 따라 구현 일정은 달라지지만, 일반적으로 자동화된 워크플로가 수동 작업량을 줄여주기 시작하면서 팀은 몇 주 안에 효과를 볼 수 있습니다.