오늘 아침에 올라온 Google AI에서 발표한 환자 데이터 생성 모델 EHR-Safe에 대한 논문을 훑어봤다.
https://ai.googleblog.com/2022/12/ehr-safe-generating-high-fidelity-and.html (블로그)
https://www.researchsquare.com/article/rs-2347130/v1 (논문 preprint)
1.환자 개인정보 보호
2.Encoder-Decoder와 GAN을 조합한 형태
3.충실도가 매우 높음
4.결측치도 실제와 가깝게 생성
5.추후 자연어 의무기록과 영상데이터도 생성하도록 발전시킬 예정(헐)

생성모델의 구조가 특징적인데, 의무기록 데이터는 sparse, heterogeneous하기 때문에 GAN으로 직접 생성하기가 너무 어려움. 그래서 encoder-decoder로 latent transformation을 시키고, GAN은 latent encoding에 대해서 adversarial loss로 학습시킴. 최종 생성은 Generator->Decoder 이렇게만 이용.
More from my site
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Leave a Comment