AI 모든 의학 문제를 처리하는 GMAI가 나올 것 – 네이처 논문 2023.4 mahler83, 2023-04-142023-07-19 의학 분야 전반에 대한 작업을 처리할 수 있는 foundation model "Generalist Medical AI"가 나올 것이라는 네이처 perspective 논문 (2022/11/3) 그제 공개됐는데 투고 자체는 ChatGPT전에 이루어진 논문이네 https://www.nature.com/articles/s41586-023-05881-4 ChatGPT 언급이 된 걸 보니 리비전하면서 introduction이 좀 고쳐진 듯 기존에는 X-ray에 폐렴이다 아니다 레이블링해서 "폐렴을 X-ray를 진단하는 모델"을 만들었다면 앞으로는 task-specific model에서…
Generative AI 자연어 의무기록에 생성모델을 적용해 미래 건강 예측 mahler83, 2023-01-012023-01-02 의무기록은 자연어로 되어있어서 활용하기 어렵다 같은 소리를 하던 시절은 정말 저물어가는 것 같다. Foresight — Deep Generative Modelling of Patient Timelines using Electronic Health Recordshttps://arxiv.org/abs/2212.08072 환자의 의무기록 텍스트에서 의학 용어를 추출해서 timeline 형태로 만듦 (중간에 나이가 들면 나이 먹는 이벤트 삽입)이걸 GPTv2로 학습시켜 앞으로 어떤 이벤트들이 일어날지 예측 대단하다 싶은…
Machine Learning 트리기반 모델이 뉴럴넷보다 테이블형 데이터에서 성능이 좋은 이유 mahler83, 2022-12-312023-01-02 환자 데이터로 예측모델 만들어 분석하는 연구를 하면 대부분의 경우 Tree-based model (XGBoost, Random Forest, Gradient Boosting Tree, AdaBoost)들의 성능이 높게 나오는 것을 경험적으로 알고 있었는데, 왜 그런지 연구한 논문. 이런 건 나도 해볼 수 있었을텐데?싶음 https://arxiv.org/pdf/2207.08815.pdf 결론: Neural network는 smooth function을 fitting하는 경향이 있기 때문에 irregular function을 가지는 경우 약함…
Machine Learning python missForest imputation for mixed categorical and continuous features example mahler83, 2019-09-092019-09-09 R에서 연속형 변수와 범주형 변수가 섞여있어도 missForest imputation이 한 줄로 되는데, python에서는 은근 까다롭다. 일단 필요한 라이브러리 로드. missingpy 패키지를 이용 성별과 유전형이 category이다. 범주형인 컬럼의 번호를 리스트 형태로 전달해줘야 한다. R에서는 웬만하건 다 이름 index로도 되는데 왜 꼭 번호를… 내가 잘못한건지 모르겠는데, imputation이 끝나고 나면 dtype이 다 float64로 변환된다….