GaN (2) 썸네일형 리스트형 [ML/Tabular] CTGAN, Modeling Tabular Data using Conditional GAN Review NeurIPS 2019 에 발표된 "Modeling Tabular Data using Conditional GAN Review" 라는 논문에 대해 Review 를 하고자 한다. 해당 논문은 Discrete Column (범주형 데이터) 와 Continuous Column (연속형 데이터) 들이 섞여 있는 Tabular data 를 재현하는 데 존재하는 어려움과 이를 극복하는 방법에 대해 이야기 하고 있다. 본 논문에서 말하는 두 Columns 의 문제점은 다음과 같다. 1. Discrete Column (= Categorical Column) : 뷸균형한 데이터 분포 ex) 예방접종 유무를 나타내는 Column 의 경우에, Yes 는 10% 이고 No 는 90% 인 경우 2. Cotinuous Colum.. [ML/Tabular] GAIN: Missing Data Imputation using Generative Adversarial Nets (Missing Value Imputation) GAIN: Missing Data Imputation using Generative Adversarial Nets Generative Adversarial Imputation Nets (GAIN) Paper : http://proceedings.mlr.press/v80/yoon18a/yoon18a.pdf Code : https://github.com/jsyoon0823/GAIN Generative Adversarial Nets (GAN) 알고리즘을 이용하여 새롭게 고안한 MVI 방법으로 데이터가 없는 missing data 부분을 다시 생성하는 알고리즘 Missing data types missing data 는 3가지 타입으로 분류될 수 있다. missing completely at random (MC.. 이전 1 다음