논문내용 |
본 본문에서는 변수 값이나 클래스 값이 일부 비어있는 불완전한 데이터에 적용할 수 있는 분류 알 고리즘을 소개한다. 이 알고리즘에서 가중치(weight) 값과 확률적인 기법을 사용해 데이터 확장기법 을 제안한다. 또한 휘셔(Fisher)의 식을 근거로 최적의 투사면(projection plane)을 고려해 새롭게 확 장된 분류기에 적용한다. 이를 위해 데이터 확장에 적용할 과정별 식들을 유도해 낸다. 제안한 알고리즘의 성능평가를 위해, 데이터에서 하나의 변수를 선택하고 이 변수가 미싱(missing) 하는 경우와 미싱하지 않는 경우의 비율을 달리하면서 다른 측정값들과 비교한다. 또한 객관적인 평 가를 위해 기계학습에서 널리 쓰이는 C4.5의 결과와도 비교해서 제안한 알고리즘이 우수함을 보인다. |