[R기반 의학통계 및 머신러닝] 차원 축소 기법
·
Bio analysis/ML
1. 차원 축소의 개념1) 차원(Dimension)이란?- 데이터에서 변수(Feature, 속성)의 개수를 의미함- 예를 들어 키, 몸무게, 나이 -> 3차원 데이터 키, 몸무게, 나이, 혈압, 심박수 -> 5차원 데이터 즉, 변수가 많을수록 데이터의 차원이 증가하며, 분석을 위한 데이터가 고차원 공간(High-dimensional space)에 존재하게 됨 2) 차원 축소(Dimensionality Reduction)란?- 고차원 데이터를 저차원으로 변환하는 과정즉, 중요한 정보는 유지하면서 변수의 개수를 줄이는 방법사영(projection)이 차원 축소의 주요 개념 그럼, 어떻게 해야 원본 자료의 Feature를 잘 살리면서 적절하게 차원 축소를 진행할 수 있을까? 차원..
[ML] 선형회귀
·
Bio analysis/ML
머신러닝의 종류1. 회귀(regression): 회귀 분석은 종속변수(outcome)와 하나 이상의 독립변수(input) 사이의 관계를 모델링하는 방법2. 분류(classification): 데이터 포인트를 미리 정의된 여러 클래스(class) 중 하나로 할당하는 방법3. 군집화(clustering): 관찰된 데이터를 서로 유사한 특성을 가진 여러 그룹으로 나누는 방법 회귀(Regression)머신러닝에서 입력변수와 연속적인 출력 변수 간의 관계를 모델링하여 수치 예측을 수행하는 지도 학습 방법입력 데이터와 타겟 변수의 상관성을 학습하여 결과를 예측주어진 데이터의 오차를 최소화하는 최적의 함수를 찾아 예측 모델을 구축선형회귀, 다항회귀, 리지회귀, 라쏘회귀, 서포트벡터회귀 등의 다양한 알고리즘이 존재 ..