반응형
머신러닝 응용 개발 : 과거 데이터로부터 패턴을 찾아내어 모델화한 후, 사용자 인터페이스 등을 추가한 application으로 만들어 실무에 사용하는 일련의 과정 (데이터 전처리 -> 모델링 -> 예측(적용))
(1) 데이터 전처리 단계 : 전처리는 데이터의 클린징, 변환, 필터링 등을 통해 원시 데이터를 구조화하여 훈련용으로 사용가능한 데이터셋(dataset)을 생성하는 작업
-
클린징(cleansing) : 원시 데이터의 결측값(빠진 값), 오류값 등을 제거 또는 수정
-
변환(transformation) : 범주형 데이터를 (ex.청소년이냐 성인이냐 노인이냐) 숫자로 바꾸거나, 데이터를 표준화하거나, 특이값을 수정/제거하거나 주소(지역명과 숫자)의 GPS값으로의 변환 등
-
필터링(filtering) : 모델의 성능을 저해하는 변수(ex. 다중공선성(multicollinerarity)(변수간의 상호관계성이 높은 것들)이 높은 변수를 제거.)를 제거. (ex. 위치 정보와 주변지역의 관광객수 정보로 호텔 객실 가격을 예측하는데 이 두개의 정보는 서로 중복되는 비슷한 변수여서 하나는 제거해야만 예측력이 올라감.)
(2) 모델링 단계 : 모델링은 알고리즘 선택, 훈련(fitting), 테스팅을 반복하면서 가장 성능이 좋은 모델을 생성하는 과정
(3) 예측 단계 : 예측은 실제 데이터를 모델에 적용하여 결과를 예측하는 과정.
-
데이터 투입 방식은 일괄처리(batch) 또는 단계별로 투입되는 스트리밍(streaming) 방식이 있다.
반응형
'인공지능 공부' 카테고리의 다른 글
[2021 NIPA AI 교육 - 기본] 04 데이터 조작 및 분석을 위한 Pandas 심화 (0) | 2021.08.09 |
---|---|
[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본 (1) | 2021.08.06 |
[2021 NIPA AI 교육 - 기본] 02 데이터 핸들링을 위한 라이브러리 NumPy (0) | 2021.08.05 |
[2021 NIPA AI 교육 - 기본] 01 파이썬의 여러가지 모듈과 패키지 (0) | 2021.08.04 |
2021 과학기술정보통신부 x 정보통신산업진흥원(nipa) 주관 AI 교육 (0) | 2021.08.04 |