머신러닝은 빅 데이터를 분석할 수 있는 강력한 툴이다.
기존 통계학 및 시각화 방법의 한계를 해결해준다.
머신러닝 : 명시적으로 프로그래밍을 하지 않고도 컴퓨터가 학습할 수 있는 능력을 갖게 하는 것
이전에 작은 데이터를 다룰 때는 명시적 프로그램이과 머신 러닝의 효율차이가 많이 나지 않는다. 하지만 빅 데이터와 같이 큰 데이터가 들어오게 되면 그 모든 데이터를 사람이 보고 케이스를 나누기 쉽지 않다. 그래서 이 데이터들을 분석할 수 있는 방법으로 머신 러닝이 뜨게 된 것이다.
그럼 이 머신러닝에 어떤 기법들이 있는 지 구분해 보도록 하겠다.
이 과목에서는 세 가지 방식중에서 지도학습 위주로 학습할 것이고 이 지도학습 안에서도 중요한 회귀분석과 분류에 대해 학습하겠다.
<지도학습 vs 비지도학습>
예측해야 할 결과에 대한 정답 데이터가 있다면 지도학습 모델, 없다면 비지도학습 모델이다.
그리고 추가로 강화학습은 데이터가 없어도 기계가 스스로 학습할 데이터를 만들고 그 데이터를 바탕으로 학습을 하게 된다. (ex. 최신의 알파고. 혼자 바둑두고 혼자 대국하고 그 결과를 바탕으로 분석 및 학습)
지금까지 머신러닝이 무엇인지 알아보았고 머신러닝의 기법들이 어떻게 구분되는지도 확인해 보았다.
다음은 이번 과목에서 배울 내용들이다.
밑의 그림을 보면서 얘기하자면, 먼저 데이터를 수집할 것이다. 그랬을 때 그 데이터에 대한 구조를 파악하고 어떠한 문제를 풀어야될지 생각하는 부분이 1) 데이터 이해이다.
그 이후에 데이터를 머신러닝에 사용하기 위해 처리하는 과정이 2) 데이터 처리이다.
마지막으로 실질적으로 우리가 사용할 3) 지도학습 모델이다.
'인공지능 공부' 카테고리의 다른 글
[2021 NIPA AI 교육 - 응용 / 머신러닝] 02 데이터 전 처리하기 (1) | 2021.08.20 |
---|---|
[2021 NIPA AI 교육 - 응용 / 머신러닝] 01 자료 형태의 이해 (2) | 2021.08.19 |
[2021 NIPA AI 교육 - 기본] 05 Matplotlib 데이터 시각화 (0) | 2021.08.11 |
[2021 NIPA AI 교육 - 기본] 04 데이터 조작 및 분석을 위한 Pandas 심화 (0) | 2021.08.09 |
[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본 (1) | 2021.08.06 |