indexing 2

[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본

Pandas란? : 구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬의 라이브러리다. Pandas는 대용량 데이터를 쉽게 처리할 수 있는 NumPy를 기반으로 설계되어있다. (엑셀과 비슷한 데이터 베이스 형태이다.) Pandas의 자료형중에 Series 데이터와 데이터 프레임을 살펴보고 이들을 어떤식으로 다뤄야하는지 알아보겠다. Series의 데이터 형태를 살펴보면 Series는 특수한 딕셔너리라고 생각하기 쉽다. Data와 Index를 가지고 있다. (각각의 Index안에 Data가 들어간다.) NumPy의 array가 보강된 형태로 Data가 Index를 가지고 있다고 생각하면 된다. 1. values(값)를 ndarray의 형태로 가지고 있다. (왼쪽 코드의 주석에서 0 1 2 3 은 인..

인공지능 공부 2021.08.06

[2021 NIPA AI 교육 - 기본] 02 데이터 핸들링을 위한 라이브러리 NumPy

NumPy : Numerical Python (수치적 파이썬) -> Python에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리 데이터의 대부분은 숫자 배열로 볼 수 있기 때문에 NumPy 라이브러리를 다룰 줄 알아야 많은 데이터를 쉽게 다룰 수 있다. NumPy는 반복문 없이 배열을 빠르게 처리할 수 있다. -> List에 비해 빠른 연산 지원, 메모리의 효율적 사용 그렇다면 List는 NumPy와 구체적으로 어떻게 다를까? 아래는 list 배열을 생성하고 출력한 코드이다. 그리고 아래는 NumPy 라이브러리를 사용해 numpy 배열을 생성하고 출력한 코드이다. (NumPy는 라이브러리이므로 import 키워드를 이용해 불러온다.) ndarray는 n차원의 배열을 의미한다. (n-dimens..

인공지능 공부 2021.08.05
반응형