DataFrame 2

[2021 NIPA AI 교육 - 기본] 04 데이터 조작 및 분석을 위한 Pandas 심화

저번 시간에 이어 Pandas에 대해 더 깊게 배워보겠다. 먼저 DataFrame을 정렬하는 방법이다. 인덱스 값을 기준으로 정렬할 수도 있고, 컬럼 값을 기준으로 정렬할 수도 있다. 먼저 sort_index()라는 함수를 이용해 인덱스 값을 기준으로 정렬할 수 있다. axis가 0이면 행 인덱스를 기준으로 정렬된다. 오름차순이 디폴트 값이고 만약 내림차순으로 하고 싶다면 ascending = False 로 인자를 콤마찍고 추가해주면 된다. 이렇게 axis를 1로 하면 열 인덱스를 기준으로 정렬할 수 있다. 여기서는 ascending이 False이기 때문에 내림차순으로 된다. 이번에는 컬럼 값을 기준으로 정렬해보겠다. 이때는 사용하는 함수가 다르다. 위와 같이 sort_values()라는 함수를 이용해 ..

인공지능 공부 2021.08.09

[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본

Pandas란? : 구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬의 라이브러리다. Pandas는 대용량 데이터를 쉽게 처리할 수 있는 NumPy를 기반으로 설계되어있다. (엑셀과 비슷한 데이터 베이스 형태이다.) Pandas의 자료형중에 Series 데이터와 데이터 프레임을 살펴보고 이들을 어떤식으로 다뤄야하는지 알아보겠다. Series의 데이터 형태를 살펴보면 Series는 특수한 딕셔너리라고 생각하기 쉽다. Data와 Index를 가지고 있다. (각각의 Index안에 Data가 들어간다.) NumPy의 array가 보강된 형태로 Data가 Index를 가지고 있다고 생각하면 된다. 1. values(값)를 ndarray의 형태로 가지고 있다. (왼쪽 코드의 주석에서 0 1 2 3 은 인..

인공지능 공부 2021.08.06
반응형