2021 NIPA AI 교육 14

[2021 NIPA AI 교육 - 기본] 04 데이터 조작 및 분석을 위한 Pandas 심화

저번 시간에 이어 Pandas에 대해 더 깊게 배워보겠다. 먼저 DataFrame을 정렬하는 방법이다. 인덱스 값을 기준으로 정렬할 수도 있고, 컬럼 값을 기준으로 정렬할 수도 있다. 먼저 sort_index()라는 함수를 이용해 인덱스 값을 기준으로 정렬할 수 있다. axis가 0이면 행 인덱스를 기준으로 정렬된다. 오름차순이 디폴트 값이고 만약 내림차순으로 하고 싶다면 ascending = False 로 인자를 콤마찍고 추가해주면 된다. 이렇게 axis를 1로 하면 열 인덱스를 기준으로 정렬할 수 있다. 여기서는 ascending이 False이기 때문에 내림차순으로 된다. 이번에는 컬럼 값을 기준으로 정렬해보겠다. 이때는 사용하는 함수가 다르다. 위와 같이 sort_values()라는 함수를 이용해 ..

인공지능 공부 2021.08.09

[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본

Pandas란? : 구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬의 라이브러리다. Pandas는 대용량 데이터를 쉽게 처리할 수 있는 NumPy를 기반으로 설계되어있다. (엑셀과 비슷한 데이터 베이스 형태이다.) Pandas의 자료형중에 Series 데이터와 데이터 프레임을 살펴보고 이들을 어떤식으로 다뤄야하는지 알아보겠다. Series의 데이터 형태를 살펴보면 Series는 특수한 딕셔너리라고 생각하기 쉽다. Data와 Index를 가지고 있다. (각각의 Index안에 Data가 들어간다.) NumPy의 array가 보강된 형태로 Data가 Index를 가지고 있다고 생각하면 된다. 1. values(값)를 ndarray의 형태로 가지고 있다. (왼쪽 코드의 주석에서 0 1 2 3 은 인..

인공지능 공부 2021.08.06

[2021 NIPA AI 교육 - 기본] 02 데이터 핸들링을 위한 라이브러리 NumPy

NumPy : Numerical Python (수치적 파이썬) -> Python에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리 데이터의 대부분은 숫자 배열로 볼 수 있기 때문에 NumPy 라이브러리를 다룰 줄 알아야 많은 데이터를 쉽게 다룰 수 있다. NumPy는 반복문 없이 배열을 빠르게 처리할 수 있다. -> List에 비해 빠른 연산 지원, 메모리의 효율적 사용 그렇다면 List는 NumPy와 구체적으로 어떻게 다를까? 아래는 list 배열을 생성하고 출력한 코드이다. 그리고 아래는 NumPy 라이브러리를 사용해 numpy 배열을 생성하고 출력한 코드이다. (NumPy는 라이브러리이므로 import 키워드를 이용해 불러온다.) ndarray는 n차원의 배열을 의미한다. (n-dimens..

인공지능 공부 2021.08.05

[2021 NIPA AI 교육 - 기본] 01 파이썬의 여러가지 모듈과 패키지

레고를 조립하듯 누군가 만들어놓은 함수와 변수를 사용하면 매우 효율적으로 작업할 수 있다. 이 때 사용하는 레고 블록같은 개념을 ‘모듈’이라고 한다. 모듈 : 특정 목적을 가진 함수, 자료의 모임 또 다른 예를 들자면 라면 레시피를 모듈이라고 할 수 있다. 모듈은 import 키워드를 사용해 불러온다. 모듈을 사용하기 전에는 모듈 속의 사용하려는 함수와 변수의 사용법을 확인해야한다. 모듈을 사용할 때는 모듈이름 뒤에 (.)을 찍은 후 사용할 모듈 속 함수 또는 변수를 명시해 사용하면 된다. (이를 dot notation이라고 한다.) 예시) 만약 원하는 내용의 모듈이 없다면 직접 모듈을 만들 수도 있다. .py의 확장자명 파일(파이썬 파일)로 만든 후 다른 파일에서 앞서 만든 py파일을 import하면 ..

인공지능 공부 2021.08.04
반응형