라이브러리 4

[2021 NIPA AI 교육 - 기본] 04 데이터 조작 및 분석을 위한 Pandas 심화

저번 시간에 이어 Pandas에 대해 더 깊게 배워보겠다. 먼저 DataFrame을 정렬하는 방법이다. 인덱스 값을 기준으로 정렬할 수도 있고, 컬럼 값을 기준으로 정렬할 수도 있다. 먼저 sort_index()라는 함수를 이용해 인덱스 값을 기준으로 정렬할 수 있다. axis가 0이면 행 인덱스를 기준으로 정렬된다. 오름차순이 디폴트 값이고 만약 내림차순으로 하고 싶다면 ascending = False 로 인자를 콤마찍고 추가해주면 된다. 이렇게 axis를 1로 하면 열 인덱스를 기준으로 정렬할 수 있다. 여기서는 ascending이 False이기 때문에 내림차순으로 된다. 이번에는 컬럼 값을 기준으로 정렬해보겠다. 이때는 사용하는 함수가 다르다. 위와 같이 sort_values()라는 함수를 이용해 ..

인공지능 공부 2021.08.09

[2021 NIPA AI 교육 - 기본] 03 데이터 조작 및 분석을 위한 Pandas 기본

Pandas란? : 구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬의 라이브러리다. Pandas는 대용량 데이터를 쉽게 처리할 수 있는 NumPy를 기반으로 설계되어있다. (엑셀과 비슷한 데이터 베이스 형태이다.) Pandas의 자료형중에 Series 데이터와 데이터 프레임을 살펴보고 이들을 어떤식으로 다뤄야하는지 알아보겠다. Series의 데이터 형태를 살펴보면 Series는 특수한 딕셔너리라고 생각하기 쉽다. Data와 Index를 가지고 있다. (각각의 Index안에 Data가 들어간다.) NumPy의 array가 보강된 형태로 Data가 Index를 가지고 있다고 생각하면 된다. 1. values(값)를 ndarray의 형태로 가지고 있다. (왼쪽 코드의 주석에서 0 1 2 3 은 인..

인공지능 공부 2021.08.06

[2021 NIPA AI 교육 - 기본] 02 데이터 핸들링을 위한 라이브러리 NumPy

NumPy : Numerical Python (수치적 파이썬) -> Python에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리 데이터의 대부분은 숫자 배열로 볼 수 있기 때문에 NumPy 라이브러리를 다룰 줄 알아야 많은 데이터를 쉽게 다룰 수 있다. NumPy는 반복문 없이 배열을 빠르게 처리할 수 있다. -> List에 비해 빠른 연산 지원, 메모리의 효율적 사용 그렇다면 List는 NumPy와 구체적으로 어떻게 다를까? 아래는 list 배열을 생성하고 출력한 코드이다. 그리고 아래는 NumPy 라이브러리를 사용해 numpy 배열을 생성하고 출력한 코드이다. (NumPy는 라이브러리이므로 import 키워드를 이용해 불러온다.) ndarray는 n차원의 배열을 의미한다. (n-dimens..

인공지능 공부 2021.08.05

dependencies 안전하게 추가하기(라이브러리 적용하는 법, 라이브러리 버전 확인하는 법)

지금까지는 라이브러리를 쓰기위해 dependencies에 코드를 추가할 때, build.gradle (:app)의 dependencies {}에 그냥 바로 집어넣었었다. 하지만 최근 더 안전하게 추가하며, 해당 라이브러리의 최신 버전 또한 쉽게 알 수 있는 방법을 알게 되어 이 글을 작성한다. 우선 File - Project Structure 로 들어간다. 그리고 Dependencies - app 으로 간 뒤 +버튼(Add Dependency)을 누른다. 그리고 밑에 사진과 같이 라이브러리를 검색하면 버전 목록과 함께 검색이 된다. 이제 OK를 누르면 Dependency가 추가된다.

반응형