우노
[Python] Numpy 개념 및 배열 생성 방법 본문
Numpy란?
- Numpy는 다차원 배열을 쉽게 처리하고 효율적으로 사용할 수 있도록 지원하는 파이썬의 패키지입니다.
- Numpy는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공합니다.
- 데이터 분석을 할 때, Pandas와 함께 자주 사용하는 도구로 등장합니다.
왜 Numpy를 사용할까?
- 데이터란 이미지, 오디오, 텍스트, 숫자 등 다양한 형태와 크기로 존재합니다.
- 사람은 이런 데이터들을 가지고 이해하지만 컴퓨터는 0 또는 1만 이해합니다.
- 여기서 핵심은 데이터를 숫자의 배열로 볼 수 있습니다.
- 실제로 데이터 분석을 수행하기 위한 전제 조건은 컴퓨터가 이해할 수 있도록 데이터를 숫자 형식으로 변환하는 것입니다.
- 여기서 효율적으로 배열을 저장 및 조작할 수 있어야 하는데 이러한 요구사항으로 Numpy 패키지가 나오게 됩니다.
파이썬 List와 Numpy 비교
파이썬의 내장 기능인 List 또한 Numpy 배열과 동일한 기능을 제공할 수 있기 때문에 왜 Numpy를 사용해야 하는지 의문이 듭니다.
파이썬 List와 Numpy의 차이점은 다음과 같습니다.
Numpy의 배열은 생성 이후 크기를 변경할 수 없음.
- 만약 변경해야 하는 사항이 있을 시, 새로 생성해야 함
list와 다르게 Numpy 배열의 모든 값의 타입은 dtype으로 같음.
배열의 크기가 작으면 문제가 되지 않지만 Numpy 배열은 데이터의 크기가 커질수록 저장 및 가공을 하는데 효율성을 보장합니다.
- 즉, Numpy는 list보다 메모리 공간을 덜 차지합니다.
이러한 장점으로 파이썬의 Numpy 패키지는 Data Science에 핵심적인 도구로 인식이 되고 있습니다.
Python List 생성 및 append 예제
arr = [] arr.append([1, 2, 3]) arr.append([4, 5]) print(arr) # [[1, 2, 3], [4, 5]]
Numpy 1차원 배열 생성 및 append 예제
import numpy as np arr = np.array([1,2,3,4]) arr1 = np.array([]) # 1차원 배열로 추가된다. arr1 = np.append(arr1, np.array([1,2,3])) arr1 = np.append(arr1, np.array([4,5])) print(arr) # [1. 2. 3. 4.] print(arr1) # [1. 2. 3. 4. 5.]
Numpy 2차원 배열 생성 및 append 예제
'Language > Python' 카테고리의 다른 글
[Python] Numpy와 Pandas를 사용한 데이터셋 생성 (0) | 2020.07.25 |
---|---|
[Python] Pandas 개념 및 DataFrame 생성 방법 (1) | 2020.07.24 |
[Python] 주피터 노트북 단축키 정리 (0) | 2020.07.24 |
[Python] 라이브러리, 패키지, 모듈의 차이 (0) | 2020.07.09 |
[Python] Pandas read_csv(), to_csv() (0) | 2020.07.08 |
Comments