목록Language/Python (76)
우노
Numpy를 사용해 2차원 데이터 배열 생성 import numpy as np # 먼저 arr를 np.empty를 통해 초기화합니다. arr = np.empty((0,3), int) # 배열을 추가합니다. # 추가하는 배열의 요소수는 초기화했던 길이와 동일해야합니다. # axis = 0은 행으로 추가한다는 뜻입니다. arr = np.append(arr, np.array([[1, 2, 3]]), axis=0) arr = np.append(arr, np.array([[4, 5, 0]]), axis=0) print(arr) #[[1 2 3] # [4 5 0]]Pandas를 사용해 Numpy 배열을 DateFrame 형식으로 변환 import pandas as pd df = pd.DataFrame(arr,col..

Pandas 란? Pandas는 파이썬에서 사용할 수 있는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있으며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구 입니다. Pandas 데이터구조 Pandas는 3종류(Series, DataFrame, Panel)의 데이터구조를 제공하며 주로 Series(1차원)와 Data Frame(2차원)이 사용합니다. DataFrame 구조 DataFrame은 위 그림과 같이 Row, Column, Series 들로 구성되어 있습니다. 여기서, Series는 각 Column에 있는 데이터들을 의미합니다. DataFrame 기본 형태 import pandas as pd df = pd.DataFrame(data, index, c..
Numpy란? Numpy는 다차원 배열을 쉽게 처리하고 효율적으로 사용할 수 있도록 지원하는 파이썬의 패키지입니다. Numpy는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공합니다. 데이터 분석을 할 때, Pandas와 함께 자주 사용하는 도구로 등장합니다. 왜 Numpy를 사용할까? 데이터란 이미지, 오디오, 텍스트, 숫자 등 다양한 형태와 크기로 존재합니다. 사람은 이런 데이터들을 가지고 이해하지만 컴퓨터는 0 또는 1만 이해합니다. 여기서 핵심은 데이터를 숫자의 배열로 볼 수 있습니다. 실제로 데이터 분석을 수행하기 위한 전제 조건은 컴퓨터가 이해할 수 있도록 데이터를 숫자 형식으로 변환하는 것입니다. 여기서 효율적으로 배열을 저장 및 조작할 수 있어야 하는데 이러한 요구사항으..
명령어 모드 (셀 선택 모드) 셀추가 위에 셀 추가 : a 아래에 셀 추가 : b 셀 삭제 dd 복사/ 잘라내기 잘라내기 : x 복사하기 : c 붙여넣기 : p 아래 셀과 합치기 Shift + m 셀 타입 변경 마크다운 : m 코드 : y 파일 저장 ctrl + s 또는 s 코드 편집 모드 enter 코드 입력 모드 실행 셀 실행 ctrl + enter 실행 후 다음 셀로 이동 shift + enter 실행 취소 ctrl + z 셀 다시 실행 ctrl + y 커서에서 셀 나누기 shift + ctrl + - 셀 선택 모드로 가기 esc 또는 ctrl + m 주석처리 ctrl + /
라이브러리 여러 모듈과 패키지를 묶어 라이브러리라고 한다. 패키지 특정 기능과 관련된 여러 모듈들을 하나의 상위 폴더에 넣어 놓은 것을 패키지라 한다. 패키지 안에 여러가지 폴더가 더 존재할 수 있다. 모듈 특정 기능들(함수, 변수, 클래스 등)이 구현되어있는 파일을 의미한다.
Pandas는, 읽고자 하는 파일을 Pandas.read_csv(파일경로명)에 넘겨주면, 해당 파일을 읽어 DataFrame으로 반환해준다. import pandas as pd f = pd.read_csv('./data/test.txt',delimiter = ' ') 또한, Pandas.to_csv(파일경로명)을 사용해 DataFrame을 CSV 파일로 저장할 수 있다. import pandas as pd f = pd.DataFrame(data) f.to_csv('./result.csv', index=False) # csv 저장시 index 제거