목록Language/Python (76)
우노
특정 평균 및 표준편차를 만족하는 정규분포 데이터 생성 import numpy as np # 평균:0, 표준편차:1, 생성데이터:실수값하나 np.random.normal(0,1) # 평균:0, 표준편차:1, 생성데이터:2x2행렬 np.random.normal(0,1,(2,2)) # 데이터 각 열에 평균과 표준편차를 다르게 적용할 경우 # 평균:5,15,5 표준편차:3,3,3 생성데이터:1000x3행렬 np.random.normal((5,15,15), (3,3,3), (1000,3)) 평균 0, 분산 1의 표쥰정규분포 데이터 생성 import numpy as np # 요소가 5개인 벡터 생성 np.random.randn(5) # 행렬 형태로 생성 np.random.randn(2, 3) 0 이상 1 미만의 ..
Matplotlib에서 그래프를 plot,scatter 등으로 표현 할 때, 파라미터를 통해 점의 색깔(color)를 지정할 수 있다. Color 종류 예제 코드 plot from matplotlib import pyplot as plt # x,y 축 데이터 years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3] # 표 내부 설정 plt.plot(years, gdp, color='darkmagenta', marker='o', linestyle='solid') # 표 외부 설정 plt.title("Nominal GDP..
file read 시 head 제거 기존 데이터 # Undirected graph: ../../data/output/dblp.ungraph.txt # DBLP # Nodes: 317080 Edges: 1049866 # FromNodeId ToNodeId 0 1 0 2 ... read 시 head 제거 with open(inputfile,"r") as rf: # 첫 4줄(head) 제거 for i in range(4): next(rf) # head 이후부터 읽기 for i in rf: print(i) 0 1 0 2 ...
.values 또는 .to_numpy() 를 사용해 DataFrame을 numpy 배열 형식으로 변환할 수 있다. 예제 코드 import pandas as pd # DataFrame 생성 data = [['Choi',22],['Kim',48],['Joo',32]] df = pd.DataFrame(data, columns=['Name','Age']) # .values 또는 .to_numpy() 를 사용해 numpy 배열로 변환 print(df.values) print(df.to_numpy()) #[['Choi' 22] # ['Kim' 48] # ['Joo' 32]]
Numpy 1차원 배열 생성 및 append 예제 import numpy as np # 바로 생성하는 방법 arr = np.array([1,2,3,4]) # 요소를 추가하는 방법 arr1 = np.array([]) arr1 = np.append(arr1, np.array([1,2,3])) arr1 = np.append(arr1, np.array([4,5])) print(arr) # [1. 2. 3. 4.] print(arr1) # [1. 2. 3. 4. 5.] Numpy 2차원 배열 생성 및 append 예제 바로 생성하는 방법 import numpy as np arr = np.array([[1,2,3],[4,5,6]]) print(arr) #[[1 2 3] # [4 5 0]] 요소를 추가하는 방법 # ..
들어가기 앞서, DataFrame 의 index 가 순서대로 정렬 되어 있지 않다면, 아래와 같은 방법을 사용해, index 를 정렬 및 초기화할 수 있습니다. Index 정렬 존재하는 index 기준으로 데이터를 재정렬합니다. 기본 정렬 방식은 오름차순(ascending)이며, 내림차순으로 정렬하고 싶다면, ascending 옵션을 False 로 설정하면 됩니다. df = df.sort_index(ascending=False) Index 초기화 후 정렬 존재하는 index 를 모두 초기화한 뒤, 0 부터 재정렬합니다. df = df.reset_index(drop=True)
COO형식의 Custom Sparse Matrix 생성 코드 코드 import random import os # 생성하고자하는 Sparse matrix의 행,렬,density 입력 row = 10000 col = 10000 density = 0.05 nnz = int(row * col * density) # 결과 파일명 (M_행_열_density_nnz) file = "M_" + str(row) + "_" + str(col) + "_" + str(density) + "_" + str(nnz) # 행,열 중복 확인용 dic dic = {} with open(file,"w") as w: for i in range(nnz): # 행,열,값 난수 생성 row_idx = random.randrange(0,row)..
random 모듈이란? Python에서 난수(random number)를 구할 수 있는 모듈입니다. 일부 자주 사용할 것 같은 함수들만 소개하겠습니다. random 모듈은 import random 한 뒤, random.함수이름() 을 통해 random 모듈에 존재하는 함수들을 가져와 사용할 수 있습니다. import random random.random() (0.0
모듈 호출 import os 폴더 생성 os.mkdir("path") 파일명 변경 # 파일이 현재 디렉토리에 있을 경우 os.rename(file,newfile) # 파일이 다른 디렉토리에 있을 경우 os.rename('./dir/'+file, './dir/'+newfile)
시간 측정 코드 단위는 초 입니다. import time start = time.time() # 시작 시간 저장 # 작업 코드 print("time :", time.time() - start) # 현재시각 - 시작시간 = 실행 시간