목록Language (122)
우노
R dataframe을 원하는 크기로 slice하는 방법 output
DataFrame에서 랜덤한 행을 추출하는 방법 원하는 개수 만큼 추출할 때 df.sample(n=5) 원하는 % 만큼 추출할 때 df.sample(frac=0.7) DataFrame의 전체 행을 랜덤하게 섞는 방법 frac을 사용해 전체 데이터를 shuffling 할 수 있다. frac=1을 사용해 모든 데이터를 shuffling 해 반환하고 reset_index를 사용해 기존의 index가 아닌 새로운 indexing을 가능케한다. df.sample(frac=1).reset_index(drop=True)
Python 코드에서 Shell 명령어를 실행하고 싶다면, 두 가지 모듈(os, subprocess)을 사용해 수행할 수 있다. os 모듈 사용 # 모듈 import import os # 쉘 명령어 실행 os.system("echo test")
파입 입력 추후 업데이트 파일 출력 write.csv() : 데이터프레임을 외부 csv 파일로 저장 write.csv(output$design, file="test.csv", row.names=FALSE) # row.names : 행 포함 여부
현재 작업 폴더 경로 확인 getwd() 작업 폴더 경로 변경 '₩' 또는 '' 는 모두 '/'로 바꿔줘야합니다. setwd("경로")
특정 평균 및 표준편차를 만족하는 정규분포 데이터 생성 import numpy as np # 평균:0, 표준편차:1, 생성데이터:실수값하나 np.random.normal(0,1) # 평균:0, 표준편차:1, 생성데이터:2x2행렬 np.random.normal(0,1,(2,2)) # 데이터 각 열에 평균과 표준편차를 다르게 적용할 경우 # 평균:5,15,5 표준편차:3,3,3 생성데이터:1000x3행렬 np.random.normal((5,15,15), (3,3,3), (1000,3)) 평균 0, 분산 1의 표쥰정규분포 데이터 생성 import numpy as np # 요소가 5개인 벡터 생성 np.random.randn(5) # 행렬 형태로 생성 np.random.randn(2, 3) 0 이상 1 미만의 ..
Matplotlib에서 그래프를 plot,scatter 등으로 표현 할 때, 파라미터를 통해 점의 색깔(color)를 지정할 수 있다. Color 종류 예제 코드 plot from matplotlib import pyplot as plt # x,y 축 데이터 years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3] # 표 내부 설정 plt.plot(years, gdp, color='darkmagenta', marker='o', linestyle='solid') # 표 외부 설정 plt.title("Nominal GDP..
Scala에는 고정길이 배열과 가변길이 배열이 있다. 고정길이 : Array 초기화 //배열의 크기가 10인 Int type Array 초기화 val a = new Array[Int](10) //값을 할당해 Array 초기화 val b = Array("hello","world"); 요소 접근 // a 배열의 0번째 index 접근 a(0) // b 배열의 1번째 index 접근 b(1) 요소 수정 // a 배열의 0번째 index 수정 a(0) = 1 // b 배열의 1번째 index 수정 b(1) = 2 가변길이 : ArrayBuffer 초기화 import scala.collection.mutable.ArrayBuffer val c = ArrayBuffer[Int]() 요소 접근 // a 배열의 0번째..
file read 시 head 제거 기존 데이터 # Undirected graph: ../../data/output/dblp.ungraph.txt # DBLP # Nodes: 317080 Edges: 1049866 # FromNodeId ToNodeId 0 1 0 2 ... read 시 head 제거 with open(inputfile,"r") as rf: # 첫 4줄(head) 제거 for i in range(4): next(rf) # head 이후부터 읽기 for i in rf: print(i) 0 1 0 2 ...
.values 또는 .to_numpy() 를 사용해 DataFrame을 numpy 배열 형식으로 변환할 수 있다. 예제 코드 import pandas as pd # DataFrame 생성 data = [['Choi',22],['Kim',48],['Joo',32]] df = pd.DataFrame(data, columns=['Name','Age']) # .values 또는 .to_numpy() 를 사용해 numpy 배열로 변환 print(df.values) print(df.to_numpy()) #[['Choi' 22] # ['Kim' 48] # ['Joo' 32]]