목록2020/11 (26)
우노
# 데이터 생성 x = np.array([1, 3, 5, 7]) y = np.array([ 6, 3, 9, 5 ]) # 산점도 그리기 plt.plot(x, y, 'o') # m = 기울기, b = 절편 m, b = np.polyfit(x, y, 1) # 직선 그리기 plt.plot(x, m*x + b)
AWS CLI (Command Line Interface) 란? AWS CLI (Command Line Interface) 는 terminal 환경에서 아마존 웹 서비스를 이용할 수 있도록 도와주는 기능입니다. ubuntu 에서 파일 복사, 폴더 생성, 이동, 삭제 등에 이용되는 ls, rm, cp 와 같은 기능을 제공합니다. 이를 이용하려면 먼저 AWS IAM 을 등록해야 합니다. AWS 계정 안에서 각 목적에 따라 이용하는 사용자 계정이라 생각하면 됩니다. IAM 사용자 생성 (액세스 키 발급) AWS CLI를 통해 AWS의 Service를 이용하기 위해선 AWS 계정의 액세스 키가 필요합니다. 순서 1) AWS console 상단의 Service 탭에서 IAM 서비스를 찾아 접속합니다. 2) 사용자..
Pandas를 사용할 때, 숫자가 지수표현식(과학적표기법)으로 나와서 불편할 때가 있습니다. 이럴 때는 Pandas display option을 바꿔주면 실수 표현이 가능합니다. import pandas as pd # 과학적 표기법 대신 소수점 5자리까지 나타낸다. pd.options.display.float_format = '{:.5f}'.format 다시 원래대로 옵션을 변경하고 싶을 때는 아래 명령어를 사용하면 됩니다. pd.reset_option('display.float_format')
Numpy를 사용할 때, 숫자가 지수표현식(과학적표기법)으로 나와서 불편할 때가 있습니다. 이 때, Numpy의 Precision을 사용하면 실수 표현이 가능합니다. import numpy as np # 과학적 표기법 대신 소수점 6자리까지 나타낸다. np.set_printoptions(precision=6, suppress=True)
비지도 학습 비지도 학습이란, 입력 데이터에 대한 출력 값(정답) 없이, 오직 입력 데이터만으로 학습을 진행한 뒤, 데이터로부터 유의미한 정보를 추출하는 머신러닝 기법입니다. 주요 기술 군집화(Clustering) 유사한 데이터들을 그룹화하는 작업 비정상 탐지(Anomaly detection) 예상치 못한 이벤트 또는 결과를 식별하는 작업 차원 축소(Dimension reduction) 고려해야하는 Feature 의 개수를 줄이는 작업 상관관계가 있는 여러 Feature 를 하나로 합치는 작업 K-Means Clustering K-Means Clustering 은 Clustering 기법 중 하나이며, K 는 데이터를 몇 개의 클러스터로 분할할지를 의미합니다. 알고리즘 순서 임의로 k 개의 중심점(cen..
라틴 하이퍼큐브 샘플링 (Latin Hypercube Sampling : LHS) 표본 추출(샘플링) 방법 중 하나로, 위 그림과 같이 데이터가 고르게 분포 되는 특징이 있습니다. python의 Latin Hyper Cube Sampling 라이브러리를 활용하면 고른 분포의 데이터셋을 생성해 줍니다. https://pythonhosted.org/pyDOE/randomized.html 특징 비교적 일관성 있게 샘플링 됩니다. 전반적으로 고른 분포의 표본을 추출하고자 할 때 사용합니다. 분포를 동일한 확률 구간으로 분할합니다. 예제 코드 pyDOE의 라틴 하이퍼 큐브 디자인은 다음과 같은 간단한 구문을 사용하여 만들 수 있습니다. lhs(n, [samples, criterion, iterations]) n ..