목록전체 글 (768)
우노
들어가기 앞서, R 파일은 에디터(Rstudio, etc)를 사용해서 실행할 수도 있지만, 에디터가 아닌 Terminal Command Line 에서 실행해야하는 상황이 발생할 수도 있다. 이때, 아래와 같은 방법으로 Terminal Command Line 에서 R 파일을 실행할 수 있다. 1. 스크립트 상단에 Rscript 설정 추가 Test.R #!/usr/bin/env Rscript # 간단한 출력 코드 sayHello
Microbenchmarks 란? 작업에 대한 성능을 테스트하는 행위입니다. 보통 경과 시간, 작업 속도, 대역폭 또는 대기 시간과 같은, 간단하고 잘 정의된 양을 측정하는 데 사용됩니다. 참고 https://link.springer.com/referenceworkentry/10.1007%2F978-3-319-77525-8_111
들어가기 앞서, Stateful과 Stateless는, 클라이언트와 서버간의 네트워크 통신이 어떻게 이루어지는지에 대한 개념입니다. 세션 상태 및 세션 정보란? Stateful 과 Stateless 의 개념을 이해하기 위해선, 세션 상태와 세션 정보에 대한 개념을 알아야합니다. 세션 상태 클라이언트와 서버간 통신 인증이 된 상태를 의미합니다. 인증된 상태에서 데이터 송수신이 가능합니다. 세션 정보 한 세션 내에서, 클라이언트가 서버에 전송할 데이터 정보를 의미합니다. 서버는 세션 유지 시간이 지나거나, 클라이언트가 전송하려했던 데이터를 모두 수신할 때까지 클라이언트와의 세션 상태를 유지합니다. Stateful 세션이 종료될 때까지, 클라이언트의 세션 정보를 저장하는 방식입니다. 예제 온라인 뱅킹 은행(서..
DataFrame 행, 열 요소 접근 DataFrame 은 .loc() 또는 .iloc() 를 사용해 행, 열 요소에 접근할 수 있습니다. 예제 데이터 import pandas as pd # DataFrame 생성 data = [['Choi',22],['Kim',48],['Joo',32]] df = pd.DataFrame(data, columns=['Name','Age'], index=[4,5,6]) Name Age 4 Choi 22 5 Kim 48 6 Joo 32 loc 접근 - [ index 명, column 명] df.loc[ 5, 'Age' ] 48 iloc 접근 - [ 행 순서, 열 순서] df.iloc[1,1..
중복 행 제거 모든 열을 기준으로 중복되는 행 제거 df.drop_duplicates() 열 지정하여 중복 행 제거 지정된 열을 기준으로 중복되는 행 제거 df.drop_duplicates(['col1','col2']) 중복되는 데이터 중에서, 남길 대상 지정 # 첫 번째 데이터만 남기기 ex.drop_duplicates(['col1'], keep = 'first') # 마지막 데이터만 남기기 ex.drop_duplicates(['col1'], keep = 'last') # 모두 제거 ex.drop_duplicates(['col1'], keep = False) 참고 https://mizykk.tistory..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bBW05d/btrgB2hvUgo/zDUYVfJkKV9tcF0AgTzjkK/img.png)
Finding Similar Items 고차원의 데이터 공간(high-dimensional space)에서 가장 유사한 아이템(near-neighbors)을 찾는 작업은 중요한 작업들 중 하나이며, 많은 분야에서 사용되고 있습니다. 페이지에서 유사한 단어 찾기 유사한 상품을 구매한 사용자 유사한 Feature 를 가진 이미지 하지만, 아이템 간 유사도 계산 과정에서는 다양한 문제들이 발생할 수 있습니다. 각 아이템들의 Feature 표현 방식 각 아이템들의 Feature Vector Dimension 유사도 계산 시의 시간 복잡도 따라서, 해당 포스트에서는 여러개의 파일들(C1, C2, ..., Cn) 중 악성코드 파일을 찾는 작업이 주어졌을 때 해당 작업에서 발생할 수 있는 문제들과, 각각의 문제들을 ..
들어가기 전, 그 놈의 런타임..런타임..런타임.. 평소에 '런타임' 이라는 용어를 많이 사용하지만, 그 용어의 개념이 명확하지 않다. 위키백과에선 '런타임' 과 '런타임 환경' 을 분리해서 설명하는데, 우리가 평소에 사용하는 '런타임' 은 '런타임 환경' 을 의미하는 것 같다. https://ko.wikipedia.org/wiki/런타임 따라서, '런타임 환경' 에 대해서 다뤄보고자 한다. 런타임 환경이란? '런타임 환경' 은 프로그래밍 언어가 구동되는 환경이다. 예를 들어, JavaScript 가 Browser 에서 실행된다면 '런타임 환경' 은 Browser 가 되고 Node.js 에서..
진행 순서 Google 이미지 크롤링 라이브러리 설치 (수정 버전) 이미지 크롤링 코드 작성 및 실행 1. Google 이미지 크롤링 라이브러리 설치 (수정 버전) 기존 google_images_download 라이브러리 사용 시 에러가 발생해, 아래 Link 를 참고 https://stackoverflow.com/questions/60370799/google-image-download-with-python-cannot-download-images 설치 코드 pip install git+https://github.com/Joeclinton1/google-images-download.git 2. 이미지 크롤링 코드 작성 및 실행 Google Images Download Reference 의 Code Sam..
Dataset 에 Sklearn Scaler 적용 from sklearn.preprocessing import MinMaxScaler # MinMaxScaler 객체 생성 minmax_scaler = MinMaxScaler() # 훈련데이터의 모수 분포 저장 minmax_scaler.fit(X_train) # 훈련 데이터 스케일링 X_train_scaled = minmax_scaler.transform(X_train) Tensorflow Model 및 Sklearn Scaler 저장 Model 저장 # 모델 생성 및 훈련 model = create_model() model.fit(X_train_scaled, y_train, epochs=5) # 모델을 savedModel 포맷으로 저장 model.save..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/I0p6T/btreZ0LkbBH/XyBbi9ZIZGt7kt4ovOR9c0/img.png)
티처블 머신이란? 티처블 머신은 구글에서 제공하는 머신러닝 학습 도구이며, 누구나 머신러닝 모델을 쉽고 빠르게 만들 수 있도록 제작된, 웹 기반 도구입니다. 사용자들은 티처블 머신을 사용해 이미지, 사운드, 포즈를 학습할 수 있으며, 생성한 학습 모델을, 사이트, 앱 등 다양한 방법과 용도로 사용할 수 있습니다. 사용방법 1. 공식 홈페이지 접속 공식 홈페이지에 접속합니다. https://teachablemachine.withgoogle.com/ 사용방법 2. 프로젝트 시작 [시작하기] 를 클릭하여, 티처블 머신을 시작합니다. (로그인 없이도 사용 가능합니다.) 좌측 상단의 [햄버거 버튼] 클릭 후, [새 프로젝트] 를 클릭합니다. 티처블 머신 2.0 은 웹 기반으로 동작하기 때문에, 별도의 프로그램 설..