머신러닝 및 딥러닝
-
numpy의 rand와 randn의 차이머신러닝 및 딥러닝 2020. 8. 9. 22:54
numpy에서 항상 궁금했었던 것이 있다. import numpy as np A=np.random.rand B=np.random.randn 이 둘의 차이는 무엇일까?? randn Return a sample (or samples) from the “standard normal” distribution. 표준 정규 분포 ( N(0,1) 즉, 평균이 0이고 표준편차가 1인 분포) 에서 추출한 샘플을 리턴한다. 따라서 음수의 값이 나올 수 있다. rand Create an array of the given shape and populate it with random samples from a uniform distribution over [0, 1). 즉, 0은 들어가지만 1은 들어가지 않는 균등분포(각각..
-
시계열 데이터란?머신러닝 및 딥러닝 2020. 8. 8. 14:42
시계열이란 시계열에서의 샘플들은 x1,-----,xn 까지 있다고 할 때, 각 샘플들은 특정한 시간 t에서 측정한 데이터들이다. 예를 들어 x1은 1초에 생성된 정보, x2는 2초 때에 생성된 정보... 등으로 말이다. 관측치가 시간적 순서를 가진 데이터이다. 이 데이터는 변수간의 상관성이 존재하는 데이터를 다루며, i.i.d, 연속 하거나 불규칙적 데이터는 다루지 않는다. 시계열 데이터는 과거의 데이터를 통해서 현재의 움직임 그리고 미래를 예측하는데 사용된다. 일반적인 label 데이터는 input과 label 간의 상관관계를 다루는 반면에 시간에 따라 어떻게 움직이는 과거의 자료를 가지고 예측하게 된다. 대표적인 예시 추세: 경향성을 나타내는 말로서 세부적인 데이터는 다 빼고 계절성: 특정한 기간마다..