인공지능/머신러닝3 [Pandas] Shape of passed values is (598, 2795), indices imply (598, 2877) error SimpleImputer를 이용해서 데이터를 보간 후 데이터 프레임으로 만드는 과정에서 에러가 발생했다. train_x 의 shape은 (598, 2877) 인데 SimpleImputer로 보간 후에 나온 데이터의 shape은 (598,2795)이다. 컬럼 82개는 어디로 간것일까? https://stackoverflow.com/questions/62198172/im-getting-this-error-shape-of-passed-values-is-55-93315-indices-imply-6 I'm getting this error: "Shape of passed values is (55, 93315), indices imply (68, 93315)" when applying the Imputer Here.. 2023. 2. 8. 파라미터와 하이퍼파라미터 (train 하는가? 안하는가?) 파라미터는 train을 통해서 조절되는 값이다. $$ y = f(x; \theta) $$ 위의 식은 입력값 x가 주어졌을 때 출력 값 y를 잘 매핑하는 최적의 파라미터 θ 를 찾는 parametric function이다. 최적의 파라미터 θ를 찾기 위해서는 학습을 통해서 y를 잘 매핑할 때 까지 계속 반복해서 찾는다. 모델이 학습해야 하는 것이 명확하게 정해져 있어 (위의 식에서는 theta) 속도가 빠르고 모델을 이해하기 쉽다. 하이퍼 파라미터란 최적의 모델을 구현하기 위해 모델에 설정하는 변수이다. 하이퍼 파라미터는 train을 하지않고 user가 값을 직접 세팅해서 모델링을 하는 것이다. 하이퍼파라미터를 통해 모델의 파라미터를 추정하는데 도움이 될 수 있는 프로세스에서 사용된다. 그리고 오버피팅을 .. 2023. 1. 19. Generative learning algorithms Discriminative VS Generative Discriminative learing algorithms은 입력 데이터 x가 주어졌을 때, 정답 레이블 y를 예측할 수 있도록 학습하는 알고리즘이다. 예시로 logistic regression이 있으며, 수식은 다음과 같이 표현한다. $$ p(y|x; \theta) $$ Generative learing algorithms은 정답 레이블 y가 주어졌을 때, 입력 데이터 x들이 어떤 특징을 가지는 지 학습하는 알고리즘이다. 수식은 다음과 아래와 같이 표현한다. $$ p(x|y) $$ $$ p(y|x) $$ 를 Bayes rule을 이용해서 아래와 같이 풀어서 $$ p(x|y)p(y) $$를 구할 수 있다. $$ p(y|x) = \frac{p(x|y)p.. 2023. 1. 19. 이전 1 다음