회귀 모형을 생성할 때 활용하는 데이터는 선형성, 독립성, 등분산성, 비상관성, 정상성의 가정을 만족해야 한다. 선형성, 독립성, 등분산성, 비상관성, 정상성.... 하나하나 의미를 알아보고 싶어서 찾아보니 계속 잔차라는게 등장한다. 오차와 비슷하게 생겨서 대충 의미는 알겠는데 오차와 차이가 있는지 궁금하게 되었다. [1] 오차 : 모집단에서 회귀식을 생성한 후 회귀식을 통해 얻은 예측값과 실제 관측값의 차이 [2] 잔차 : 표본집단에서 회귀식을 생성한 후 회귀식을 통해 얻은 예측값과 실제 관측값의 차이 -> 오차와 잔차는 회귀식을 모집단에서 생성하는지, 표본집단에서 생성하는지에 차이가 있음 - 2020년 12월 7일 간략한 개념 비교 공부 끝 -
나는 논문을 쓰면서 다중공선성이 있는 데이터를 사용했고, 상관관계가 서로 없는 독립변수만을 선택하기 위해 상호정보량 이론을 이용하여 문제를 해결한 적이 있다. 왜 그때 다중공선성을 측정하는 지표인 분산팽창지수를 몰랐을까! 아쉬울 따름이지만 이미 졸업~~~~~ 그래서 새롭게 안 사실인 다중공선성과 분산팽창지수를 정리하고 넘어갈까 한다 ---------------------------------------------------------------------------- - 다중공선성 : 독립변수들간의 상관관계가 높은 상태 - 다중공선성을 측정하는 지표 : 공차한계(Tolerance), VIF - 공차한계 : 1-Ri² - VIF : 1/(1-Ri²) , 공차 한계의 역수 * 단, Ri²은 i번째 독립변수를..
Python 등 언어를 사용하여 통계값들을 구할 때 그게 무슨 의미인지 배웠던 내용들을 까먹을 때가 있다^^ 이놈의 기억력............................. 글을 써서 내것을 만드는 것이 중요하다고 느꼈당 오늘은 일하다가 오차막대를 그려야했고, 오차막대를 그리려면 표준편차를 사용하겠지??????? 하고 바로 그리려 할 때...... 표준오차와 표준편차 등 오차에 사용할 수 있는 값들이 여러 개가 있음을 알게 되었다 표준오차와 표준편차 무엇이 달랐지? 히히 ^^ 또 까먹었당 예전에도 이 개념에 대해서 공부할 때 항상 헷갈렸던 것 같다 모집단과 표본집단에서 항상 헷갈림 ㅠㅠㅠㅠㅠㅠㅠ 간단하게 설명하자면 다음과 같다고 한다 표준편차는 모집단에 속한 개별 숫자들이 모평균과 차이나는 정도 표준오..
- Total
- Today
- Yesterday
- nosql
- 곱창맛집
- 사당역맛집
- rustwindow
- windowrust
- 빅데이터
- pandas데이터프레임
- rust설치하는방법
- rust스터디
- 막창
- rust설치
- 배치실패
- 사당맛집
- DB
- 데이터베이스
- python
- task실패
- 데이터프레임메모리
- pandas
- dag실패
- 맛집
- 대창
- rust설치방법
- task실행
- 파이썬
- 데이터프레임사이즈
- windows에서rust설치
- rust공부
- 데이터프레임용량
- 곱창
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |