INTRO 1999년 미국 회사의 CEO와 성과 자료 1. 표의 빈칸에 해당하는 기초 통계량을 구하시오. 2. profits에 따른 CEO의 salary에 대한 산점도를 그리고 상관계수를 구하시오. 3. profits에 따른 CEO의 salary에 대한 단순선형회귀식을 구하고 분석하시오. 4. profits과 age, sales에 따른 CEO의 salary의 회귀식을 구하고 분석하시오. 5. profit, age, sales, tenure, assets에 따른 CEO의 salary의 회귀식을 구하고 분석하시오. 6. 후진제거법으로 최적의 회귀식을 찾으시오. 단, salary를 종속변수로 한다. 7. 전진선택법으로 최적의 회귀식을 찾으시오. 단, salary를 종속변수로 한다. 8. 단계적방법으로 최적의 ..
시계열 자료 분석 [예제] 1947~1979년 영국 월별 폐질환 사망자에 관한 시계열 자료 test_time_series_analysis.R rm(list=ls()) ## Seasonal Factor ldeaths plot(ldeaths) 출력결과 > ## Seasonal Factor > ldeaths Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1974 3035 2552 2704 2554 2014 1655 1721 1524 1596 2074 2199 2512 1975 2933 2889 2938 2497 1870 1726 1607 1545 1396 1787 2076 2837 1976 2787 3891 3179 2011 1636 1580 1489 1300 1356 ..
INTRO 1. 정상성(Stationary) 2. 시계열 모델(Time-Series Model) 2.1. 자기회귀 모델(AR Model, Auto-Regressive Model) 2.2. 이동평균 모델(MA Model, Moving Average Model) 2.3. 자기회귀누적이동평균 모델(ARIMA Model, Auto-Regressive Intergrated Moving Average Model) 2.4. 분해 시계열 - 추세요인(Trend Factor) - 계절요인(Seasonal Factor) - 순환요인(Cyclical Factor) - 불규칙요인(Irregular Factor) 1. 정상성 시간의 흐름에 따라 관측된 데이터를 시계열 자료(Time-Series Data)라고 한다. 시계열 분석..
INTRO 1. 상관 분석(Correlation Analysis) - 피어슨 상관계수(Pearson Correlation Coefficient, PCC) - 스피어만 상관계수(Spearman's Rank Correlation Coefficient, SRCC) 2. 다차원 척도법(Multi-Dimensional Scailing, MDS) 3. 주성분 분석(Principal Component Analysis, PCA) 3. 주성분 분석 상관관계가 있는 고차원 자료를 자료의 변동을 최대한 보존하는 저차원 자료로 변환시키는 방법으로 자료의 차원을 축약시키는데 주로 사용한다. HTML 삽입 미리보기할 수 없는 소스 주성분들은 차원을 줄여 예측모델을 만들 때도 사용한다. 하래 그림과 같이 희생되는 정보가 가장 적은..
INTRO 1. 상관 분석(Correlation Analysis) - 피어슨 상관계수(Pearson Correlation Coefficient, PCC) - 스피어만 상관계수(Spearman's Rank Correlation Coefficient, SRCC) 2. 다차원 척도법(Multi-Dimensional Scailing, MDS) 3. 주성분 분석(Principal Component Analysis, PCA) 1. 상관 분석 - 스피어만 상관계수 피어슨의 상관계수는 두 변수 간의 선형관계의 크기를 측정하는 값으로 비선형적인 상관관계는 나타내지 못한다. 스피어만 상관계수는 두 변수 간의 비선형적인 관계도 나타낼 수 있는 값으로, 한 변수를 단조 증가 함수로 변환하여 다른 변수를 나타낼 수 있는 정도를..
INTRO 1. 후진 제거법(Backward Elimination) 2. 전진 선택법(Forward Selection) 3. 단계별 방법(Stepwise Method) 2. 전진 선택법 절편만 있는 상수모형으로부터 시작해 중요하다고 생각되는 설명변수 중 모형에 추가했을 때 제곱합의 기준으로 가장 설명을 잘하는 변수를 고려하여 추가하고 그렇지 않은 경우 추가를 멈추는 방법 dataset MASS package hills data time을 종속변수로 forward selection test_forward_selection_step.R rm(list=ls()) setwd = "~/Rcoding" library(MASS) data(hills) head(hills) step_forward_model = step..
INTRO 1. 후진 제거법(Backward Elimination) # 참고 : 단계별 변수 선택 방법 자동으로 수행하기 2. 전진 선택법(Forward Selection) 3. 단계별 방법(Stepwise Method) 1. 후진 제거법 독립변수 후보 모두를 포함한 모형에서 출발해 제곱합의 기준으로 가장 적은 영향을 주는 변수부터 하나씩 제거하면서 더 이상 유의하지 않은 변수가 없을 때까지 설명변수들을 제거하고 모형을 선택하는 방법 dataset X1 X2 X3 X4 Y 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 5..
INTRO 1. 회귀분석이란? 2. 단순회귀분석 3. 다중회귀분석(중회귀분석) 4. 다항회귀분석 회귀분석 방법 : summary - Residuals(잔차) - Coefficients(회귀계수) - 모델 적합도 : Multiple R-squared, Adjusted R-squared, F-statistic, p-value 다중회귀분석(Multiple Regression Analysis) test_regression_2.R rm(list=ls()) setwd = "~/Rcoding" ## multiple linear regression set.seed(2) u = runif(10,0,11) v= runif(10,11,20) w = runif(10,1,30) y = 3 + 0.1*u + 3*v -3*w + ..
- Total
- Today
- Yesterday
- 자가격리
- CSV
- Pandas
- raspberrypi
- Django
- server
- 라즈베리파이
- DAQ
- ERP
- Regression
- DS18B20
- pyserial
- r
- 코로나
- github
- Templates
- 코로나19
- git
- arduino
- sublime text
- Python
- vscode
- Raspberry Pi
- template
- MacOS
- analysis
- 확진
- SSH
- Model
- COVID-19
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |