INTRO 1. 상관 분석(Correlation Analysis) - 피어슨 상관계수(Pearson Correlation Coefficient, PCC) - 스피어만 상관계수(Spearman's Rank Correlation Coefficient, SRCC) 2. 다차원 척도법(Multi-Dimensional Scailing, MDS) 3. 주성분 분석(Principal Component Analysis, PCA) 1. 상관 분석 - 스피어만 상관계수 피어슨의 상관계수는 두 변수 간의 선형관계의 크기를 측정하는 값으로 비선형적인 상관관계는 나타내지 못한다. 스피어만 상관계수는 두 변수 간의 비선형적인 관계도 나타낼 수 있는 값으로, 한 변수를 단조 증가 함수로 변환하여 다른 변수를 나타낼 수 있는 정도를..
INTRO 1. 상관분석(Correlation Analysis) - 피어슨 상관계수(Pearson Correlation Coefficient ,PCC) - 스피어만 상관계수(Spearman's Rank Correlation Coefficient, SRCC) 2. 다차원 척도법(Multi-Dimensional Scailing, MDS) 3. 주성분 분석(Principal Component Analysis, PCA) 1. 상관분석 데이터의 두 변수 간의 관계 분석으로 상관관계를 알아보기 위해 상관계수(Correlation Coefficient)를 이용한다. 등간척도 이상으로 측정되는 두 변수들 간의 상관관계를 측정하는데 쓰이는 피어슨 상관계수와 서열척도인 두 변수들의 상관관계를 측정하는데 쓰이는 스피어만 상..
INTRO 1. 후진 제거법(Backward Elimination) 2. 전진 선택법(Forward Selection) 3. 단계별 방법(Stepwise Method) # 참고 : 텍스트북 사진 찍고 텍스트 추출하기 구글킵(google keep) app 사용 - 추출을 원하는 텍스트를 포함하도록 사진을 찍는다. - google keep을 다운 받아 app을 시전한다. - 사진을 선택하고 사진 전체를 터치하면 우상단에 메뉴에서 "이미지에서 텍스트 가져오기"를 클릭 - "이미지에서 텍스트 가져오기"는 동기화 시간에 따라 짧은 시간이 필요하다. - 추출된 텍스트를 확인하여 구조를 분석하면 쉽게 텍스트(데이터)를 구조화 할 수 있다. 3. 단계별 방법 전진 선택법에 의해 변수를 추가하면서 그로인해 기인된 기존 ..
INTRO 1. 후진 제거법(Backward Elimination) 2. 전진 선택법(Forward Selection) 3. 단계별 방법(Stepwise Method) 2. 전진 선택법 절편만 있는 상수모형으로부터 시작해 중요하다고 생각되는 설명변수 중 모형에 추가했을 때 제곱합의 기준으로 가장 설명을 잘하는 변수를 고려하여 추가하고 그렇지 않은 경우 추가를 멈추는 방법 dataset MASS package hills data time을 종속변수로 forward selection test_forward_selection_step.R rm(list=ls()) setwd = "~/Rcoding" library(MASS) data(hills) head(hills) step_forward_model = step..
INTRO 1. 후진 제거법(Backward Elimination) # 참고 : 단계별 변수 선택 방법 자동으로 수행하기 2. 전진 선택법(Forward Selection) 3. 단계별 방법(Stepwise Method) 1. 후진 제거법 독립변수 후보 모두를 포함한 모형에서 출발해 제곱합의 기준으로 가장 적은 영향을 주는 변수부터 하나씩 제거하면서 더 이상 유의하지 않은 변수가 없을 때까지 설명변수들을 제거하고 모형을 선택하는 방법 dataset X1 X2 X3 X4 Y 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 5..
INTRO 1. 회귀분석이란? 2. 단순회귀분석 3. 다중회귀분석(중회귀분석) 4. 다항회귀분석 회귀분석 방법 : summary - Residuals(잔차) - Coefficients(회귀계수) - 모델 적합도 : Multiple R-squared, Adjusted R-squared, F-statistic, p-value 다항회귀분석(Polynomial Regression Analysis) dataset x y 1 5 2 3 3 2 4 3 5 4 6 6 7 10 8 12 9 18 1단계 Estimate regression model - df1 data plot으로 독립변수 x와 종속변수 y는 2차식의 형태를 나타낸다. - 선형 회귀 모델 진단 : 이미 결과는 알고 있지만 참고 test_regression..
일상에서 발생한 하나의 사건이 시공간을 뒤틀고 있음을 느낀다. 일단 사건이 발생했고 앞으로 어떻게 처리를 해야할 지 기다리고 있는 시공간 속에 나를 떠올린다. 정신을 차리고 가장 먼저 떠오른 순서대로 흐름을 이어간다. 내 상태를 빠르게 스캔하고 주변 환경 정보를 하나씩 담아가며 입체적으로 상황을 이해하는 중이다. 일정한 흐름에 따라 처리된 것이 어떤 순서를 가지고 나열되고 있지만 결과적으로 하나의 집합을 이루었을 때 상황이 상호관계를 가지고 정리가 되는 중이었다. 당시에 떨리는 마음을 추스릴 수가 없어서 무언가에 도움을 청하고 의지해야 했다. 막연하게 설명할 수 없는 상태를 혼자 받아들이는 게 힘들었다. 그렇게 다음의 시공간에 다다랐을 때 지난 시간을 더듬어 그 사건이 발생한 이유를 찾기 시작했다. 원인..
INTRO 1. 회귀분석이란? 2. 단순회귀분석 3. 다중회귀분석(중회귀분석) 4. 다항회귀분석 회귀분석 방법 : summary - Residuals(잔차) - Coefficients(회귀계수) - 모델 적합도 : Multiple R-squared, Adjusted R-squared, F-statistic, p-value 다중회귀분석(Multiple Regression Analysis) test_regression_2.R rm(list=ls()) setwd = "~/Rcoding" ## multiple linear regression set.seed(2) u = runif(10,0,11) v= runif(10,11,20) w = runif(10,1,30) y = 3 + 0.1*u + 3*v -3*w + ..
- Total
- Today
- Yesterday
- 코로나19
- Pandas
- CSV
- Model
- vscode
- 코로나
- Raspberry Pi
- Regression
- github
- DS18B20
- 라즈베리파이
- git
- analysis
- SSH
- 확진
- 자가격리
- r
- MacOS
- COVID-19
- Templates
- arduino
- Django
- sublime text
- Python
- template
- server
- DAQ
- ERP
- pyserial
- raspberrypi
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |