INTRO 1. 회귀분석이란? 2. 단순회귀분석 3. 다중회귀분석(중회귀분석) 4. 다항회귀분석 회귀분석 방법 : summary - Residuals(잔차) - Coefficients(회귀계수) - 모델 적합도 : Multiple R-squared, Adjusted R-squared, F-statistic, p-value 단순회귀분석(Simple Regression Analysis) test_regression_1.R rm(list=ls()) setwd = "~/Rcoding" ## simple linear regression ## create vector (x1,y1) ,..., (xn,yn) set.seed(2) x = runif(10,0,11) y = 2 + 3*x + rnorm(10,0,0.2) ..
INTRO 회귀분석(Regression Analysis) 1. 회귀분석 종류 2. 단순회귀분석 / 다중회귀분석(중회귀분석) 3. 최적회귀방정식 선택 : 설명변수 선택 1. 회귀분석 종류 2. 단순회귀분석 / 다중회귀분석 회귀분석 : 하나 또는 그 이상의 변수들이 또 다른 변수에 미치는 영향에 대한 추론을 위한 통계기법 영향을 받는 변수를 종속변수(반응변수) y로 표기하며 영향을 주는 변수를 독립변수(설명변수) x, x1, x2 형태로 표기 단순선형회귀모형 : 1개의 독립변수와 1개의 종속변수로 이루어져 있으며 오차항을 포함하는 선형관계식으로 나타냄
INTRO 기술 통계(Descriptive Statistics) 기술 통계 구하기 data load summary : statistics mean(평균), median(중앙값), sd(표준편차), var(분산), quantile(백분위수), min(최솟값), max(최댓값) test_descriptive_statistics.R rm(list=ls()) setwd = "~/Rcoding" ## data load data(iris) head(iris,10) ## summary summary(iris) ## statistics$col-name mean(iris$Sepal.Length) median(iris$Sepal.Length) sd(iris$Sepal.Length) var(iris$Sepal.Length)..
INTRO 1. 데이터 탐색 2. 결측값 처리 : missing data handle 3. 이상치 탐색 : outlier detection 1. 데이터 탐색 : 데이터 기초 통계를 이용한 데이터 구조 파악 summary(statistics), cov(covariance, 공분산), cor(correlation, 상관관계) test_missingdata_outlier.R rm(list=ls()) setwd = "~/Rcoding" data(iris) head(iris) str(iris) ## basic statistics summary(iris) ## covariance cov(iris[,1:4]) ## correlation cor(iris[,1:4]) 출력결과 > source("~/Rcoding/test..
INTRO data.table Rstudio Console> install.packages("data.table") data.table 간결한 syntax로 grouping, ordering 등의 기능을 제공하는 data.frame의 확장 데이터 구조로 조작, 관리, 처리에 대해 알아보자 test_datatable.R rm(list=ls()) setwd = "~/Rcoding" library(data.table) DT = data.table(x=c('b','b','b','a','a'), v=rnorm(5)) print(DT) ## data.frame type data(cars) head(cars) ## data.table type CARS = data.table(cars) head(CARS) ## dat..
INTRO sqldf를 이용한 DB 조회 Rstudio Console> install.packages("sqldf") plyr을 이용한 데이터 처리 내장함수이며 데이터 분리, 결합 등 데이터 처리기능 제공 # 참고 : dplyr은 c++로 구현되어 속도가 빠르고 chaining(var >> calc1 >> calc2, 중간변수 없이 최종값 계산)을 사용할 수 있음. 설치 필요 Rstudio Console> install.packages("dplyr") sqldf test_sqldf.R rm(list=ls()) setwd = "~/Rcoding" ## sqldf library(sqldf) data(iris) sqldf("select * from iris") sqldf("select * from iris l..
코로나로 인한 자가격리 해제를 기점으로 5일차가 되었다. 자가격리 때 가장 힘들었던 부분은 집 밖으로 나갈 수 없다는 것이었다. 집에 있는 것을 좋아하는 편이지만 강제 집콕은 따분함의 연속이었다. 한참 독감으로 착각하며 연차를 내고 집에 있어서 사람들과의 접촉이 없었던 건 다행이라 할 수 있을 것 같다. 열이 가라앉고 쎈 기침이 잦아들고 나서야 찾은 동네 병원에서 신속항원검사를 통해 확진 판정되었을 때는 2~3일 정도 경과 된 것으로 생각된다. 나와 같이 검사를 받으려고 줄서 기다리는 사람이 40여명이었는데 2시간 넘게 기다리고 나서야 검사를 받았다. 막상 확진 판정으로 받고나니 이제부터 무얼해야할 지 멍해졌다. 갑자기 주어진 7일 휴가를 받아들이는 게 쉽지는 않았다. 뭐가 어찌되었든 자가격리 일상을 기..
INTRO reshape를 이용한 데이터 재정렬 Rstudio Console> install.packages("reshape") #참고 : reshape2는 reshape의 확장판 개념, 설치 오래걸림 Rstudio Console> install.packages("reshape2") reshape reshape 패키지는 melt, cast를 사용하여 데이터를 재구성하거나 밀집화된 데이터를 유연하게 생성해줌 melt 녹이다, cast 전 데이터 형태 추출 syntax : var = melt(data, id=) cast 굳히다, 원하는 형태로 데이터를 변형 syntax : var = melt(data, id=) a : 엑셀 피벗팅과 유사하게 자료 변환, 피벗테이블과는 다르게 구별된 순서가 부여됨 b : y축..
- Total
- Today
- Yesterday
- Templates
- Model
- Raspberry Pi
- COVID-19
- Python
- 코로나
- raspberrypi
- SSH
- 자가격리
- arduino
- DAQ
- r
- Django
- ERP
- Pandas
- git
- MacOS
- CSV
- Regression
- 라즈베리파이
- 코로나19
- github
- server
- 확진
- template
- pyserial
- analysis
- DS18B20
- sublime text
- vscode
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |