📌 R의 특징
- 대/소문자 구분
- 주석 ‘#’
- ;으로 명령문 마침 구분 (한 행에 여러 명령어 가능)
- 대괄호는 사용 불가능 (대괄호는 R에서 특수한 역할을 함)
📌 명령어 실행 방법
4가지 섹션 중 왼쪽 위에 생성되는 R페이지에 명령어를 입력하여 수행
한줄 단위로 실행 (ctrl + enter 혹은 Run버튼 클릭)
드래그 후 Run하여 여러 줄을 실행할 수도 있음
📌 변수 대입
R에서의 대입연산자 : <- 또는 =
실행시 Environment창에 변수 생성됨
a <- 4;
b <- a;
# 이때, a <-만 드래그하여 출력할 경우, +가 나와 입력을 기다림
# esc키를 눌러 입력을 종료할 수 있음
📌 Environment / Console 관리
Environment : 빗자루 모양을 눌러 초기화
Console : clear 입력하여 초기화
📌 출력
print(변수명) 혹은 변수명 작성
이때, 해당 변수가 Environment창에 존재해야 함
print(a);
a;
📌 파일 입출력
데이터 분석에서 csv파일이 일반적
csv 파일 : 메모장파일((,)로 구분)로, 엑셀로 열 수 있게 되어있음 (데이터 외의 폰트, 수식들은 모두 적용 X)
# --- 파일 입력 ---
write.csv(mtcars, 'C:/Temp/mtcars.csv', row.names = FALSE)
# mtcars에 담긴 데이터를 C:/Temp/ 폴더에 mtcars.csv라는 이름으로 저장
# 이때, 행의 일련번호는 쓰지 않음
⬇️ 생성된 파일 확인
# --- 파일 출력 ---
my_mtcars <- read.csv('C:/Temp/mtcars.csv', header = TRUE)
# mtcars에 C:/Temp/ 폴더의 mtcars.csv를 불러와 my_mtcars에 저장
# 이때, header가 있음을 명시
# 읽어온 데이터 확인
View(my_mtcars)
str(my_mtcars)
📌 다양한 R의 내장함수
다양한 내장함수가 존재하나, 필요에 따라 검색하여 사용
abs(-5)
trunc(5.086)
# 등 매우 다양한 내장함수 존재
📌 패키지 설치, 불러오기
R에는 다양한 package가 존재하며 이를 설치하고 불러와 활용할 줄 알아야 함
install.packages() : 패키지 다운로드
library() : 패키지 불러오기
install.packages('GGally')
# 설치 뿐만 아니라 불러와야 함
library(GGally)
이때, 파일 경로에 한글이 있을 경우 오류가 발생할 수 있음
📌 간단한 데이터 분석 실습 : 데이터 구조 파악
# --- 데이터 구조 파악 ---
mtcars # 자동차 데이터 (내장 기본 데이터)
View(mtcars) # 표 형태로 데이터 출력
str(mtcars) # 각 열에 대한 type, 열/행수, 초기 10개 데이터를 보여줌
# $ : 열 앞에 사용 (열이라는 의미) & mpg열과 cyl열의 상관관계 출력
cor(mtcars$mpg, mtcars$cyl, method = "pearson")
?cor.test() # 도움말 활용 -> 오른쪽 아래 help칸에서 확인 가능
# 상관계수의 유의성 검정(다양한 검정, 추출 방법 등 설정 가능)
cor.test(mtcars$mpg, mtcars$cyl, alternative = "two.sided", method = "pearson")
# pairs : 변수간의 상관관계를 한눈에 확인할 수 있음
pairs(mtcars)