본문 바로가기
[수학]/R로 배우는 통계학

[R] R 기초 문법 : R 특징, 명령어 실행 방법, 변수 대입, 파일 입출력, 내장함수, 패키지

by seom-j 2023. 7. 12.

 

📌 R의 특징

  • 대/소문자 구분
  • 주석 ‘#’
  • ;으로 명령문 마침 구분 (한 행에 여러 명령어 가능)
  • 대괄호는 사용 불가능 (대괄호는 R에서 특수한 역할을 함)

 

 

📌 명령어 실행 방법

4가지 섹션 중 왼쪽 위에 생성되는 R페이지에 명령어를 입력하여 수행

한줄 단위로 실행 (ctrl + enter 혹은 Run버튼 클릭)

드래그 후 Run하여 여러 줄을 실행할 수도 있음

 

 

📌 변수 대입

R에서의 대입연산자 : <- 또는 =

실행시 Environment창에 변수 생성됨

a <- 4;
b <- a;
# 이때, a <-만 드래그하여 출력할 경우, +가 나와 입력을 기다림
# esc키를 눌러 입력을 종료할 수 있음

 

 

📌 Environment / Console 관리

Environment : 빗자루 모양을 눌러 초기화

Console : clear 입력하여 초기화

 

 

📌 출력

print(변수명) 혹은 변수명 작성

이때, 해당 변수가 Environment창에 존재해야 함

print(a);
a;

 

 

📌 파일 입출력

데이터 분석에서 csv파일이 일반적

csv 파일 : 메모장파일((,)로 구분)로, 엑셀로 열 수 있게 되어있음 (데이터 외의 폰트, 수식들은 모두 적용 X)

# --- 파일 입력 ---
write.csv(mtcars, 'C:/Temp/mtcars.csv', row.names = FALSE) 
# mtcars에 담긴 데이터를 C:/Temp/ 폴더에 mtcars.csv라는 이름으로 저장
# 이때, 행의 일련번호는 쓰지 않음

⬇️ 생성된 파일 확인 

 

# --- 파일 출력 ---
my_mtcars <- read.csv('C:/Temp/mtcars.csv', header = TRUE)
# mtcars에 C:/Temp/ 폴더의 mtcars.csv를 불러와 my_mtcars에 저장
# 이때, header가 있음을 명시

# 읽어온 데이터 확인
View(my_mtcars)
str(my_mtcars)

 

 

📌 다양한 R의 내장함수

다양한 내장함수가 존재하나, 필요에 따라 검색하여 사용

abs(-5)
trunc(5.086)
# 등 매우 다양한 내장함수 존재

 

 

📌 패키지 설치, 불러오기

R에는 다양한 package가 존재하며 이를 설치하고 불러와 활용할 줄 알아야 함

install.packages() : 패키지 다운로드

library() : 패키지 불러오기

install.packages('GGally')
# 설치 뿐만 아니라 불러와야 함
library(GGally)

이때, 파일 경로에 한글이 있을 경우 오류가 발생할 수 있음

 

 

📌 간단한 데이터 분석 실습 : 데이터 구조 파악

# --- 데이터 구조 파악 ---
mtcars # 자동차 데이터 (내장 기본 데이터)

View(mtcars) # 표 형태로 데이터 출력

str(mtcars) # 각 열에 대한 type, 열/행수, 초기 10개 데이터를 보여줌

# $ : 열 앞에 사용 (열이라는 의미) & mpg열과 cyl열의 상관관계 출력
cor(mtcars$mpg, mtcars$cyl, method = "pearson") 

?cor.test() # 도움말 활용 -> 오른쪽 아래 help칸에서 확인 가능

# 상관계수의 유의성 검정(다양한 검정, 추출 방법 등 설정 가능)
cor.test(mtcars$mpg, mtcars$cyl, alternative = "two.sided", method = "pearson") 

# pairs : 변수간의 상관관계를 한눈에 확인할 수 있음
pairs(mtcars)