본문 바로가기

💻프로그래밍/R

R 기본 문법(1) 데이터 생성 및 확인 : c( ) / mode( ) / str( ) / length( ) /remove( ) / factor( ) / array( ) / [[ ]] / data.frame( )

반응형

01. 변수 선언 (벡터 만들기) : data <- c( )

#변수선언_기본 방식
data <- c(100)
data
[1] 100


#변수선언_num
data1 <- c(100, 200, 300)
data1
[1] 100 200


#변수선언_chr
data2 <- c("a", "b", "c")
data2
[1] "a", "b", "c"


#변수선언_잘못된 방법
data <- 100, 200, 300

 

 

02. 데이터 속성 및 길이 확인 :  mode(data) / str(data) / length(data

#데이터_속성_확인

data <- c(100, 200, 300)

mode(data)     #데이터의 유형 확인 mode()
[1] "numeric"  #숫자형

str(data)              #데이터의 유형과 값 확인 str()
num [1:3] 100 200 300  #숫자형, 해당 변수의 값

length(data)    #데이터의 길이 확인 length()
[1] 3           #벡터의 길이가 3이라는 의미

 

 

 

03. 데이터 세트 삭제 :  remove(data

data1 <- c("a", "b", "c")
data1
[1] "a", "b", "c"

remove(data1)   #data1 삭제
data1
Error: object 'data1' not found

 

 

 

04. 범주형 데이터 생성 :  sample <- factor(data, labels = c("범주1", "범주2")) 

data <- c(2,1,3,4)
data
[1] 2,1,3,4

aa <- factor(data, labels = c('a','b','c','d'))
aa
[1] b a c d
Levels : a b c d

 

 

 

05. 배열 생성 :  array(data, dim = c(행의 수, 열의 수, 차원 수)) 

y <- c(1, 2, 3, 4, 5, 6)
array(y, dim = c(2, 2, 3))  #y를 2*2행렬 3개로 만들기


, , 1           #1차원

     [,1] [,2]
[1,]    1    3
[2,]    2    4

, , 2            #2차원

     [,1] [,2]
[1,]    5    1
[2,]    6    2

, , 3            #3차원

     [,1] [,2]
[1,]    3    5
[2,]    4    6

 

 

 

06. 리스트 생성 : list() 

list1 <- list(c(1, 2, 3), "Hi")   #리스트에는 데이터 형식이 다른 데이터들이 한번에 들어갈 수 있음
list1

#실행 결과, [[1]]과 [[2]]가 함께 출력됨 (리스트에 포함된 값을 데이터 형태별로 구분해서 출력하기 때문)
#이 방법으로 리스트에 포함된 데이터들이 총 몇가지 데이터 형태로 형성되어있는지 파악할 수 있음
[[1]]
[1] 1 2 3

[[2]]
[1] "Hi"

---------------
str(list1)            #변수 속성 확인
List of 2             #'두가지 변수로 구성된 리스트'라는 의미
 $ : num [1:3] 1 2 3  #숫자형 데이터는 길이가 3이며 1,2,3의 값이 있다 
 $ : chr "Hi"         #문자형 데이터는 'Hi'로 구성되어 있다.

 

 

 

07. 인덱스 :  [[ ]] 

list1 <- list(c(1, 2, 3), "Hi")

list1
[[1]]
[1] 1 2 3

[[2]]
[1] "Hi"


#리스트의 값 중, 첫번째 변수 호출
list1[[1]]
[1] 1 2 3


#리스트의 값 중, 두번째 변수 호출
list1[[2]]
[1] "Hi"

 

 

 

08. 데이터 프레임 생성 :  data.frame(변수명1, 변수명2,...변수명n

ID <- c(1, 2, 3, 4)
AGE <- c(10, 20, 30, 40)
SEX <- c("F", "M", "F", "F")

dataframe <- data.frame(ID, AGE, SEX)
dataframe


  ID AGE SEX
1  1  10   F
2  2  20   M
3  3  30   F
4  4  40   F

#데이터 프레임의 속성 파악
str(dataframe)

'data.frame':	4 obs. of  3 variables:
 $ ID : num  1 2 3 4
 $ AGE: num  10 20 30 40
 $ SEX: chr  "F" "M" "F" "F"

 

반응형