D-과학 이야기

[R] 프로그래밍 데이터 변환 /파생변수 생성 within transform /데이터프레임 생성 본문

PROGRAMMING/R studio

[R] 프로그래밍 데이터 변환 /파생변수 생성 within transform /데이터프레임 생성

타민희 2020. 11. 27. 13:21

R 프로그래밍 데이터변환 변수생성 within transform

 

 

* 파생변수란, 기존의 변수를 더하거나 빼는 등 다양한 조건이나 함수를 활용하여 생성한 변수

 

1. transform 함수

 

 - 데이터프레임에 새로운 변수 추가

 - transform(데이터프레임명, 파생변수=생성식, 파생변수2=생성식2, ... )

   * 단, transform 함수만을 실행한다면, 기존 데이터프레임이 변경되지 않는다.

     기존 데이터 프레임에 파생변수를 추가하고자 한다면, newiris <- transform() 새 데이터 프레임을 지정해야함

 - (예) newiris <- transform(iris, new=add+etc)

 

transform 함수/ 파생변수/ R 프로그래밍

 

2. 데이터프레임명$변수명

 

 - $을 이용하면 데이터프레임의 변수를 명명할 수 있다.

 - 데이터프레임명$변수명 <- 추가하고자 하는 데이터 벡터

 - (예) iris$add<-1:150

 

R 프로그래밍 데이터프레임 변수 생성 $

 

3. 데이터프레임["변수명"]

 

 - 데이터프레임[""]을 이용하여 데이터프레임의 변수를 명명할 수 있다.

 - 데이터프레임["변수명"] <- 추가하고자 하는 데이터 벡터

 - (예) iris["etc"]<-151:300

 

데이터프레임 변수 생성, 추가 R 프로그래밍

 

 

 

- (예) iris["number"]<-ifelse(iris$add%%2==0,"짝수","홀수")

 

데이터프레임 변수 생성, 추가(함수) R 프로그래밍

 

4. within

 

 - 데이터프레임 또는 리스트 수정

 - within(데이터, 표현식)

 - (예) 

 ① 데이터프레임 만들기

name <-c("a","b","c","d","e")

age <-c(24,27,30,32,17)

df <-data.frame(name, age)

R 프로그래밍 데이터프레임 만들기

 

 ② within 함수로 새 변수 생성

df<- within(df, {
            type=character(0)   # 생략가능
            type[age<20] = "10대"
            type[age>=20 & age<30] = "20대"
            type[age>=30 & age<40] = "30대"
            type = factor(type, level = c("10대","20대","30대"))
            
})

 데이터 과학 R 프로그래밍 within 함수로 새로운 변수생성

 

 


▼ R 프로그래밍 제어문 반복문 while, for, repeat 함수 / 데이터 과학

 

[R] 제어문 2. 반복문 while, for, repeat 함수

1. while  - 반복 횟수 지정 없이 주어진 조건이 만족하는동안 계속해서 반복을 수행  - 변수 초기값 설정/ while(조건문) {실행문} * 단, 실행문은 주어진 조건문이 참일 경우에만 실행된다.  - (예) y

datasciencee.tistory.com

▼ R 프로그래밍 제어문 조건문 if else 함수 

 

[R] 제어문 1. 조건문 if/else 와 ifelse 함수

1. if/else  - 조건식을 기준으로 조건이 참/거짓일 때 처리 방식을 다르게 하려는 경우  - if(조건문) {실행문 또는 함수} / else if(조건문) {실행문 또는 함수} / else {실행문 또는 함수} * else if 와 els..

datasciencee.tistory.com

 

Comments