Category Archives: 고급 R 활용

1강 R 데이터처리

 

학습개요

· 데이터분석을 하기 위한 기본 단계가 데이터 처리 과정이다.

· 데이터 처리과정은 실무에 있어서 많은 부분을 차지하고 있는 작업인 만큼 데이터 처리방법을 잘 알고 있어야 한다.

· 이 장에서는 R Studio를 소개하고, R에서 다양한 데이터 파일을 읽는 방법을 공부한다.

 

강사소개

강의자 : 김성수

· 서울대학교 자연과학대학 계산통계학과(이학사)

· 서울대학교 대학원 계산통계학과(이학석사,이학박사)

 

학습목표

R 및 R Studio를 활용할 수 있도록 한다.

텍스트파일을 읽을 수 있도록 한다.

엑셀파일을 읽을 수 있도록 한다.

DBMS 데이터를 읽을 수 있도록 한다.

통계패키지 데이터파일을 읽을 수 있도록 한다.

2강 R 데이터처리

 

학습개요

· 데이터분석을 하기 위한 기본 단계가 데이터 처리 과정이다. 데이터 처리과정은 실무에 있어서 많은 부분을 차지하고 있는 작업인 만큼 데이터 처리방법을 잘 알고 있어야 한다.

· 이 강의에서는 변수이름을 바꾸는 방법, 데이터를 선택하고, 변환하는 방법들을 공부하도록 한다.

· 데이터처리에 유용한 R 패키지 dplyr 기능도 소개하도록 한다.

 

강사소개

강의자 : 김성수

· 서울대학교 자연과학대학 계산통계학과(이학사)

· 서울대학교 대학원 계산통계학과(이학석사,이학박사)

 

학습목표

결측치를 정의하는 방법을 설명할 수 있다.

변수 값 라벨을 지정할 수 있다.

변수 값 변환방법을 이해할 수 있다.

조건에 맞는 데이터를 선택할 줄 안다.

dplyr 패키지를 활용할 수 있도록 한다.

3강 통계계산

 

학습개요

· 모의실험을 이해하고, 모의실험에 필요한 유한모집단에서의 복원 및 비복원 추출방법에 대해 학습한다.

· 난수발생과 분위수, 분포함수 및 확률밀도(질량)함수의 값을 일양분포, 정규분포 및 카이제곱분포에서 주어진 값에서 계산할 수 있도록 한다.

 

강사소개

강의자 : 심송용

· 서울대학교 자연과학대학 계산통계학과(이학사)

· 서울대학교 대학원 계산통계학과(이학석사,이학박사)

· Univ. of Wisconsin-Madison(Ph.D.-통계학과)

 

학습목표

모의실험을 이해할 수 있다.

일정한 유한 모집단에서 복원 및 비복원 추출을 할 수 있다.

일양분포에서 난수, 분위수, 분포함수, 확률밀도함수의 값을 계산할 수 있다.

정규분포에서 난수, 분위수, 분포함수, 확률밀도함수의 값을 계산할 수 있다.

카이제곱분포에서 난수, 분위수, 분포함수, 확률밀도함수의 값을 계산할 수 있다.