3강 Classification in High Dimensional Data

교수자 : 한국방송통신대학교 정보통계학과 교수 이태림

저작권자 권리 보호 안내

  • 강의동영상의 저작권은 해당 교수자에게 있습니다. 불법 다운로드 및 배포를 하시면, 법적 처벌을 받으실 수 있습니다.

강의동영상

설명

  • 나무구조모형은 유전체자료의 모형화 방법으로 개체간의 관련성을 고려한 hidden structure를 찾아 이해하기 쉬운 나무 재질의 모형을 제시하여 비통계인이 이해하기 쉬운 방법이다.
  • 분류를 위한 나무모형은 1984년 Freedman에 의한 CART모형을 출발로 FACT, QUAID등이 발표되었다. 자료의 반응변수가 생존기간과 같은 연속형인 경우 STUDI를 이용하여 Survival Tree를 구하여 생존군을 군집화한 나무모형을 얻을 수 있다.
  • 나무구조 생존모형을 분석해나가는 과정과 그의 해석으로 나무모형을 구축하는 알고리즘의 변수 선별 기준 등을 설명한다.

과목소개

  • 건강빅데이터 시대의 후기 유전체 시대를 주도할 학문으로서 바이오정보학의 현황과 구체적인 유전체 연구 방법론을 소개한다.
  • 유의한 유전체 탐색을 위한 통계적 방법으로 군집분석과 분류모형, 연과성을 기초로한 Penalized logit model, SNS 분석방법인 Network Analysis를 유전체 자료에 적용한다.
  • 유의한 Biomarker를 찾는 FWER과 FDR 방법을 소개하고 유전자료를 이용한 예측과 예측모형의 평가 및 이를 이용한 치료 이해, 태아의 선천성기형이나 암을 조기진단하는 방법과 유전체 자료의 시각화 방법인 Matrix Visualization의 방법을 설명한다.

교수자소개

교수자 : 이태림

  • 서울대학교 간호학과 졸업
  • 서울대학교 보건대학원(보건통계학 석사)
  • 서울대학교 계산통계학과(이학사, 이학석사)
  • 중앙대학교 대학원 응용통계학과(통계학박사)
  • 미국 노스캐롤라이나대학교 Post Dr.
  • 현재: 한국방송통신대학교 정보통계학과 교수