본문 바로가기
IT교육

빅데이터 웹 데이터 분석 및 시각화 (하둡, 파이썬, 스파크, R) 강의

by 대소니 2018. 10. 17.

 

1. 과정목표

- Hadoop기반 빅데이터 플랫폼 구축과 데이터 처리,분석을 위한 Hadoop 에코시스템 학습부터

- 파이썬, Spark, R을 활용하여 데이터의 수집부터 처리, 분석, 시각화 실습까지 실무적 빅데이터 프로세스 기술 마스터

 


2. 학습대상

- 빅데이터에 관심이 있는 대학생 및 재직자

- 리눅스, 프로그래밍언어 등이 익숙하지 않아 빅데이터 진입 장벽을 느끼고 있는 분

- Hadoop을 활용한 빅데이터 분석 시스템 도입을 고려하고 있는 개발자

 


3. 학습목표

- 빅데이터 플랫폼 구축 및 운영법을 학습합니다.

- 파이썬을 이용하여 웹 스크래핑 및 OpenAPI를 통해 데이터를 수집합니다.

- Hadoop 에코시스템을 통해 빅데이터 처리 및 분석을 실습합니다.

- R을 통해 데이터를 분석 및 시각화를 학습하고 실습합니다.

 


4. 상세 커리큘럼


- 하둡시스템을 구축 및 운영하는데 필요한 기본적인 리눅스 명령어와 SSH, 쉘스크립트에 대해 학습하고, 하둡 시스템을 설치하는 과정을 쉘스크립트로 작성해봄으로써 하둡 기반 빅데이터 플랫폼 설치 과정을 마스터 합니다.

 



- 하둡 운영시 자주 사용되는 HDFS조작 명령어를 실습하고 맵리듀스의 동작원리를 이해합니다.

- 하이브 사용법을 알아보고 Hive Server2를 통한 JDBC연결을 실습합니다.




- 파이썬의 기초 문법을 리뷰하고 이를 활용한 웹 크롤러를 직접 구현합니다.

- 네이버 주식 페이지로부터 현재 주식의 가격과 종목게시판의 게시글을 수집, HDFS에 적재하는 실습을 진행합니다.

 


- 인메모리 고속 처리 프레임워크인 Spark의 구조에 대해 살펴보고,

- RDD베이스와 DataSet베이스 각각의 데이터 처리방법을 실습합니다.

- Spark mllib 라이브러리를 소개하고 TF-IDF를 통한 주요 단어 추출 실습을 진행합니다

  (3주차에 수집한 종목게시판의 게시글을 실습에 활용)

 


- 대표적인 머신러닝 알고리즘 소개 및 군집, 분석, 분류, 회귀 등 다양한 분석 기법을 학습합니다.

- R을 활용한 머신러닝 대표 알고리즘과 다양한 시각화라이브러리를 실습합니다.

   (3주차에 수집한 주가정보와 4주차에 추출된 대표키워드를 활용)

 

 

5. Class 모집 개요

     빅데이터 통합 마스터 Class-하둡부터 데이터시각화까지, 빅데이터의 모든 것

     – 정 원 : 10 명

     – 등록기간 : 현재 ~ 11/22일

     – 강의일정 : 11/24일(토)~12/22일(토), 매주 토요일 4시간 (5주)

     – 강의시작 : 11/24일(토), 오전11시~15시 (4시간)

     – 장 소 : 공공장소 센터 (역삼동 747-9, 수양빌딩 4층)


신청하기 => http://edu.gonggongplace.com/k-course/bigdataclass/

 

댓글0