빅데이터개론

Information

Lecture Schedule

강의 자료
Schedule Theory Practice File
1st week 3월 3일 과목소개 및 팀프로젝트 안내
  • 미리 설치해야하는 프로그램 있으면 과목 공지
  • Python 소개 & 설치
  • 아나콘다 소개 & 설치
  • Jupyter Notebook 소개
  • Google Colab 소개
  • Hello World
2nd week 3월 10일 빅데이터 개념 및 주요 응용 사례 소개1
  • Python 기본 프로그래밍
      - 변수, 함수, 반복문, 기본 함수들
      - http://www.cse.msu.edu/~ptan/dmbook/tutorials/tutorial1/tutorial1.html
3rd week 03월 17일 빅데이터 개념 및 주요 응용 사례 소개 2
  • Python Numpy & Pandas
    http://www.cse.msu.edu/~ptan.dmbook/tutorials/tutorial2/tutorial2.html
4th week 03월 24일 Machine Learning Intro. 1
  • 파이썬 라이브러리를 이용한 데이터 크롤링
  • - Yelp(정적방식)
  • - 다이닝코드(동적방식)
5th week 03월 31일 Machine Learning Intro. 2
  • API를 이용한 데이터 크롤링
    https://gunn.kim/post/2021-01-03-covid19-data-openapi
  • - 네이버 검색(쇼핑)
6th week 04월 07일 Machine Learning Algorithms 1
  • 1. Simple Linear Regression 실습
    - https://realpython.com/linear-regression-in-python
  • 2. Yelp Linear Regression 분석
    - https://medium.com/@a0981639183/use-a-multiple-linear-regression-model-to-investigate-what-factors-most-affect-a-restaurants-yelp-d00b8dd264f0
7th week 04월 14일 Machine Learning Algorithms 2
  • Decision Tree 실습
    - Yelp, 사기 데이터, 재미있는 데이터(찾아보기)
8th week 04월 21일 중간 고사
9th week 04월 28일 텀프로젝트 제안
10th week 05월 12일 Machine Learning Algorithms 3
  • 1. Clutering 실습
      - k-means
  • 2. Feature Extraction
11th week 05월 19일 Machine Learning Algorithms 4
  • 네이버에서 코로나 뉴스 텍스트 분석
      - 리뷰 데이터 WordCloud
      - 뉴스 텍스트의 Sentiment Analysis
12th week 05월 26일 Machine Lenaring Misc.
  • 1. SKT T map 목적지 데이터 수집
  • 2. 지도에 목적지 Mapping을 통해서 코로나 기간 동안의 사람들이 제일 많이 간 위치 지도로 확인
13th week 06월 02일 초청강연
    14th week 06월 09일 텀프로젝트 최종발표
      15th week 06월 16일 기말고사