빅데이터개론

Information

Lecture Schedule

강의 자료
Schedule Theory Practice File
1st week 3월 3일 과목소개 및 팀프로젝트 안내
  • <미리 설치해야하는 프로그램 있으면 과목 공지>
  • Python 소개 & 설치
  • 아나콘다 소개 & 설치
  • Jupyter Notebook 소개
  • Google Colab 소개
  • Hello World
2nd week 3월 10일 빅데이터 개념 및 주요 응용 사례 소개1
  • Python 기본 프로그래밍
      - 변수, 함수, 반복문, 기본 함수들
      - http://www.cse.msu.edu/~ptan/dmbook/tutorials/tutorial1/tutorial1.html
3rd week 03월 17일 빅데이터 개념 및 주요 응용 사례 소개 2
  • Python Numpy & Pandas
    http://www.cse.msu.edu/~ptan.dmbook/tutorials/tutorial2/tutorial2.html
4th week 03월 24일 Machine Learning Intro. 1
  • 파이썬 라이브러리를 이용한 데이터 크롤링
  • - Yelp(정적방식)
  • - 다이닝코드(동적방식)
5th week 03월 31일 Machine Learning Intro. 2
  • API를 이용한 데이터 크롤링
    https://gunn.kim/post/2021-01-03-covid19-data-openapi
  • - 네이버 검색(쇼핑)
6th week 04월 07일 Machine Learning Algorithms 1
  • 1. Simple Linear Regression 실습
    - https://realpython.com/linear-regression-in-python
  • 2. Yelp Linear Regression 분석
    - https://medium.com/@a0981639183/use-a-multiple-linear-regression-model-to-investigate-what-factors-most-affect-a-restaurants-yelp-d00b8dd264f0
7th week 04월 14일 Machine Learning Algorithms 2
  • Logistic Regression
8th week 04월 21일 중간 고사
9th week 04월 28일 텀프로젝트 제안
  • 슬라이드 5장 이상(한 팀당 5분 발표 + 5분 질의응답)
    - 문제 정의
    - 데이터셋 / 수집계획
    - 분석 방법(알고리즘)
    - 스케줄
    - 역할분담
10th week 05월 12일 Machine Learning Algorithms 3
  • 1. Decision Tree 실습
  • 2. 유용한 툴 소개
11th week 05월 19일 Machine Learning Algorithms 4
  • 네이버에서 코로나 뉴스 텍스트 분석
    - Decision Tree(Entropy), k-NN, Naive Bayes등
12th week 05월 26일
  • 1. k-NN, Naive Bayes 기본 실습(30분)
  • 2. 네이버에서 코로나 뉴스 텍스트 분석
    - 리뷰 데이터 WordCloud
    - 뉴스 텍스트의 Sentiment Analysis
13th week 06월 02일 텀프로젝트 수행 & 자유 질의응답
    14th week 06월 09일 텀프로젝트 최종발표(실시간)
      15th week 06월 16일 기말고사