강의 자료
Schedule |
Theory |
Practice |
File |
1st week 3월 3일 |
과목소개 및 팀프로젝트 안내 |
- <미리 설치해야하는 프로그램 있으면 과목 공지>
- Python 소개 & 설치
- 아나콘다 소개 & 설치
- Jupyter Notebook 소개
- Google Colab 소개
- Hello World
|
|
2nd week 3월 10일 |
빅데이터 개념 및 주요 응용 사례 소개1 |
- Python 기본 프로그래밍
- 변수, 함수, 반복문, 기본 함수들
- http://www.cse.msu.edu/~ptan/dmbook/tutorials/tutorial1/tutorial1.html
|
|
3rd week 03월 17일 |
빅데이터 개념 및 주요 응용 사례 소개 2 |
- Python Numpy & Pandas
http://www.cse.msu.edu/~ptan.dmbook/tutorials/tutorial2/tutorial2.html
|
|
4th week 03월 24일 |
Machine Learning Intro. 1
|
- 파이썬 라이브러리를 이용한 데이터 크롤링
- - Yelp(정적방식)
- - 다이닝코드(동적방식)
|
|
5th week 03월 31일 |
Machine Learning Intro. 2 |
- API를 이용한 데이터 크롤링
https://gunn.kim/post/2021-01-03-covid19-data-openapi
- - 네이버 검색(쇼핑)
|
|
6th week 04월 07일 |
Machine Learning Algorithms 1 |
- 1. Simple Linear Regression 실습
- https://realpython.com/linear-regression-in-python
- 2. Yelp Linear Regression 분석
- https://medium.com/@a0981639183/use-a-multiple-linear-regression-model-to-investigate-what-factors-most-affect-a-restaurants-yelp-d00b8dd264f0
|
|
7th week 04월 14일 |
Machine Learning Algorithms 2 |
|
|
8th week 04월 21일 |
중간 고사 |
|
|
9th week 04월 28일 |
텀프로젝트 제안 |
- 슬라이드 5장 이상(한 팀당 5분 발표 + 5분 질의응답)
- 문제 정의
- 데이터셋 / 수집계획
- 분석 방법(알고리즘)
- 스케줄
- 역할분담
| |
10th week 05월 12일 |
Machine Learning Algorithms 3 |
- 1. Decision Tree 실습
- 2. 유용한 툴 소개
|
|
11th week 05월 19일 |
Machine Learning Algorithms 4 |
- 네이버에서 코로나 뉴스 텍스트 분석
- Decision Tree(Entropy), k-NN, Naive Bayes등
|
|
12th week 05월 26일 |
|
- 1. k-NN, Naive Bayes 기본 실습(30분)
- 2. 네이버에서 코로나 뉴스 텍스트 분석
- 리뷰 데이터 WordCloud
- 뉴스 텍스트의 Sentiment Analysis
|
|
13th week 06월 02일 |
텀프로젝트 수행 & 자유 질의응답 |
|
|
14th week 06월 09일 |
텀프로젝트 최종발표(실시간) |
|
|
15th week 06월 16일 |
기말고사 |
|
|