데이터 사이언스 스쿨
데이터 사이언스 스쿨
파이썬 편
소개의 글
1장 파이썬 설치와 설정
1.1 파이썬 설치하기
1.2 파이썬 처음 사용하기
1.3 파이썬 패키지 설치하기
1.4 데이터 분석용 파이썬 패키지 소개
1.5 아이파이썬 및 주피터 설정
2장 파이썬 기초문법
2.1 파이썬을 계산기로 사용하기
2.2 부동소수점 실수 자료형
2.3 파이썬으로 글자를 출력하기
2.4 파이썬의 문자열 형식화
2.5 파이썬 조건문 기초
2.6 파이썬 함수
2.7 파이썬 for 반복문
2.8 여러 개의 자료를 한 변수에 담기
2.9 파이썬에서 리스트 자료형 다루기
2.10 리스트와 반복문을 사용하여 계산하기
2.11 파이썬에서 딕셔너리 자료형 다루기
2.12 파이썬 객체지향 프로그래밍
2.13 파이썬 패키지 사용하기
2.14 파이썬의 자료형
2.15 파이썬에서 날짜와 시간 다루기
3장 넘파이 배열 프로그래밍
3.1 넘파이 배열
3.2 배열의 생성과 변형
3.3 배열의 연산
3.4 기술 통계
3.5 난수 발생과 카운팅
4장 판다스 데이터 분석
4.1 판다스 패키지의 소개
4.2 데이터 입출력
4.3 데이터프레임 고급 인덱싱
4.4 데이터프레임의 데이터 조작
4.5 데이터프레임 인덱스 조작
4.6 데이터프레임 합성
4.7 피봇테이블과 그룹분석
4.8 시계열 자료 다루기
5장 데이터 시각화
5.1 시각화 패키지 맷플롯리브 소개
Matplotlib의 여러가지 플롯
Matplotlib의 triangular grid 사용법
Seaborn을 사용한 데이터 분포 시각화
Pandas의 시각화 기능
수학 편
소개의 글
1장 수학 기호
1.1 그리스 문자
1.2 수열과 집합의 합과 곱
2장 넘파이(NumPy)로 공부하는 선형대수
2.1 데이터와 행렬
2.2 벡터와 행렬의 연산
2.3 행렬의 성질
2.4 선형 연립방정식과 역행렬
3장 고급 선형대수
3.1 선형대수와 해석기하의 기초
3.2 좌표와 변환
3.3 고윳값 분해
3.4 특잇값 분해
3.5 PCA
4장 심파이(SymPy)로 공부하는 미적분
4.1 함수
4.2 심파이를 사용한 함수 미분
4.3 적분
4.4 행렬의 미분
4.5 변분법
5장 사이파이(SciPy)로 공부하는 최적화
5.1 최적화 기초
5.2 제한조건이 있는 최적화 문제
5.3 선형계획법 문제와 이차계획법 문제
6장 피지엠파이(pgmpy)로 공부하는 확률론
6.1 집합
6.2 확률의 수학적 정의와 의미
6.3 확률의 성질
6.4 확률분포함수
6.5 결합확률과 조건부확률
6.6 베이즈 정리
7장 확률변수와 상관관계
7.1 확률적 데이터와 확률변수
7.2 기댓값과 확률변수의 변환
7.3 분산과 표준편차
7.4 다변수 확률변수
7.5 공분산과 상관계수
7.6 조건부기댓값과 예측 문제
8장 사이파이로 공부하는 확률분포
8.1 사이파이를 이용한 확률분포 분석
8.2 베르누이분포와 이항분포
8.3 카테고리분포와 다항분포
8.4 정규분포와 중심극한정리
8.5 스튜던트 t분포, 카이제곱분포, F분포
8.6 다변수정규분포
8.7 베타분포, 감마분포, 디리클레분포
9장 추정과 검정
9.1 확률분포의 추정
9.2 최대가능도 추정법
9.3 베이즈 추정법
9.4 검정과 유의확률
9.5 사이파이를 사용한 검정
10장 엔트로피
10.1 엔트로피
10.2 조건부엔트로피
10.3 교차엔트로피와 쿨백-라이블러 발산
10.4 상호정보량
머신러닝 편
1.1 데이터 분석의 소개
1.2 머신러닝용 파이썬 패키지
2.1 데이터 전처리 기초
2.2 범주형 데이터 처리
NLTK 자연어 처리 패키지
KoNLPy 한국어 처리 패키지
Scikit-Learn의 문서 전처리 기능
Soynlp 소개
확률론적 언어 모형
이미지 처리 기초
이미지 필터링
이미지 컨투어
이미지 변환
이미지 특징 추출
사운드 프로세싱 기초
푸리에 변환과 스펙트럼
지리 정보 데이터 처리
Geocoding
4.1 회귀분석 예제
4.2 선형회귀분석의 기초
4.3 스케일링
4.4 범주형 독립변수
4.5 부분회귀
5.1 확률론적 선형 회귀모형
5.2 회귀분석의 기하학
5.3 레버리지와 아웃라이어
5.4 분산 분석과 모형 성능
6.1 모형 진단과 수정
6.2 기저함수 모형과 과최적화
6.3 교차검증
6.4 다중공선성과 변수 선택
6.5 정규화 선형회귀
13.1 추천 시스템
5.1 분류용 예제 데이터
5.2 분류용 가상 데이터 생성
5.3 분류모형
5.4 분류 성능평가
6.1 로지스틱 회귀분석
7.1 선형판별분석법과 이차판별분석법
7.2 나이브베이즈 분류모형
감성 분석
8.1 의사결정나무
12.02 모형 결합
부스팅 방법
서포트 벡터 머신
커널 서포트 벡터 머신
모형 최적화
비대칭 데이터 문제
특징 선택
대규모 데이터 학습
군집화
K-평균 군집화
디비스캔 군집화
계층적 군집화
Affinity Propagation
그래프 이론 기초
그래프 확률모형
네트워크 추론
가우시안 혼합모형과 EM 방법
변분법적 추론
몬테카를로 베이지안 분석
베이지안 회귀 분석 예제
히든 마코프 모형
.ipynb
.pdf
Binder
5장 데이터 시각화
¶
4.8 시계열 자료 다루기
5.1 시각화 패키지 맷플롯리브 소개