다운로드
작성자: admin 작성일시: 2016-05-30 01:29:52 조회수: 6625 다운로드: 246
카테고리: Python 태그목록:

Scikit-Learn 패키지 소개

Scikit-Learn 패키지는 머신 러닝 교육 및 실무를 위한 파이썬 패키지로 다음과 같은 구성 요소들을 갖추고 있다.

  • 벤치마크용 샘플 데이터 세트
  • 데이터 전처리(preprocessing) 기능
  • 지도 학습(Supervised learning) 모형
  • 비지도 학습(Unsupervised learning) 모형
  • 모형 평가 및 선택

자세한 내용은 다음 웹사이트를 참조한다.

scikit-learn 패키지에서 제공하는 머신 러닝 모형

scikit-learn 패키지의 장점은 다양한 머신 러닝 모형 즉, 알고리즘을 하나의 패키지에서 모두 제공하고 있다는 점이다. 다음은 scikit-learn 패키지에서 제공하는 머신 러닝 모형의 목록이다. 이 목록은 대표적인 것들만을 나열한 것이며 지속적으로 모형들이 추가되고 있다.

지도 학습(Supervised learning) 모형

  • http://scikit-learn.org/stable/supervised_learning.html

  • Generalized Linear Models

    • Ordinary Least Squares
    • Ridge/Lasso/Elastic Net Regression
    • Logistic regression
    • Polynomial regression
    • Perceptron
  • Linear and Quadratic Discriminant Analysis
  • Support Vector Machines
  • Stochastic Gradient Descent
  • Nearest Neighbor Algorithms
  • Gaussian Processes
  • Naive Bayes
  • Decision Trees
  • Ensemble methods
    • Random Forests
    • AdaBoost

비지도 학습(Unsupervised learning) 모형

  • Gaussian mixture models
  • Manifold learning
  • Clustering
    • K-means
    • DBSCAN
  • Biclustering
  • Decomposing
    • Principal component analysis (PCA)
    • Factor Analysis
    • Independent component analysis (ICA)
    • Latent Dirichlet Allocation (LDA)
  • Covariance estimation
  • Novelty and Outlier Detection
  • Density Estimation

scikit-learn의 서브 패키지

scikit-learn 은 서브 패키지 단위로 별도의 기능을 제공하고 있다. 대표적인 서브 패키지와 기능을 나열하면 다음과 같다.

  • 자료 제공:
    • sklearn.datasets: 샘플 데이터 세트 제공
  • 자료 전처리:
    • sklearn.preprocessing: imputation, encoding 등 단순 전처리
    • sklearn.feature_extraction: Feature Extraction
  • 모형:
    • sklearn.base: Base classes and utility functions
    • sklearn.pipeline: Pipeline
    • sklearn.linear_model: Generalized Linear Models
    • sklearn.naive_bayes: Naive Bayes
    • sklearn.discriminant_analysis: Discriminant Analysis
    • sklearn.neighbors: Nearest Neighbors
    • sklearn.mixture: Gaussian Mixture Models
    • sklearn.svm: Support Vector Machines
    • sklearn.tree: Decision Trees
    • sklearn.ensemble: Ensemble Methods
    • sklearn.cluster: Clustering
  • 모형 평가:
    • sklearn.metrics: Metrics
    • sklearn.cross_validation: Cross Validation
    • sklearn.grid_search: Grid Search

질문/덧글

아직 질문이나 덧글이 없습니다. 첫번째 글을 남겨주세요!