| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 붓꽃데이터셋
- sklearn
- 키 종류
- Key 종류
- 무결성
- ALTERTABLE
- 백준
- 세대별가비지컬렉터
- 잠재요소모델
- 문자열
- latent factor
- latent factor model
- 무결성유지
- Python
- Hyperlink Graphs
- 주성분 찾기
- SQL
- 사이킷런
- TDD
- 클린코드
- 무결성유지메커니즘
- 힙
- RENAMETABLE
- 알고리즘
- 파이썬
- SQLDDL
- CREATETABLE
- DROPTABLE
- knn_classify
- 컨테이너객체
- Today
- Total
목록sklearn (2)
DonHurry
들어가기에 앞서.. PCA를 이해하기 위해서는 선형대수학 개념이 필수적입니다. 본 실습에서 흐름 자체를 따라갈 수는 있어도 완전히 이해하기 위해서는 고윳값, 고유벡터, 내적, 직교 등의 개념을 숙지해야합니다. 아래 코드를 진행하다가 이해가지 않는 점이 있다면 따로 공부하는 것을 추천드립니다. 바로 아래 링크에 설명이 아주 잘되어 있습니다. 추천드려요! 주성분 분석(PCA) - 공돌이의 수학정리노트 angeloyeo.github.io 데이터 준비 실습에 사용할 데이터입니다. 머신러닝 분야에서 매우 자주 사용되는 붓꽃(iris) 데이터셋입니다. UCI Machine Learning Repository: Iris Data Set Data Set Characteristics: Multivariate Number..
본 포스트에서는 K-Means를 활용한 클러스터링을 진행해보도록 하겠습니다. 기본적으로 클러스터 분석이란, 다차원 공간에서 여러 개의 점들이 존재할 때 서로 가까이 있는 점들을 서로 연관시키는 문제입니다. 단순히 2차원 좌표의 점이 아닌, 다차원 공간으로 확장이 가능하기 때문에 인물 사진 분류, 스팸 메일 분류 등 다양한 task에 활용이 가능합니다. 클러스터링에는 매우 다양한 방법들이 있는데, 그중 K-Means Clustering은 반복적인 연산을 통해 데이터를 k개의 클러스터로 분할하는 알고리즘입니다. 크게 다음과 같은 4가지 순서를 따릅니다. 1. 임의로 k개의 중심점(centroid)을 생성 2. 각각의 점을 가장 가까운 중심점의 클러스터에 포함 3. 각 클러스터에 포함된 점들을 평균내어 새로운..