파이썬 머신러닝 비지도학습 - DBSCAN DBSCAN의 이해 DBSCAN은 밀도 기반 클러스터링 방법으로 데이터 포인트를 찍고 해당 포인트 주변에 다른 데이터 포인트가 얼마나 있는지를 기준으로 클러스터를 형성하는 방법으로 데이터 포인트의 근처의 포인트가 기준치를 미달하면 군집 형성을 멈추고 새로운 군집을 형성하며 최종적으로 아무 군집에도 포함되지 못한 포인트를 이상치로 간주한다 사용하기 정규화 https://bigcat5312.tistory.com/94 파이썬 머신러닝 데이터 정규화 https://bigcat5312.tistory.com/80 파이썬 머신러닝 지도학습 - 데이터 분리 (sklearn - train_test_split import from sklearn.model_selection import train_test_split tra.. 2023. 10. 3. 파이썬 머신러닝 비지도학습 - 클러스터링 (K-means K-means k-meas는 데이터를 k개의 클러스터(군집)으로 묶는 비지도 학습 방법으로 k 개의 중심을 임의로 배치하고 거리를 기준으로 클러스터를 생성 후 완성된 클러스터에 대해 새로운 중심을 계산하여 최종적으로 각 클러스터의 평균에 중심이 위치하게 된다 간단히 설명하면 전체 데이터를 데이터의 거리의 평균 기준으로 k개로 나눈다고 생각하면 된다 값의 차이를 기준으로 거리를 정하기 때문에 값들이 정규화가 되어 있지 않다면 거리 계산이 정상적으로 되지 않는다 또 중심점을 기준으로 거리를 기반으로 클러스터를 구분하기 때문에 데이터의 분포가 원형이 아니라 복잡한 형태로 분포하는 경우에 분류가 명확하지 않다는 단점이 있다 사용하기 정규화 https://bigcat5312.tistory.com/94 파이썬 머신.. 2023. 9. 25. 파이썬 머신러닝 비지도학습 - 차원축소 - t-SNE t-SNE t-SNE는 가까운 거리에 있는 데이터를 차원을 축소해서도 가깝게 만드는 차원축소 방법으로 원본의 유사도 맵을 만들고 축소된 데이터의 유사도맵과 원본의 유사도를 비교하여 원본과 최대한 비슷한 유사도를 가진 데이터로 만드는 방법으로 비선형 축소방식이다 차원은 2~3차원으로 축소해야하며 시각화에 주로 사용한다 사용하기 import from sklearn.manifold import TSNE 코드로 임포트를 하고 사용 할 수 있다 이후 tsne = TSNE(n_components = 2, random_state=20) x_tsne = tsne.fit_transform(x) # DataFrame으로 변환 x_tsne = pd.DataFrame(x_tsne, columns = ['T1','T2']) t.. 2023. 9. 21. 파이썬 머신러닝 비지도학습 - 차원축소 - 주성분 분석(PCA) PCA 주성분 분석(pca)는 여러 변수를 가진 데이터(고차원 데이터)를 최대한의 특성을 유지하면서 저차원의 데이터로 만드는 방법으로 가능한 데이터의 분산을 유지하며 선형방식으로 차원을 축소한다 축소하는 데이터는 여러 변수를 가진 데이터 x다 사용 데이터 준비 https://bigcat5312.tistory.com/80 파이썬 머신러닝 지도학습 - 데이터 분리 (sklearn - train_test_split import from sklearn.model_selection import train_test_split train_test_split 데이터를 머신러닝에 사용하기 위해서 학습 데이터와 테스트 데이터를 무작위로 분리하는 함수로 train_test_split(x , y, test_size = or .. 2023. 9. 21. 이전 1 다음