인공지능 세미나를 통해 공부한 내용을 기록합니다.
파이썬으로 작성하고, 매주 수업 전에 예습한 내용을 업로드 합니다.
Chapter1, 나의 첫 머신러닝
- 인공지능과 머신러닝 딥러닝에 대해서 배웁니다.
- k-최근접 이웃 알고리즘을 활용하여 생선을 도미와 빙어로 뷴류하는 프로그램을 만들어 봅니다.
- 산점도를 그리는 scatter() 함수와 k-최근접 이웃 분류 모델을 만드는 KNeighborsClassifier() 사이킷런 클래스를 사용합니다.
Chapter2, 데이터 다루기
- 지도 학습, 비지도 학습의 차이점를 배웁니다
- 머신러닝의 평가를 위한 훈련 세트와 테스트 세트에 대해서 알아봅니다.
numpy
배열 라이브러리를 사용해서 데이터가 적절히 섞이도록 합니다.
- 올바른 결과 도출을 위한 데이터 전처리과정에 대해서 알아 봅니다.
- 이웃까지의 거리와 이웃 샘플의 인덱스를 변환하는
kneighbors()
매서드를 활용합니다.
- 이웃까지의 거리와 이웃 샘플의 인덱스를 변환하는
- 표준점수로 특성의 스케일을 변환하는 방법을 배웁니다.
Chapter3, 회귀 알고리즘과 모델 규제
- 지도 학습 알고리즘의 한 종류인 회귀 알고리즘에 대해 배웁니다.
Chapter4, 다양한 분류 알고리즘
Chapter5, 트리 알고리즘
Chapter6, 비지도 학습
- 타깃이 없는 데이터를 사용하는 비지도 학습과 대표적인 알고리즘을 소개합니다.
군집
은 대표적인 비지도 학습 문제로, 비슷한 샘플끼리 그룹으로 모으는 작업이다.- 군집 알고리즘으로 모은 샘플 그룹을 클러스터라고 부릅니다.
- 대표적인 군집 알고리즘인
k-평균
을 배웁니다.- 타깃값을 모르는 척하고 자동으로 사진을 클러스터로 모을 수 있는
군집 알고리즘인
k-평균 알고리즘
을 사용합니다. - 훈련 데이터의 차원을 크게 줄여서 지도 학습 알고리즘의 속도를 크게 높일 수 있다.
- 타깃값을 모르는 척하고 자동으로 사진을 클러스터로 모을 수 있는
군집 알고리즘인
- 대표적인 차원 축소 알고리즘인 주성분 분석(PCA)를 배웁니다.
- 차원 축소는 데이터를 가장 잘 나타내는 일부 특성을 선택하여 데이터 크기를 줄이고 지도 학습 모델의 성능을 향상시킬 수 있는 방법입니다.
주성분 분석
은 차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법이다.