본문 바로가기
  • 조금 느려도, 꾸준히
반응형

Artificial Intelligence/Machine Learning26

핸즈온 머신러닝(2)- 머신러닝의 주요 도전 과제 요약 [나쁜 데이터의 사례] 1. 충분하지 않은 양의 훈련 데이터 - 2001 microsoft Michele Banko, Eric Brill: 머신러닝 알고리즘들에 충분한 데이터가 주어지면 복잡한 자연어 중의성 해소 문제를 거의 비슷하게 잘 처리한다는 것을 보임. '시간과 돈을 알고리즘 개발에 쓰는 것과 말뭉치(corpus) 개발에 쓰는 것 사이의 트레이드오프에 대해서 다시 생각해봐야 함' - 2009 Peter Norvig 'The Unreasonable Effectiveness of Data': 복잡한 문제에서 알고리즘보다 데이터가 더 중요함. but 작거나 중간 규모의 데이터셋이 여전히 매우 흔하고 훈련 데이터를 추가로 모으는 것이 쉽지 않으므로 알고리즘을 무시하지는 말아야 함. 2. 대표성 없는 훈련.. 2020. 1. 20.
핸즈온 머신러닝(1) - 머신러닝 시스템의 종류 1. 학습하는 동안의 감독 형태나 정보량에 따라 - 지도학습: 알고리즘에 주입하는 훈련 데이터에 label 이라는 원하는 답이 포함됨 예시: k-Nearest Neighbors, Linear Regression, Logistic Regression, SVM(support vector machines), Decision Tree, Random Forests, Neural networks - 비지도학습: 훈련 데이터에 레이블이 없음. 시스템이 스스로 학습해야 함 예시: 군집) k-Means, HCA(hierarchical cluster analysis), 기댓값 최대화 시각화와 차원축소) PCA(principal component analysis), Kernel PCA, LLE(locally-linear e.. 2020. 1. 20.
반응형