반응형
label: 예측하는 실제항목(결과, 스팸 or 스팸아님)
feature:데이터를 표현하는 방식 (입력 변수, 주소, 단어,)
model: 예측하는 거
라벨
라벨은 예측하는 항목입니다(단순 선형 회귀의 y 변수). 밀의 향후 가격, 사진에 표시되는 동물의 종류, 오디오 클립의 의미 등 무엇이든지 라벨이 될 수 있습니다.
특성
특성은 입력 변수입니다(단순 선형 회귀의 x 변수). 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 다음과 같이 수백만 개의 특성을 사용할 수 있습니다.
모델
모델은 특성과 라벨의 관계를 정의합니다. 예를 들어, 스팸 감지 모델에서 특정 특성을 '스팸'과 긴밀하게 연결할 수 있습니다. 모델 수명의 두 단계를 골라 살펴보겠습니다.
- 학습은 모델을 만들거나 배우는 것을 의미합니다. 즉 라벨이 있는 예를 모델에 보여 주고, 모델이 특성과 라벨의 관계를 점차적으로 학습하도록 합니다.
- 추론은 학습된 모델을 라벨이 없는 예에 적용하는 것을 의미합니다. 즉 학습된 모델을 사용하여 유용한 예측(y')을 해냅니다. 예를 들어, 추론하는 동안 라벨이 없는 새로운 예로 medianHouseValue를 예측할 수 있습니다.
회귀와 분류
회귀 모델은 연속적인 값을 예측합니다. 예를 들어 회귀 모델은 다음과 같은 질문에 대한 답을 예측합니다.
- 캘리포니아의 주택 가격이 얼마인가요?
- 사용자가 이 광고를 클릭할 확률이 얼마인가요?
분류 모델은 불연속적인 값을 예측합니다. 예를 들어 분류 모델은 다음과 같은 질문에 대한 답을 예측합니다.
- 주어진 이메일 메시지가 스팸인가요, 스팸이 아닌가요?
- 이 이미지가 강아지, 고양이 또는 햄스터의 이미지인가요?
간단하게 말하면 라벨은 결과, 특성(보통 feature라고 읽음)은 인수나 변수라고 생각하면 될것같다.
반응형
'DATA Science > Google Machine Learning' 카테고리의 다른 글
학습 및 손실 (0) | 2021.07.25 |
---|---|
선형회귀 (0) | 2021.07.25 |
구글 머신러닝 수업전 필요사항 (0) | 2021.06.03 |
머신러닝 규칙 (0) | 2021.06.03 |
구글 머신러닝 온라인 교육과정 (0) | 2021.06.03 |
댓글