본문 바로가기
DATA Science/Google Machine Learning

표현

by Rainbound-IT 2021. 7. 25.
반응형

label: 예측하는 실제항목(결과, 스팸 or 스팸아님)

feature:데이터를 표현하는 방식 (입력 변수, 주소, 단어,)

model: 예측하는 거

라벨

라벨은 예측하는 항목입니다(단순 선형 회귀의 y 변수). 밀의 향후 가격, 사진에 표시되는 동물의 종류, 오디오 클립의 의미 등 무엇이든지 라벨이 될 수 있습니다.

 

특성

특성은 입력 변수입니다(단순 선형 회귀의 x 변수). 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 다음과 같이 수백만 개의 특성을 사용할 수 있습니다.

 

모델

모델은 특성과 라벨의 관계를 정의합니다. 예를 들어, 스팸 감지 모델에서 특정 특성을 '스팸'과 긴밀하게 연결할 수 있습니다. 모델 수명의 두 단계를 골라 살펴보겠습니다.

  • 학습은 모델을 만들거나 배우는 것을 의미합니다. 즉 라벨이 있는 예를 모델에 보여 주고, 모델이 특성과 라벨의 관계를 점차적으로 학습하도록 합니다.
  • 추론은 학습된 모델을 라벨이 없는 예에 적용하는 것을 의미합니다. 즉 학습된 모델을 사용하여 유용한 예측(y')을 해냅니다. 예를 들어, 추론하는 동안 라벨이 없는 새로운 예로 medianHouseValue를 예측할 수 있습니다.

회귀와 분류

회귀 모델은 연속적인 값을 예측합니다. 예를 들어 회귀 모델은 다음과 같은 질문에 대한 답을 예측합니다.

  • 캘리포니아의 주택 가격이 얼마인가요?
  • 사용자가 이 광고를 클릭할 확률이 얼마인가요?

분류 모델은 불연속적인 값을 예측합니다. 예를 들어 분류 모델은 다음과 같은 질문에 대한 답을 예측합니다.

  • 주어진 이메일 메시지가 스팸인가요, 스팸이 아닌가요?
  • 이 이미지가 강아지, 고양이 또는 햄스터의 이미지인가요?

 

 

간단하게 말하면 라벨은 결과, 특성(보통 feature라고 읽음)은 인수나 변수라고 생각하면 될것같다.

반응형

'DATA Science > Google Machine Learning' 카테고리의 다른 글

학습 및 손실  (0) 2021.07.25
선형회귀  (0) 2021.07.25
구글 머신러닝 수업전 필요사항  (0) 2021.06.03
머신러닝 규칙  (0) 2021.06.03
구글 머신러닝 온라인 교육과정  (0) 2021.06.03

댓글