본문 바로가기
DATA Science/Google Machine Learning

선형회귀

by Rainbound-IT 2021. 7. 25.
반응형

오랫동안 귀뚜라미는 시원날 날보다 더운 날 더 자주 우는 것으로 알려져 왔습니다. 전문가 및 아마추어 곤충 학자들이 수십 년에 걸쳐서 1분당 귀뚜라미가 우는 횟수와 온도에 관한 데이터를 목록으로 작성했습니다. 고모가 생일 선물로 두 특성의 관계를 예측하는 모델을 학습시켜 보라고 아끼던 귀뚜라미 데이터베이스를 줬다고 해 봅시다.

올바른 첫 번째 단계는 데이터를 그래프로 만들어 검토하는 것입니다.

그림 1. 1분당 우는 횟수 및 섭씨온도

예상대로 그래프를 통해 우는 횟수가 증가할수록 온도가 올라가는 것을 확인했습니다. 우는 횟수와 온도는 선형 관계일까요? 네. 이 관계를 근사치로 하는 다음과 같은 하나의 직선을 그릴 수 있습니다.

그림 2. 선형 관계

사실 선이 모든 점을 완벽하게 통과하지는 않지만, 선은 우리에게 있는 온도 데이터와 우는 소리 데이터의 관계를 명확히 보여줍니다. 대수학을 약간 적용하면 이 관계를 다음과 같이 작성할 수 있습니다.

y=mx+b

여기서

  • y는 섭씨온도, 즉 예측하려는 값입니다.
  • m은 선의 기울기입니다.
  • x는 1분당 우는 횟수, 즉 입력 특성 값입니다.
  • b는 y절편입니다.

머신러닝의 관습에 따라 모델의 방정식을 약간 다르게 작성하게 됩니다.

y′=b+w1x1

여기서

  • y′는 예측된 라벨(얻고자 하는 출력)입니다.
  • b는 편향(y절편)입니다. 일부 머신러닝 자료에서는 w0이라고도 합니다.
  • w1은 특성 1의 가중치입니다. 가중치는 위에서 m으로 표현된 '기울기'와 같은 개념입니다.
  • x1 특성(알려진 입력)입니다.

새로운 분당 우는 횟수x1에서 온도y′ 추론(예측)하려면 x1 값을 이 모델에 삽입하기만 하면 됩니다.

아래 첨자(예: w1, x1)는 여러 특성에 의존하는 좀 더 정교한 모델을 예시합니다. 예를 들어 세 가지 특성에 의존하는 모델은 다음과 같은 방정식을 사용합니다.

y′=b+w1x1+w2x2+w3x3

 

반응형

'DATA Science > Google Machine Learning' 카테고리의 다른 글

경사하강법  (0) 2021.07.25
학습 및 손실  (0) 2021.07.25
표현  (0) 2021.07.25
구글 머신러닝 수업전 필요사항  (0) 2021.06.03
머신러닝 규칙  (0) 2021.06.03

댓글