반응형 DATA Science/Google Machine Learning22 Tensorflow 실습 첫번째 적고나니까 어차피 파일이 따로 있어서 굳이 포스팅해야하나.. 어차피 복붙이라 의미가 별로 없는것같기도 하고 아닌것같기도 하고.... 그래서 이것외에는실습은올리지 않아야 겟다. 학습 목표: 텐서플로우의 기초 개념을 학습한다 텐서플로우의 LinearRegressor 클래스를 사용하여 입력 특성 하나를 기반으로 지역별 주택 가격 중앙값을 예측한다 평균 제곱근 오차(RMSE)를 사용하여 모델 예측의 정확성을 평가한다 초매개변수를 조정하여 모델의 정확성을 개선한다 데이터의 출처는 1990년 캘리포니아 인구조사 자료입니다. 첫 번째 셀에서 필요한 라이브러리를 로드하겠습니다. from __future__ import print_function import math from IPython import display f.. 2021. 7. 25. Pandas 실습 pandas 문서 https://pandas.pydata.org/pandas-docs/stable/index.html pandas documentation — pandas 1.3.0 documentation The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key concepts. pandas.pydata.org Pandas의 기본 데이터 구조는 두 가지 클래스로 구현됩니다. DataFrame은 행 및 .. 2021. 7. 25. 텐서플로 시작 다음 그림은 텐서플로우 도구함의 현재 계층구조를 보여 줍니다. 그림 1. 텐서플로우 도구함 계층구조 다음 표에는 여러 레이어의 목적이 요약되어 있습니다. 도구함설명 에스티메이터(tf.estimator) 높은 수준의 OOP API tf.layers/tf.losses/tf.metrics 일반 모델 구성요소용 라이브러리 텐서플로우 낮은 수준의 API 텐서플로우는 다음 두 요소로 구성됩니다. 그래프 프로토콜 버퍼 분산된 그래프를 실행하는 런타임 이 두 구성요소는 자바 컴파일러 및 JVM과 유사합니다. JVM이 여러 하드웨어 플랫폼에서 구현되는 것과 마찬가지로 텐서플로우도 여러 CPU와 GPU에서 구현됩니다. 어느 API를 사용해야 하나요? 문제를 해결하는 최고 수준의 추상화를 사용해야 합니다. 추상화 수준이 높.. 2021. 7. 25. 경사하강법 이전에 했던게 많아서 생략을 좀했다. 이상적인 학습률에 대해 자세히 알아보세요. 1차원의 경우 이상적인 학습률은 1 / f(x)″ (x에서 f(x)의 2계도함수의 역)입니다. 2차원 이상에서 이상적인 학습률은 헤시안 행렬(2계편미분의 행렬)의 역입니다. 일반적인 볼록 함수의 경우에는 이야기가 더 복잡해집니다. 확률적 경사하강법(SGD) 경사하강법에서 배치는 단일 반복에서 기울기를 계산하는 데 사용하는 예의 총 개수입니다. 지금까지는 배치가 전체 데이터 세트라고 가정했습니다. 하지만 Google 규모의 작업에서는 데이터 세트에 수십억, 수천억 개의 예가 포함되는 경우가 많습니다. 또한 대개 Google 데이터 세트에는 엄청나게 많은 특성이 포함되어 있습니다. 따라서 배치가 거대해질 수 있습니다. 배치가 너.. 2021. 7. 25. 학습 및 손실 모델을 학습시킨다는 것은 단순히 말하자면 라벨이 있는 데이터로부터 올바른 가중치와 편향값을 학습(결정)하는 것입니다. 지도 학습에서 머신러닝 알고리즘은 다양한 예를 검토하고 손실을 최소화 하는 모델을 찾아봄으로써 모델을 만들어내는데, 이 과정을 경험적 위험 최소화라고 합니다. 손실은 잘못된 예측에 대한 벌점입니다. 즉, 손실은 한 가지 예에서 모델의 예측이 얼마나 잘못되었는지를 나타내는 수입니다. 모델의 예측이 완벽하면 손실은 0이고 그렇지 않으면 손실은 그보다 커집니다. 모델 학습의 목표는 모든 예에서 평균적으로 작은 손실을 갖는 가중치와 편향의 집합을 찾는 것입니다. 예를 들어 그림 3에서 왼쪽은 손실이 큰 모델이고 오른쪽은 손실이 작은 모델입니다. 그림에 관해 다음 사항을 참고하세요. 빨간색 화살표.. 2021. 7. 25. 선형회귀 오랫동안 귀뚜라미는 시원날 날보다 더운 날 더 자주 우는 것으로 알려져 왔습니다. 전문가 및 아마추어 곤충 학자들이 수십 년에 걸쳐서 1분당 귀뚜라미가 우는 횟수와 온도에 관한 데이터를 목록으로 작성했습니다. 고모가 생일 선물로 두 특성의 관계를 예측하는 모델을 학습시켜 보라고 아끼던 귀뚜라미 데이터베이스를 줬다고 해 봅시다. 올바른 첫 번째 단계는 데이터를 그래프로 만들어 검토하는 것입니다. 그림 1. 1분당 우는 횟수 및 섭씨온도 예상대로 그래프를 통해 우는 횟수가 증가할수록 온도가 올라가는 것을 확인했습니다. 우는 횟수와 온도는 선형 관계일까요? 네. 이 관계를 근사치로 하는 다음과 같은 하나의 직선을 그릴 수 있습니다. 그림 2. 선형 관계 사실 선이 모든 점을 완벽하게 통과하지는 않지만, 선은 .. 2021. 7. 25. 표현 label: 예측하는 실제항목(결과, 스팸 or 스팸아님) feature:데이터를 표현하는 방식 (입력 변수, 주소, 단어,) model: 예측하는 거 라벨 라벨은 예측하는 항목입니다(단순 선형 회귀의 y 변수). 밀의 향후 가격, 사진에 표시되는 동물의 종류, 오디오 클립의 의미 등 무엇이든지 라벨이 될 수 있습니다. 특성 특성은 입력 변수입니다(단순 선형 회귀의 x 변수). 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 다음과 같이 수백만 개의 특성을 사용할 수 있습니다. 모델 모델은 특성과 라벨의 관계를 정의합니다. 예를 들어, 스팸 감지 모델에서 특정 특성을 '스팸'과 긴밀하게 연결할 수 있습니다. 모델 수명의 두 단계를 골라 살펴보겠습니다. 학습은 모델을 만.. 2021. 7. 25. 구글 머신러닝 수업전 필요사항 Pandas 시작하기 머신러닝 단기집중과정의 프로그램 실습에서는 Pandas 라이브러리를 사용하여 데이터 세트를 조작합니다. Pandas에 익숙하지 않으면 실습에 사용된 주요 Pandas 기능을 설명하는 Pandas 간단 소개 가이드를 완료하시기 바랍니다. 낮은 수준의 TensorFlow 기본 사항 머신러닝 단기집중과정의 프로그래밍 실습에서는 고급 tf.estimator API를 사용하여 모델을 구성합니다. 처음부터 TensorFlow 모델을 구성하려면 다음 가이드를 완료하세요. TensorFlow Hello World: 낮은 수준의 TensorFlow 코딩된 'Hello World'입니다. TensorFlow 프로그래밍 개념: TensorFlow 애플리케이션의 기본 구성요소인 텐서, 작업, 그래프, 세.. 2021. 6. 3. 머신러닝 규칙 머신러닝 엔지니어링 실무지침서 Martin Zinkevich 본 문서의 목적은 머신러닝에 관한 기초 지식을 갖춘 독자들이 Google의 머신러닝 관련 권장사항을 참고할 수 있도록 돕는 것으로, Google C++ 스타일 가이드 등의 인기 있는 실무 프로그래밍 가이드처럼 머신러닝에 관한 스타일을 제시합니다. 머신러닝 수업을 들은 적이 있거나 머신러닝 모델을 개발하거나 다뤄본 경험이 있다면 이 문서를 읽는 데 필요한 배경 지식을 갖춘 것입니다. 용어 효과적인 머신러닝을 논하는 본 문서에서는 다음과 같은 용어가 반복적으로 사용됩니다. 인스턴스: 예측하려는 대상물을 의미합니다. 예를 들어 웹페이지를 '고양이와 관련됨' 혹은 '고양이와 무관함'으로 분류하려는 경우 이 웹페이지가 인스턴스가 될 수 있습니다. 라벨:.. 2021. 6. 3. 구글 머신러닝 온라인 교육과정 https://developers.google.com/machine-learning/crash-course?hl=ko 머신러닝 단기집중과정 | Google Developers 실용적인 단기집중식 머신러닝 기초 입문 과정(20시간)입니다. 텐서플로우 실습도 함께 제공됩니다. developers.google.com 공부하다가 이상한게 나왔다 한글은 2021년 7월 30일까지 제공한다고 한다. 그래서 이거부터 해보려고 한다. 2021. 6. 3. 이전 1 2 다음 반응형