머신러닝딥러닝/딥러닝27 딥러닝(Deep learning) #9 데이터 분석 & 피마 인디언 당뇨병 예측 피마 인디언 데이터 가져오기&분석 # 라이브러리 설정 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 데이터 가져오기 # 데이터에 header가 없어 names로 각 속성별 이름 붙여줌 data = pd.read_csv('C:/Users/kwonk/juno1412-1/juno1412/DL/모두의 딥러닝/dataset/pima-indians-diabetes.csv', names = ["pregnant", "plasma", "pressure", "thickness", "insulin", "bmi", "pedigree", "age", "class"]) # 데이터 확인 print(data.head(5)) print(data... 2022. 4. 13. 딥러닝(Deep learning) #8 모델 설계 keras 입력층 은닉층 출력층 Sequential() 힘수 - Sequential()을 모델로 선언하고 model.add()라는 라인을 추가하면 새로운 층 형성가능. - Sequential 모델은 각 레이어에 정확히 하나의 입력 텐서와 하나의 출력 텐서가 있는 일반 레이어 스택에 적합합니다. model.add() 함수 : 새로운 층을 만드는 함수 Dense()함수 : model.add()로 새로운 층 생성 후, Dense()함수를 통해 몇개의 노드를 만들 건지 지정함. - (Dense(30, input_dim=17, activation='relu')) = Dense(30개의 노드), input_dim(폐암환자 생존여부 데이터 17개를 노드로 보냄), activation = 'relu'(활성화 함수) # 딥러닝 모.. 2022. 4. 13. 딥러닝(Deeping Learning) #7 - 오차 역전파/신경망 오차역전파 다층 퍼셉트론의 최적화과정을 오차역전파(back propagation)라 한다. 오차역전파 구동방식 1. 임의의 초기 가중치 w를 준 뒤, 결과를 계산한다. 2. 실제 값(실제 계산 결과)와 이상값(원하는 값)의 오차를 구한다. 3. 경사 하강법을 이용해 앞 가중치의 오차가 작아지는 방법으로 업데이트 한다. 4. 더이상 오차가 줄어들지 않을 때까지 반복한다. 오차역전파 가중치 수정 수식 신경망의 구현 과정 1. 환경변수 지정 데이터셋, 학습률, 활성화함수, 가중치 선언 등 환경변수 지정 2. 신경망 실행 초기값을 입력해 활성화 함수와 가중치를 거쳐 결과값이 나오게 합니다. 3. 결과를 실제 값에 비교 실제값 vs 이상값 비교 4. 역전파 출력층/은닉층 가중치를 수정한다. 이상값과 실제값의 오차.. 2022. 4. 12. 딥러닝(Deep Learning) #6 - 퍼셉트론 뉴런 VS 퍼셉트론 가중치 가중합 바이어스 활성화 함수 가중치 w(weight) = 기울기 a 바이어스 b(bias) = y 절편 b 가중합(weighted sum) y = wx + b 가중합의 결과를 1 or 0으로 출력해서 다음으로 보낸다. 0, 1을 판단하는 함수를 활성화함수(activation function)이라고하며, 시그모이드 함수가 대표적인 활성화 함수이다. XOR 문제 퍼셉트론의 한계(2차원의 한계) 퍼셉트론으로는 단순히 선을 그려도 하나의 직선으로 흰점/검은점 구분할 수 없음. 다층 퍼셉트론 = 2차원 한계 해결 종이를 휘어서 선 2개로 흰색/검은색 구분이 가능 → 2차원이 아닌 3차원으로 해결 숨어있는 은닉층(hidden layer)를 만들어 해결 다층 퍼셉트론 x = 퍼셉티콘 n(n.. 2022. 4. 12. 딥러닝(deeplearning) #5 - 다항 로지스틱 회귀(Multi_Logistic_Regression) 다항 로지스틱 회귀 다항 로지스틱 회귀 다항 로지스틱 회귀분석은 예측자 변수 세트의 값에 따라 개체를 분류할 때 유용하다. 다항 로지스틱 회귀분석은 종속변수가 두 개의 이상의 범주가 가능하여 로지스틱 회귀분석보다 일반적으로 사용할 수 있다. 1. 라이브러리 생성 import tensorflow as tf import numpy as np 라이브러리 tensorflow, numpy 사용 tensorflow 는 2점대 버전이 아닌 1.15를 사용했음 2점대의 코딩 방식이 다르기 때문에 모두의 딥러닝 시즌1은 tensorflow 1.15를 사용함 # 2. 실행 시 같은 결과 출력을 위한 seed 값 설정 seed = 0 np.random.seed(seed) tf.set_random_seed(seed) 실행 시.. 2022. 4. 12. 딥러닝(deeplearning) #4 - 로지스틱 회귀(logistic regression) 로지스틱 회귀(logistic regression) 회귀를 사용하여 데이터가 어떤 범주에 속할 확률이 0~1사이의 값으로 예측하고 예측 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도학습 알고리즘이다. 로지스틱 회귀는 참(1), 거짓(0)을 구분하는 S자 형태의 선을 그어주는 작업 시그모이드 함수(sigmoid function) e = 2.71828... 자연상수라 불리는 무리수 = 파이와 비슷 구해야 하는 값 ax+b a = 그래프의 경사도 (a값이 크면 경사도↑, a값이 작으면 경사도 ↓) b = 그래프의 좌우 이동 코딩으로 확인하기 # 라이브러리 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf .. 2022. 4. 12. 딥러닝(deeplearning) #3 - 경사하강법 미분 x 값이 아주 미세하게 움직일 때, y변화량을 구한 뒤, 이를 x변화량으로 나누는 과정 경사하강법(Gradient decent) 미분의 기울기를 이용해 기울기가 0인 한 점(m)을 찾는 방법 위 그래프에서 오차가 가장 적은 지점 a=m m과 같은 기울기 a를 찾았을 때 오차가 가장 적어짐 a=m에 가까운 지점을 경사를 하강시켜 찾아가는 과정을 경사하강법이라 한다. 시작점 a1의 미분을 구하고, 구해진 기울기의 반대방향으로 이동시킨 뒤 a2를 구한다. a=0이 아니라면, 과정을 반복하여 기울기가 m = 0 으로 수렴한다. 학습률 경사하강법에서 기울기 반대편으로 이동시킬 때, 얼만큼 이동시킬지 결정하는 값. 학습률을 적절히 바꾸며 최적의 학습률을 찾는 것이 중요한 최적화 과정 중 하나 경사하강법 # x.. 2022. 4. 11. 딥러닝(deeplearning) #2 - 선형회귀(MSE, RMSE) 선형회귀(linear Regression)이란? X = 성적이 변화하는 '정보' 요소 Y = X값에 의해 변하는 성적 X값이 변함에 따라 Y값도 변한다는 정의 안에서 X = 독립변수(독립적으로 변할 수 있는 값) Y = 종속변수(독립 변수에 따라 종속적으로 변하는 값) 선형회귀란 독립변수 X를 사용해 종속변수 Y의 움직임을 예측하고 설명하는 작업이다. - 단순선형회귀(simple linear regression) : 하나의 x값으로 y값을 설명가능 할 때 단순선형회귀라 한다. - 다중선형회귀(multiple linear regression) : 여러개의 x값으로 y값을 설명가능 할 때 다중선형회귀라 한다. 최소제곱법(method of least squares) 회귀 분석에서 사용되는표준 방식. 실험이나 .. 2022. 4. 11. 딥러닝(deeplearning) #1 - 폐암 수술 환자의 생존율 예측 학습(Training) : 데이터가 입력되고 패턴이 분석되는 과정 학습 과정 평면에 환자들을 배치하는 과정이며, 머신러닝 학습은 규칙을 발견해 생존, 사망여부를 정하는 경계를 찾는 걸 말한다. 1. 데이터 분석 맟 입력 import numpy numpy 라이브러리를 불러오라는 뜻. 수치계산을 위해 만들어진 라이브러리로 데이터 분석에 많이 활용됨 Data_set = numpy.loadtxt("C:/juno1412-1/DL/모두의 딥러닝/dataset/ThoraricSurgery.csv", delimiter=",") Data_set 임시저장소 만들기. loadtxt() 함수로 csv 데이터셋 불러오기 ThoraricSurgery.csv 데이터셋 살펴보기 shape = (470, 18) #470 rows, 1.. 2022. 4. 11. 이전 1 2 3 다음 반응형