본문 바로가기

전체 글134

딥러닝(Deep Learning) #6 - 퍼셉트론 뉴런 VS 퍼셉트론 가중치 가중합 바이어스 활성화 함수 가중치 w(weight) = 기울기 a 바이어스 b(bias) = y 절편 b 가중합(weighted sum) y = wx + b 가중합의 결과를 1 or 0으로 출력해서 다음으로 보낸다. 0, 1을 판단하는 함수를 활성화함수(activation function)이라고하며, 시그모이드 함수가 대표적인 활성화 함수이다. XOR 문제 퍼셉트론의 한계(2차원의 한계) 퍼셉트론으로는 단순히 선을 그려도 하나의 직선으로 흰점/검은점 구분할 수 없음. 다층 퍼셉트론 = 2차원 한계 해결 종이를 휘어서 선 2개로 흰색/검은색 구분이 가능 → 2차원이 아닌 3차원으로 해결 숨어있는 은닉층(hidden layer)를 만들어 해결 다층 퍼셉트론 x = 퍼셉티콘 n(n.. 2022. 4. 12.
딥러닝(deeplearning) #5 - 다항 로지스틱 회귀(Multi_Logistic_Regression) 다항 로지스틱 회귀 다항 로지스틱 회귀 다항 로지스틱 회귀분석은 예측자 변수 세트의 값에 따라 개체를 분류할 때 유용하다. 다항 로지스틱 회귀분석은 종속변수가 두 개의 이상의 범주가 가능하여 로지스틱 회귀분석보다 일반적으로 사용할 수 있다. 1. 라이브러리 생성 import tensorflow as tf import numpy as np 라이브러리 tensorflow, numpy 사용 tensorflow 는 2점대 버전이 아닌 1.15를 사용했음 2점대의 코딩 방식이 다르기 때문에 모두의 딥러닝 시즌1은 tensorflow 1.15를 사용함 # 2. 실행 시 같은 결과 출력을 위한 seed 값 설정 seed = 0 np.random.seed(seed) tf.set_random_seed(seed) 실행 시.. 2022. 4. 12.
딥러닝(deeplearning) #4 - 로지스틱 회귀(logistic regression) 로지스틱 회귀(logistic regression) 회귀를 사용하여 데이터가 어떤 범주에 속할 확률이 0~1사이의 값으로 예측하고 예측 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도학습 알고리즘이다. 로지스틱 회귀는 참(1), 거짓(0)을 구분하는 S자 형태의 선을 그어주는 작업 시그모이드 함수(sigmoid function) e = 2.71828... 자연상수라 불리는 무리수 = 파이와 비슷 구해야 하는 값 ax+b a = 그래프의 경사도 (a값이 크면 경사도↑, a값이 작으면 경사도 ↓) b = 그래프의 좌우 이동 코딩으로 확인하기 # 라이브러리 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf .. 2022. 4. 12.
딥러닝(deeplearning) #3 - 경사하강법 미분 x 값이 아주 미세하게 움직일 때, y변화량을 구한 뒤, 이를 x변화량으로 나누는 과정 경사하강법(Gradient decent) 미분의 기울기를 이용해 기울기가 0인 한 점(m)을 찾는 방법 위 그래프에서 오차가 가장 적은 지점 a=m m과 같은 기울기 a를 찾았을 때 오차가 가장 적어짐 a=m에 가까운 지점을 경사를 하강시켜 찾아가는 과정을 경사하강법이라 한다. 시작점 a1의 미분을 구하고, 구해진 기울기의 반대방향으로 이동시킨 뒤 a2를 구한다. a=0이 아니라면, 과정을 반복하여 기울기가 m = 0 으로 수렴한다. 학습률 경사하강법에서 기울기 반대편으로 이동시킬 때, 얼만큼 이동시킬지 결정하는 값. 학습률을 적절히 바꾸며 최적의 학습률을 찾는 것이 중요한 최적화 과정 중 하나 경사하강법 # x.. 2022. 4. 11.
딥러닝(deeplearning) #2 - 선형회귀(MSE, RMSE) 선형회귀(linear Regression)이란? X = 성적이 변화하는 '정보' 요소 Y = X값에 의해 변하는 성적 X값이 변함에 따라 Y값도 변한다는 정의 안에서 X = 독립변수(독립적으로 변할 수 있는 값) Y = 종속변수(독립 변수에 따라 종속적으로 변하는 값) 선형회귀란 독립변수 X를 사용해 종속변수 Y의 움직임을 예측하고 설명하는 작업이다. - 단순선형회귀(simple linear regression) : 하나의 x값으로 y값을 설명가능 할 때 단순선형회귀라 한다. - 다중선형회귀(multiple linear regression) : 여러개의 x값으로 y값을 설명가능 할 때 다중선형회귀라 한다. 최소제곱법(method of least squares) 회귀 분석에서 사용되는표준 방식. 실험이나 .. 2022. 4. 11.
딥러닝(deeplearning) #1 - 폐암 수술 환자의 생존율 예측 학습(Training) : 데이터가 입력되고 패턴이 분석되는 과정 학습 과정 평면에 환자들을 배치하는 과정이며, 머신러닝 학습은 규칙을 발견해 생존, 사망여부를 정하는 경계를 찾는 걸 말한다. 1. 데이터 분석 맟 입력 import numpy numpy 라이브러리를 불러오라는 뜻. 수치계산을 위해 만들어진 라이브러리로 데이터 분석에 많이 활용됨 Data_set = numpy.loadtxt("C:/juno1412-1/DL/모두의 딥러닝/dataset/ThoraricSurgery.csv", delimiter=",") Data_set 임시저장소 만들기. loadtxt() 함수로 csv 데이터셋 불러오기 ThoraricSurgery.csv 데이터셋 살펴보기 shape = (470, 18) #470 rows, 1.. 2022. 4. 11.
추천시스템 content based filtering 콘텐츠기반 추천시스템 Content based filtering 콘텐츠기반 필터링은 사용자가 특정 상품을 선호하는 경우, 사용자 선호도를 기반으로 유사한 콘텐츠를 제안하는 추천시스템. 추천콘텐츠 = '영화' 특정 항목(태그) = 장르, 감독, 배우, 줄거리, 개봉년도, 평점 등 추천방식 = 특정 항목(태그)를 좋아하면, 비슷한 유사도를 가진 콘텐츠 추천 TF-IDF 단어사용비도를 이용한 단어마다 중요정도에 가중치를 주는 방법 TF = 특정문서(d)에서 특정단어(t)가 등장하는 횟수, IDF = dt(t가 등장한 문서의 수)에 반비례하는 수 특정영화 정보, 유사도 찾아내기 유사도 분석 = Cosine similarity 장점 - 사용자가 선호한 특정정보만으로 콘텐츠 추천 가능 - 추천할 수 있는 아이템이 .. 2022. 4. 8.
모르는 용어 정리 Mosskito MQTT Telegraf influxDB Garapana Mosskito : Mock은 진짜 객체처럼 동작하나 프로그래머가 직접 컨트롤 할 수 있는 객체 : Mock 객체를 만들고 검증하는 방법을 제공하는 프레임워크 MQTT : M2M, IOT를 위한 프로토콜, 최소한의 전력/패킷량으로 통신하는 프로토콜. 모바일 어플리케이션 통신에 매우 적합한 프로토콜이다 Telegraf GO(구글 언어)로 쓰여진 agent로 수집, 처리, 메트릭에 사용됨. 서버의 상태 cpu, memory, disk, db등 다양한 정보를 influxdb로 보내서 grafana에 그래프를 그릴 수 있도록 한다. influxDB 많은 쓰기 작업, 쿼리부하르 처리하기 위한 Time Series Database(시계열 데이터베이스)로 Tick Stack(Telegraf + InfluxDB + C.. 2022. 4. 5.
반응형