본문 바로가기

머신러닝딥러닝40

구글 AI프레임워크 MediaPipe(미디어파이프)란? Mediapipe란? MediaPipe란 구글에서 제공하는 AI Framework이다. 비디오형식 데이터를 이용한 다양한 비전 AI 기능을 파이프라인 형태로 손쉽게 사용할 수 있도록 제공되는 프레임워크이다. 인체를 대상으로 하는 detect(인식)에 대해서 얼굴인식, 포즈, 객체감지, 모션트레킹 등 다양한 형태의 기능과 모델을 제공하는 프레임워크로, python 이외에도 여러 프로그램언어와 환경에서 사용하기 편리한 라이브러리 형태로 제공된다. AI모델개발 및 여러 데이터셋을 이용한 학습이 완료된 상태로 제공되는 프레임워크이므로, 라이브러리를 불러 사용하듯 mediapipe 설치이후, 간단하게 기능을 호출하여 사용하면 되는 형태로 비전 AI 기능을 개발할 수 있다. Mediapipe의 장점 - 저스펙으로 .. 2023. 1. 13.
linux ubuntu 18.04에 mediapipe build 실행하기 MediaPipe 란? 개발 환경 ubuntu : 18.04 python : 3.7.12 opencv : 4.6.0 mediapipe : 0.8.3 ubuntu에 미디어파이프 환경 build 하기 1. ubuntu package upgrade ~$ sudo apt-get update ~$ sudo apt-get upgrade 2. MediaPipe git download ~$ git clone https://github.com/google/mediapipe.git ~$ git clone https://github.com/google/mediapipe.git mediapipe git을 통째로 가져온다. 3. 컴파일러 설치 - c++ 컴파일러 설치하기 sudo apt install g++ unzip zip .. 2023. 1. 13.
[딥러닝] 심층신경망 은닉층 패션아이템 분류 - 혼자공부하는 딥러닝 심층신경망 2개 이상의 층을 포함한 신경망, 2개 이상의 층을 가지고 있는 Multi-Layer Perceptron이라고 말합니다. 다층 인공신경망, 심층신경망, 딥러닝과 같은 의미로 부르기도 합니다. 은닉층(Hidden Layer) 입력층(Input Layer)과 출력층(Output Layer) 사이에 밀집층이 추가된 것으로 입력층과 출력층 사이에 있는 모든층을 은닉층이라고 부릅니다. 활성화 함수(Activation Function) 신경망의 은닉층에 Activation Function을 사용하는 이유는 은닉층에서 선형(linear) 산술 계산만 수행하지 않고 비선형적인 계산을 위해 activation Function으로 sigmoid, Relu, tanh 등 여러 activation 함수를 이용하여 .. 2022. 12. 1.
[Python] Count Vectorizer & TFIDFvectorizer 자연어처리 - 자연어 벡터로 바꾸기 scikit-learn library를 이용하여 자연어 처리를 할 수 있는 대표적인 class인 Count Vectorizer와 TFIDFvectorizer를 알아보고자 한다. scikit-learn의 서브패키지 중 feature_extraction과 feature_extraction.text라는 문서 전처리용 클래스를 제공하고 있다. DicVectorizer 단어의 수를 세어놓은 사전에서 BOW 인코딩 벡터를 만든다 CountVectorizer 모든 문서의 단어 토큰을 생성하고 각 단어의 수를 세어 BOW 인코딩 벡터를 만든다 TFIDFVectorizer CountVectorizer와 비슷하나 TF-IDF 방식으로 단어의 가중치를 조절하여, 문서 구별능력이 뛰어난 단어에게 큰 가중치를 문서구별능력이 떨.. 2022. 11. 30.
[딥러닝] 인공신경망 패션아이템 분류 - 혼자공부하는 딥러닝 패션 MNIST 머신러닝/딥러닝을 배울 때 많이 사용되는 데이터 셋으로 보통 0~9로 숫자로 이루어진 MNIST가 가장 유명하다. 패션 MNIST는 MNIST와 개수가 동일하지만 패션아이템으로 이루어진 데이터가 패션 MNIST이다. tensorflow / keras Tensorflow는 구글이 2015년 11월에 오픈소스로 공개한 딥러닝 라이브러리이다. 이때를 기점으로 딥러닝에 대한 관심이 높아지고 2016년 3월 알파고가 이세돌 9단을 이겨 대중에 알려지며 인기가 폭발적으로 상승하였다. Tensorflow는 발전을 계속하면서 2019년 2.0버전이 릴리스되었으며, 혼공머신은 2.x버전을 사용합니다. Keras는 Tensorflow의 고수준 API로 프랑소와 숄레가 만든 딥러닝 라이브러리이다. 딥러닝 라.. 2022. 11. 30.
코사인 유사도(Cosine Similarity)vs 유클라디안 유사도(Euclidean Similarity)vs 자카드 유사도(Jaccard Similarity) 유사도란? Similairy 유사도란 상품 A와 상품 B라는 2개의 상품이 있을 때, 2가지 상품이 서로 얼마나 유사한지를 숫자로 표현한 값을 말한다. 유사도 측정방법에는 유클라디안 유사도(Euclidean Similarity), 코사인유사도(Cosine Similarity), 자카드 유사도(Jaccard Similarity), 맨하튼 거리(Manhattan distance), 피어슨 상관계수(Pearson Correlation Coefficient) 등 여러방법이 있다. 이번 포스팅에서는 코사인 유사도(Cosine Similarity), 유클라디안 유사도(Euclidean Similarity), 자카드 유사도(Jaccard Similarity)를 알아보고자 한다. 자카드 유사도(Jaccard Simil.. 2022. 11. 28.
t-SNE vs UMAP 차원 축소 알고리즘 알아보기 차원 축소 알고리즘 차원 축소 알고리즘은 matrix factorization과 neightbor graph 2가지로 나눌 수 있는데, t-SNE와 UMAP은 neighbor graph에 해당합니다. PCA matrix factorization 을 base 로 함 (공분산 행렬에 대해서 svd 등) 분산이 최대인 축을 찾고, 이 축과 직교이면서 분산이 최대인 두번째 축을 찾아 투영시키는 방식(공분산 행렬의 고유값과 고유벡터를 구하여 산출) 단점 : 선형 방식으로 정사영하면서 차원의 축소 -> 군집된 데이터들이 뭉게지는 단점 t-SNE : t-distributed Stochastic Neighbor Embedding t-SNE는 데이터의 manifold를 잘 학습하여 데이터의 차원을 축소하거나 의미있는 특.. 2022. 6. 27.
딥러닝(Deep Learning) #16 - RNN & CNN CNN&RNN LSTM & CNN 조합으로 영화리뷰 분류하기 DATA = IMDB(영화 관련 정보, 출연진, 개봉, 후기, 평점 등 영화 데이터 25,000여개 저장) 1. 라이브러리 설정 # 라이브러리 설정하기 from tensorflow.keras.preprocessing import sequence from tensorflow.keras.models import Sequential from tensorflow.keras.datasets import imdb from tensorflow.keras.layers import Dense, Dropout, Activation from tensorflow.keras.layers import Embedding from tensorflow.keras.layers.. 2022. 4. 17.
딥러닝(Deep Learning) #15 - RNN 순환신경망(Recurrent Neural Network, RNN) 순환신경망은 여러개의 데이터가 순차적으로 입력되었을 때, 앞서 입력받은 데이터를 잠시 기억해 놓는 방법을 사용한다. 기억된 데이터가 얼마나 중요한지 판단하여 가중치를 준 뒤, 다음 데이터로 넘어간다. 모든 입력 값에 기억, 판단, 가중치 부여 작업을 실행함으로 같은 층 안에서 계속 맴도는 성질 때문에 순환신경망이라고 부른다. RNN의 문제점 1. RNN은 LSTM(Long Short Term Memory)방법과 함께 가장 많이 사용되고 있다. LSTM(Long Short Term Memory) RNN의 한 종류로, 긴 의존기간을 필요로 하는 학습을 수행할 능력을 갖추고 있음. LSTM 구동순서 1. CELL STATE Linear inte.. 2022. 4. 15.
반응형