본문 바로가기

전체 글134

추천시스템의 고질적 단점 cold start 개요, 해결방법 추천시스템의 단점 cold start란? Cold Start란 추천시스템이 새롭게 들어온 유저(고객)이나 특정 컨셉(매니악한)을 가진 유저(고객)에 대한 정보가 충분하지 않아 적절한 상품을 추천해주지 못하는 문제를 말합니다. 시중의 스트리밍, e-커머스 등 서비스에 가입 시 기록된 유저의 정보(선호장르, 성별, 나이 등)나 사전 설문조사를 통해 사용자의 정보와 특성을 파악합니다. 이렇게 수집된 유저 정보를 바탕으로 여러가지 래퍼런스 특성들과 비교하여 추천해줄 수 있습니다. 래퍼런스 특성이란 아이템 특성과 사용자 특성으로 나눌 수 있습니다. 래퍼런스 특성을 바탕으로 Content_based filtering(콘텐츠 기반 추천)과 Collborative filtering(협업필터링 기반 추천)을 이용하여 유.. 2022. 7. 13.
정보처리기사 실기 정리 #4 - 데이터 입출력 구현 2022년 정보처리기사 실기를 준비하면서 실기를 정리하면서 공부하려고 포스팅으로 정리해보고자 만들고 있습니다. 정보처리기사 실기시험 출제 경향 정보시스템 등의 개발 요구 사항을 이해하여 각 업무에 맞는 소프트웨어의 기능에 관한 설계, 구현 및 테스트를 수행에 필요한 지식을 함양합니다. 1. 현행 시스템 분석 및 요구사항 확인(소프트웨어 공학 기술의 요구사항 분석 기법 활용) 2. 데이터 입출력 구현(논리, 물리데이터베이스 설계, 조작 프로시저 등) 3. 통합 구현(소프트웨어와 연계 대상 모듈간의 특성 및 연계 모듈 구현 등) 4. 서버프로그램 구현(소프트웨어 개발 환경 구축, 형상 관리, 공통 모듈, 테스트 수행 등) 5. 인터페이스 구현(소프트웨어 공학 지식, 소프트웨어 인터페이스 설계, 기능 구현, .. 2022. 7. 7.
정보처리기사 실기 정리 #3 - 현행시스템 분석 및 요구사항 확인2(수학적산정기법 COCOMO/Putnam/기능점수 모형, 국제표준 ISO/IEC, CMMI, SPICE 2022년 정보처리기사 실기를 준비하면서 실기를 정리하면서 공부하려고 포스팅으로 정리해보고자 만들고 있습니다. 정보처리기사 실기시험 출제 경향 정보시스템 등의 개발 요구 사항을 이해하여 각 업무에 맞는 소프트웨어의 기능에 관한 설계, 구현 및 테스트를 수행에 필요한 지식을 함양합니다. 1. 현행 시스템 분석 및 요구사항 확인(소프트웨어 공학 기술의 요구사항 분석 기법 활용) 2. 데이터 입출력 구현(논리, 물리데이터베이스 설계, 조작 프로시저 등) 3. 통합 구현(소프트웨어와 연계 대상 모듈간의 특성 및 연계 모듈 구현 등) 4. 서버프로그램 구현(소프트웨어 개발 환경 구축, 형상 관리, 공통 모듈, 테스트 수행 등) 5. 인터페이스 구현(소프트웨어 공학 지식, 소프트웨어 인터페이스 설계, 기능 구현, .. 2022. 7. 5.
정보처리기사 실기 정리 #2 - 현행시스템 분석 및 요구사항 확인2(클래스/시퀀스/커뮤니케이션/상태 다이어그램, CASE, 방법론) 2022년 정보처리기사 실기를 준비하면서 실기를 정리하면서 공부하려고 포스팅으로 정리해보고자 만들고 있습니다. 정보처리기사 실기시험 출제 경향 정보시스템 등의 개발 요구 사항을 이해하여 각 업무에 맞는 소프트웨어의 기능에 관한 설계, 구현 및 테스트를 수행에 필요한 지식을 함양합니다. 1. 현행 시스템 분석 및 요구사항 확인(소프트웨어 공학 기술의 요구사항 분석 기법 활용) 2. 데이터 입출력 구현(논리, 물리데이터베이스 설계, 조작 프로시저 등) 3. 통합 구현(소프트웨어와 연계 대상 모듈간의 특성 및 연계 모듈 구현 등) 4. 서버프로그램 구현(소프트웨어 개발 환경 구축, 형상 관리, 공통 모듈, 테스트 수행 등) 5. 인터페이스 구현(소프트웨어 공학 지식, 소프트웨어 인터페이스 설계, 기능 구현, .. 2022. 7. 5.
surprise 라이브러리 알고리즘 정리 surprise library surprise library는 python 언어에 기반하여 추천시스템 구현에 특화된 라이브러리 입니다. scikit-learn API와 비슷한 형태로 제공하는 라이브러리이기도 합니다. Surprise library process : [data loading → model set & train → predict & test] 1) data loading surprise library를 제작할 때, movielens라는 open DataSet을 이용하여 만들어진 추천시스템입니다. 그러므로 movielens의 format과 같은 'user - item - rating'의 순서에 맞추어 동일하게 맞추어야 라이브러리가 작동하게 됩니다 2) model set & train surpr.. 2022. 7. 4.
정보처리기사 실기 정리 #1 - 현행시스템 분석 및 요구사항 확인1(요구분석기법/UML/에자일) 2022년 정보처리기사 실기를 준비하면서 실기를 정리하면서 공부하려고 포스팅으로 정리해보고자 만들고 있습니다. 정보처리기사 실기시험 출제 경향 정보시스템 등의 개발 요구 사항을 이해하여 각 업무에 맞는 소프트웨어의 기능에 관한 설계, 구현 및 테스트를 수행에 필요한 지식을 함양합니다. 1. 현행 시스템 분석 및 요구사항 확인(소프트웨어 공학 기술의 요구사항 분석 기법 활용) 2. 데이터 입출력 구현(논리, 물리데이터베이스 설계, 조작 프로시저 등) 3. 통합 구현(소프트웨어와 연계 대상 모듈간의 특성 및 연계 모듈 구현 등) 4. 서버프로그램 구현(소프트웨어 개발 환경 구축, 형상 관리, 공통 모듈, 테스트 수행 등) 5. 인터페이스 구현(소프트웨어 공학 지식, 소프트웨어 인터페이스 설계, 기능 구현, .. 2022. 7. 3.
surprise 라이브러리 algorithm 정리 surprise library surprise library는 python 언어에 기반하여 추천시스템 구현에 특화된 라이브러리 입니다. scikit-learn API와 비슷한 형태로 제공하는 라이브러리이기도 합니다. Surprise library process : [data loading → model set & train → predict & test] 1) data loading surprise library를 제작할 때, movielens라는 open DataSet을 이용하여 만들어진 추천시스템입니다. 그러므로 movielens의 format과 같은 'user - item - rating'의 순서에 맞추어 동일하게 맞추어야 라이브러리가 작동하게 됩니다 2) model set & train surpr.. 2022. 6. 29.
추천 시스템 정리 ③추천 시스템 사용자가 관심을 가질만한 아이템, 정보를 제공해주는 시스템입니다. 명시적데이터, 암시적 데이터를 이용하여 사용자의 취향, 욕구, 니즈에 맞는 선택지를 제공하는 시스템입니다. 사용데이터 명시적 데이터(Explicit data = Explicit Feedback) 암시적 데이터(Implicit data = Implicit Feedback) 아이템에 대한 사용자의 선호도를 직접적으로 알 수 있는 data - 사용자 평가 데이터 ex) 1점 ~ 5점, 별점 - 사용자 긍정 / 부정 데이터(좋아요, 보통, 싫어요) - 직관적, 사용자 직접평가, 데이터 수집이 힘듬 사용자의 아이템 소비를 기록한 데이터 - 평가, 긍정/부정의 구분이 없음 - 직관적으로 알 수 없는 경우에 사용 - 최근 추천 알고리즘들.. 2022. 6. 29.
t-SNE vs UMAP 차원 축소 알고리즘 알아보기 차원 축소 알고리즘 차원 축소 알고리즘은 matrix factorization과 neightbor graph 2가지로 나눌 수 있는데, t-SNE와 UMAP은 neighbor graph에 해당합니다. PCA matrix factorization 을 base 로 함 (공분산 행렬에 대해서 svd 등) 분산이 최대인 축을 찾고, 이 축과 직교이면서 분산이 최대인 두번째 축을 찾아 투영시키는 방식(공분산 행렬의 고유값과 고유벡터를 구하여 산출) 단점 : 선형 방식으로 정사영하면서 차원의 축소 -> 군집된 데이터들이 뭉게지는 단점 t-SNE : t-distributed Stochastic Neighbor Embedding t-SNE는 데이터의 manifold를 잘 학습하여 데이터의 차원을 축소하거나 의미있는 특.. 2022. 6. 27.
반응형