본문 바로가기

주홍의 프로젝트/연습 프로젝트7

추천시스템의 고질적 단점 cold start 개요, 해결방법 추천시스템의 단점 cold start란? Cold Start란 추천시스템이 새롭게 들어온 유저(고객)이나 특정 컨셉(매니악한)을 가진 유저(고객)에 대한 정보가 충분하지 않아 적절한 상품을 추천해주지 못하는 문제를 말합니다. 시중의 스트리밍, e-커머스 등 서비스에 가입 시 기록된 유저의 정보(선호장르, 성별, 나이 등)나 사전 설문조사를 통해 사용자의 정보와 특성을 파악합니다. 이렇게 수집된 유저 정보를 바탕으로 여러가지 래퍼런스 특성들과 비교하여 추천해줄 수 있습니다. 래퍼런스 특성이란 아이템 특성과 사용자 특성으로 나눌 수 있습니다. 래퍼런스 특성을 바탕으로 Content_based filtering(콘텐츠 기반 추천)과 Collborative filtering(협업필터링 기반 추천)을 이용하여 유.. 2022. 7. 13.
surprise 라이브러리 알고리즘 정리 surprise library surprise library는 python 언어에 기반하여 추천시스템 구현에 특화된 라이브러리 입니다. scikit-learn API와 비슷한 형태로 제공하는 라이브러리이기도 합니다. Surprise library process : [data loading → model set & train → predict & test] 1) data loading surprise library를 제작할 때, movielens라는 open DataSet을 이용하여 만들어진 추천시스템입니다. 그러므로 movielens의 format과 같은 'user - item - rating'의 순서에 맞추어 동일하게 맞추어야 라이브러리가 작동하게 됩니다 2) model set & train surpr.. 2022. 7. 4.
surprise 라이브러리 algorithm 정리 surprise library surprise library는 python 언어에 기반하여 추천시스템 구현에 특화된 라이브러리 입니다. scikit-learn API와 비슷한 형태로 제공하는 라이브러리이기도 합니다. Surprise library process : [data loading → model set & train → predict & test] 1) data loading surprise library를 제작할 때, movielens라는 open DataSet을 이용하여 만들어진 추천시스템입니다. 그러므로 movielens의 format과 같은 'user - item - rating'의 순서에 맞추어 동일하게 맞추어야 라이브러리가 작동하게 됩니다 2) model set & train surpr.. 2022. 6. 29.
추천 시스템 정리 ③추천 시스템 사용자가 관심을 가질만한 아이템, 정보를 제공해주는 시스템입니다. 명시적데이터, 암시적 데이터를 이용하여 사용자의 취향, 욕구, 니즈에 맞는 선택지를 제공하는 시스템입니다. 사용데이터 명시적 데이터(Explicit data = Explicit Feedback) 암시적 데이터(Implicit data = Implicit Feedback) 아이템에 대한 사용자의 선호도를 직접적으로 알 수 있는 data - 사용자 평가 데이터 ex) 1점 ~ 5점, 별점 - 사용자 긍정 / 부정 데이터(좋아요, 보통, 싫어요) - 직관적, 사용자 직접평가, 데이터 수집이 힘듬 사용자의 아이템 소비를 기록한 데이터 - 평가, 긍정/부정의 구분이 없음 - 직관적으로 알 수 없는 경우에 사용 - 최근 추천 알고리즘들.. 2022. 6. 29.
Neural Network Embedding Recommendation System (kaggle) review Neural Network Embedding Recommendation System Neural Network Embedding Recommendation System은 wikipedia에 있는 책의 정보와 위키피디아 내용의 다른 책들의 링크를 Embedding하여 Cosine Similarity로 유사한 책을 추천하는 추천시스템입니다. Neural Network Embedding Recommendation System은 Neural Network Embedding을 사용하여 책에 관한 모든 wikipedia article을 사용하는 책 추천 시스템을 만드는 것입니다. 추천 시스템은 유사한 wikipedia page로 연결되는 책들이 비슷하다는 생각을 바탕으로 만들어집니다. 신경망을 이용해 book, w.. 2022. 6. 23.
사용자기반 협업 필터링 추천시스템 - 애니메이션 추천시스템 사용자기반 협업 필터링(userbased collaborative filltering) 1. 협업 필터링: 사람들의 행동 기록을 분석하다 ‘협업 필터링’이란 특정 집단에서 발생하는 ‘유사한 사용행동’을 파악하여, 비슷한 성향의 사람들에게 아이템을 추천하는 기술이다. 협업 필터링은 성향이 비슷하면, 선호하는 것도 비슷할 것이라는 가정을 전제로 한다. 협업 필터링은 사용자 기반 협업 필터링(User-based CF), 아이템 기반 협업 필터링(Item-based CF)으로 구분된다. 사용자 기반 협업 필터링 나와 성향이 비슷한 사람들이 사용한 아이템을 추천해 주는 방식이다. 예를 들어, 사용자 A가 온라인 몰에서 선크림과 튜브, 그리고 수영복 함께 구매하고, 또 다른 사용자 B는 선크림과 튜브를 구매했다고 .. 2022. 6. 22.
netflix recommendation system - user collaborative filtering 영화 추천 시스템 넷플릭스 추천시스템 - 사용자기반 협업 필터링 이용 데이터 : netflix pizza data kaggle에 있는 netflix pizza data를 이용하여 추천시스템을 제작 연습을 해보았습니다. https://www.kaggle.com/datasets/netflix-inc/netflix-prize-data Netflix Prize data Dataset from Netflix's competition to improve their reccommendation algorithm www.kaggle.com 1. 라이브러리 설정 # 라이브러리 설정 import pandas as pd import numpy as np import math import re import matplotlib.. 2022. 6. 21.
반응형