추천 엔진 도입 효과 및 작동 원리

작성자: Admin | Oct 17, 2021 4:00:00 PM

요즘 추천 엔진을 사용하지 않는 브랜드는 거의 없다. 실제로 넷플릭스(Netflix), 아마존(Amazon), 구글(Google) 및 글로벌 도서 리뷰 사이트 굿리즈(Goodreads)를 포함하여 우리가 매일 사용하는 사이트들은 모두 추천 엔진을 적극 활용하고 있다. 아마존 구매의 35%는 상품 추천을 통해 이루어진다. 추천 엔진이란 무엇이며, 어떤 효과가 있고, 어떻게 작동하는지 알아보자.

추천 엔진이란 무엇인가 ? 추천 엔진은 머신러닝 알고리즘을 사용하여 특정 사용자나 고객에게 가장 관련성이 높은 아이템을 추천하는 일종의 데이터 필터링 도구이다. 암시적 또는 명시적으로 수집할 수 있는 소비자 행동 데이터에서 패턴을 찾는 것이 그 기본 원리라고 할 수 있다. 넷플릭스는 추천 엔진을 사용하여 시청자에게 영화 또는 다양한 콘텐츠 프로그램을 제안하고, 아마존은 추천 엔진을 사용하여 고객에게 맞는 상품을 추천한다. 두 회사의 추천 엔진 활용 방식은 조금 다르지만, 판매 진작, 참여도 및 유지율 향상, 보다 개인화된 고객 경험 제공이라는 목표는 동일하다. 과거에는 매장 직원이나 친구, 가족 등 지인으로부터 추천을 받았다. 오늘날은 이 역할이 알고리즘에게로 넘어간 것이다. 알고리즘은 마케팅 도구로서 상향 판매 및 교차 판매 기술에 능하도록 잘 훈련되어 있다고 할 수 있다.

추천 엔진의 종류 추천 엔진에는 크게 협업 필터링, 콘텐츠 기반 필터링, 그리고 이 둘의 혼합 버전인 하이브리드의 세 가지 종류가 있다.

1. 협업 필터링 (Collaborative filtering) 협업 필터링은 사용자 행동, 활동 및 선호도에 대한 데이터를 수집 및 분석하여 다른 사용자와의 유사성을 기반으로 어떤 사람이 무엇을 좋아할지 예측하는 데 중점을 준다. 이러한 유사성을 구성하고 계산하기 위해 협업 필터링은 매트릭스, 즉 행렬 스타일 공식을 사용한다. 협업 필터링의 장점은 상품, 영화, 책 등에 해당하는 콘텐츠를 분석하거나 이해할 필요가 없다는 점이다. 심플하게 사용자에 대해 알고 있는 정보만을 토대로 추천할 항목을 선정한다.

2. 콘텐츠 기반 필터링 (Content-based filtering) 콘텐츠 기반 필터링은 특정 아이템이 마음에 들면 다른 아이템도 좋아할 것이라는 원리에서 작동한다. 알고리즘이 추천을 하기 위해 고객의 선호도 프로필과 아이템에 대한 설명(장르, 상품 유형, 색상, 단어 길이)을 대상으로 코사인 및 유클리드 거리 법칙을 적용하여 아이템들 간의 유사성을 계산한다. 콘텐츠 기반 필터링의 단점은 이미 구매했거나 사용하고 있는 것과 유사한 상품이나 콘텐츠만 추천하게 된다는 것이다. 그 이상의 다른 유형 상품이나 콘텐츠를 추천할 수 없다. 예를 들어, 어떤 고객이 가정용품만 구매했었다면 가정용품 이외의 제품을 추천할 수 없다.

3. 하이브리드 모델 (Hybrid model) 하이브리드 추천 엔진은 메타(협업) 데이터와 트랜잭션(콘텐츠 기반) 데이터를 모두 활용한다. 이 때문에 두 모델 모두를 능가하는 성능을 낸다. 하이브리드 추천 엔진에서는 상품이나 아이템(영화, 노래)별로 자연어 처리 태그를 생성할 수 있고, 상품 간의 유사성을 계산하기 위한 벡터 방정식을 사용할 수 있다. 그런 다음 협업 필터링 매트릭스를 사용하여 사용자의 행동, 활동 및 선호도에 따라 아이템을 추천할 수 있다. 넷플릭스가 하이브리드 추천 엔진의 완벽한 예라고 할 수 있다. 사용자의 관심사(협업)와 영화 또는 TV 프로그램에 대한 소개나 설명(콘텐츠 기반)을 모두 고려한다.

추천 엔진 작동 원리 추천 엔진은 데이터와 머신러닝 기술의 조합으로 작동한다. 특히 데이터는 패턴이 파생되는 핵심 구성 요소이기 때문에 추천 엔진 개발에서 매우 중요하다. 추천 엔진에 데이터가 많으면 많을수록 더 관련성 높은 제안을 효과적으로 구현하여 높은 수익 창출을 기대할 수 있다. 추천 엔진은 보통 4단계 프로세스로 작동한다:

1 단계 : 데이터 수집 추천 엔진을 만드는 첫 번째이자 가장 중요한 단계는 데이터를 수집하는 것이다. 수집할 데이터에는 크게 두 가지 유형이 있다.

암시적 데이터: 웹 검색 기록, 클릭, 장바구니 이벤트, 검색 로그 및 주문 기록과 같은 사용자의 활동에서 수집된 정보를 의미한다.
명시적 데이터: 리뷰 및 평가, 좋아요 또는 싫어요, 제품에 대한 언급과 같은 고객 입력에서 수집된 정보를 의미한다.

추천 엔진은 또한 인구통계(나이, 성별), 심리 통계(관심사, 가치관)와 같은 고객 속성 데이터를 사용하여 유사한 고객을 식별하고, 기능 데이터(장르, 항목 유형)를 사용하여 제품의 유사성을 식별한다.

2 단계 : 데이터 저장 데이터를 수집했다면 저장해야 한다. 시간이 지나면서 수집되는 데이터의 양이 방대해질 것이다. 따라서 확장 가능하고 충분한 규모의 저장소, 즉 스토리지를 구비해야 한다. 수집하는 데이터의 유형에 따라 다양한 형태의 스토리지를 사용할 수 있다.

3 단계 : 데이터 분석 데이터를 사용하려면 깊이 파고들어 철저히 분석해야 한다. 데이터를 분석하는 데는 다음과 같은 여러 방법이 있다:

실시간 분석: 데이터가 생성되는 대로 바로바로 처리한다.
일괄 분석: 데이터를 주기적으로 처리한다.
실시간에 가까운 분석: 데이터를 즉시 필요로 하지 않을 경우 초 단위가 아닌 분 단위로 처리한다.

4 단계 : 데이터 필터링 추천 엔진 작동의 마지막 단계는 필터링이다. 협업, 콘텐츠 기반 또는 하이브리드 모델 중 어떤 추천 필터링이 사용되는지 여부에 따라 다양한 매트릭스 또는 수학적 규칙 및 공식이 데이터에 적용된다. 이 필터링의 결과가 최종사용자 또는 고객들에게 제공될 추천이 된다. 추천 엔진은 수익, 클릭률, 전환 및 고객 만족도를 높일 수 있는 강력한 마케팅 도구이다. 그 작동 원리를 제대로 이용하고 기업에 맞게 적용함으로써 매출 및 수익의 증대를 기대할 수 있다.

* 머신러닝과 추천 엔진 기술을 사용하여 상향 판매, 교차 판매 및 비즈니스 성장을 촉진하는 방법에 대해 자세히 알아보고자 하시면, 문의를 남겨주세요. 맞춤 상담을 제공해드립니다.

전체 게시물 보기