카테고리 없음

[삼성 SDS Brightics #21] 브라이틱스 서포터즈 개인 프로젝트 (마지막 블로그 ㅠ-ㅠ)

song2001 2021. 10. 26. 21:36

 

안녕하세요~

 

오늘은 브라이틱스 서포터즈 활동이 끝나기 전 마지막 블로그입니다!

 

서포터즈 발대식이 엊그제 같은데

벌써 끝난다니 실감이 안 나요 ㅠ-ㅠ

오늘 블로그는 약 10주 동안 진행된 개인 프로젝트에 대해서

얘기해 보려고 합니다!

 

우선 제 주제는 여러번 바뀌었었는데요,

처음엔 캐글에 있던 대회의 주제 그대로 진행하려 했으나,

데이터 전처리 작업하면서

제가 좀 더 관심 있을 법만 할 주제로 정했어요

 

그래서 제 새로운 주제는:

브라이틱스를 통해

Instacart (배달 어플)의 판매내역 데이터로

예측 (predictive) 분석과

처방 (prescriptive) 분석을 진행한다.

입니다

 

1번의 예측분석은:

브라이틱스의 Association Rule 함수를 사용하여

고객이 같은 장바구니에 구매한 상품들의 연관성을 알아보고

이를 통해 고객이 어떤 상품을 구매할 것인지 예측한다

 

2번의 처방분석은:

브라이틱스의 ALS 함수를 사용하여

고객의 상품 평점 데이터를 통해 각 고객에게 맞춤형 상품 추천해 준다

 

그리고 이건 제 모델입니다!

 

 

 

뭔가 엄청 복잡해 보이지만

join 함수를 기준으로 왼쪽에 있는 함수 10개 정도는 데이터 로드, 전처리 한 작업이고

나머지는 Association Rule, ALS 함수를 사용한 모델링 부분이에요

 

오늘 블로그에서는

예측분석과 처방분석에서 가장 흥미로웠던 발견 각각 한 개씩

보여드릴게요!

 

1. 유아 용품과 알코올

 

월마트가 발견한 nappies (기저귀)와 맥주의 연관성은 과연 진짜일까?

 

1990년대에 월마트가

금요일 저녁 5시에서 7시 사이 기저귀 심부름을 하러 마트에 온 아빠들이

집에서 마실 맥주도 사간다

라는 발견을 한 뒤

많은 매장들이 맥주와 기저귀를 가까운 진열대에 놓기 시작했대요

 

하지만 어떤 매장은 기저귀와 맥주를 옆에 놔도 매출의 증가가 전혀 없었다고 하는데요,

Instacart의 구매내역엔 유아 용품과 알코올의 관계가 있는지 알아봤습니다

 

브라이틱스 Filter 함수로

alcohol 과 babies department인 상품만 유지하고,

시간은 금요일 저녁 5시에서 10시 사이로 설정했습니다

 

 

 

그 결과!!

 

 

 

 

알코올과 유아 용품의 연관성의 거의 없어요!

 

사진에서는 희미하지만 baby accessories 와 spirits 가 서로 화살표로 가리키고 있는데

화살표 색깔이 너무 옅어서 lift 가 minimum인 1을 아주 조금만 넘는다는 뜻인 것 같아요

 

사실 월마트에서 발견한 연관성은 실제 매장에서 구매할 경우이지만,

instacart는 배달 앱이라서

충동구매도 덜하고 아마 아빠들이 대신 주문한다기보단

엄마가 필요할 때 기저귀를 바로 주문할 것 같긴 해요.

 

5~7시가 아닌 사이에도 큰 연관성은 없고, 오히려 lift 가 1 이하인 경우

(-의 영향인 경우)가

대다수였어요

 

2. 추천 템 1순위 = 간식

 

저번에는 filter 없이 평점 데이터로

ALS Recommend를 바로 진행했지만

이번엔 household, alcohol, babies, pets를 제외하고 진행했어요

 

그 이유는 술 안 마시는 사람, 아이/반려동물이 없는 사람이 있을 수도 있고,

household는 conversion rate 이 다른 아이템에 비해 낮은 편이라

추천을 해줘도 안살 것 같았어요.

 

그래서 ALS Recommend를 실행한 결과

 

가장 많이 추천하는 아이템 1순위는 간식이 나왔습니다

 

예를 들어 유저가 빵을 구매한 경우 뜬금없이 소주를 추천하는 것보단

허니버터칩이 나을 것 같아요

 

제 평점 데이터는 장바구니에 담은 수가 높을수록 더 높은 평점을 주는

implicit에서 explicit으로 만들어버린 데이터라,

실제로 추천해서 좋아하지 않을 것 같은 카테고리는 지웠어요

 

자 이렇게 마지막 블로그가 마무리 되었네요!

이제는 보고서를 작성해서 내는 작업만 남았어요

 

 

브라이틱스 사용법, 서포터즈 지원 등등 궁금한 거 있으면

블로그에 댓글이나 쪽지 보내주세요!

질문은 언제든 환영입니다 ~.~