카테고리 없음

[삼성 SDS Brightics #17-1] Brightics 로 추천 알고리즘 사용하기!

song2001 2021. 9. 28. 23:37

 

 

 

안녕하세요~

다들 추석 잘 보내셨나요?

저는 토요일날 ProDs 자격증 Associate Level 을 보고왔습니다!

 

후기는 아래 블로그를 참고해주세요!


아무튼 이번 블로그도

개인프로젝트로 돌아왔습니다

 

우선 여태까지 한 분석은

데이터 업로드 -> 전처리 -> EDA -> 연관성분석 함수

입니다.

 

오늘은 이중에서도 Brightics 의 연관성분석 함수에 대해

다뤄보도록 하겠습니다~

 

 

 

 

 

우선 Brightics 의 우측 팔레트에 가면

추천 관련 함수가 있습니다

 

 

 

 

 

제가 오늘 다룰 함수는 연관성분석 관련 함수인

Association Rule  Association Rule Visualization입니다~

 

Association Rule 함수에는 설정이 엄청 많은데

저는

Input Type: Multiple Items

Item Columns: user_id 제외 전부 다

Min Support: 0.04

Min Confidence: 0.03

으로 설정했습니다~

 

 

 

Min Support 와 Min Confidence는 원하는값을 적으면 되는데

처음에 Min Support 를 0.1로 했더니

빈 table이 나와서

연관성이 없다고 나와서

0.07으로 했더니

row 가한줄만 나오더라고요

이런식으로 조금씩 줄여가면서 적당한 연관성이 있을때까지

Min Support를 줄였습니다!

 

그 다음엔 Query Executor 함수와 Filter 함수를 사용해서

 

consequent 에 값이 한개만 나올 수 있도록 설정해주었고,

그 값이 reordered만 나오게 설정했습니다.

 

 

 

 

 

 

이 프로세스를 끝내면 148 row에서 51로 줄었다는걸

확인할 수 있습니다!

 

그 다음은 Association Rule Visualization함수를 이용해

앞에서 했던 연관성 분석을 시각화 해주었습니다

 

 

 

 

Figure Size, Edge Length, Node Size, Font Size 등등

자신이 원하는 모습의 그래프를 볼 수 있습니다!

 

이 그래프에서 알 수 있었던 점은

department: beverages 면 주로 reorder 를 하고

days since prior order 의 숫자가 높을수록 reorder 를 안하게 된다는걸

알 수 있었습니다!

 

하지만 이 그래프가 제가 예상했던 그래프와는 조금 달랐는데

antecedent에 product name 이 안나오고

department, aisle, days since prior order 등 다른 변수만 나오더라고요 ㅠㅠ

 

지난번에 EDA 하면서 network graph 로 확인했을때도 그랬었는데

혹시 너무 다양한 product가 있어서 그런걸까요..?

 

사진 삭제

사진 설명을 입력하세요.

예를들어 product id 209번과 886번 둘다 샐러드인데

제품명이 달라서 따로 분류되는 느낌이 들어요

약간 샐러드 1, 샐러드 2 이렇게 분류되는 느낌

 

이 문제를 어떻게 처리할지 다음주에 들고와볼게요!

안뇽..

 


[본 포스팅은 Brightics 서포터즈로서 직접 체험하고 작성한 리뷰입니다.]