[삼성 SDS Brightics #17-1] Brightics 로 추천 알고리즘 사용하기!
안녕하세요~
다들 추석 잘 보내셨나요?
저는 토요일날 ProDs 자격증 Associate Level 을 보고왔습니다!
후기는 아래 블로그를 참고해주세요!
아무튼 이번 블로그도
개인프로젝트로 돌아왔습니다
우선 여태까지 한 분석은
데이터 업로드 -> 전처리 -> EDA -> 연관성분석 함수
입니다.
오늘은 이중에서도 Brightics 의 연관성분석 함수에 대해
다뤄보도록 하겠습니다~
우선 Brightics 의 우측 팔레트에 가면
추천 관련 함수가 있습니다
제가 오늘 다룰 함수는 연관성분석 관련 함수인
Association Rule 과 Association Rule Visualization입니다~
Association Rule 함수에는 설정이 엄청 많은데
저는
Input Type: Multiple Items
Item Columns: user_id 제외 전부 다
Min Support: 0.04
Min Confidence: 0.03
으로 설정했습니다~
Min Support 와 Min Confidence는 원하는값을 적으면 되는데
처음에 Min Support 를 0.1로 했더니
빈 table이 나와서
연관성이 없다고 나와서
0.07으로 했더니
row 가한줄만 나오더라고요
이런식으로 조금씩 줄여가면서 적당한 연관성이 있을때까지
Min Support를 줄였습니다!
그 다음엔 Query Executor 함수와 Filter 함수를 사용해서
consequent 에 값이 한개만 나올 수 있도록 설정해주었고,
그 값이 reordered만 나오게 설정했습니다.
이 프로세스를 끝내면 148 row에서 51로 줄었다는걸
확인할 수 있습니다!
그 다음은 Association Rule Visualization함수를 이용해
앞에서 했던 연관성 분석을 시각화 해주었습니다
Figure Size, Edge Length, Node Size, Font Size 등등
자신이 원하는 모습의 그래프를 볼 수 있습니다!
이 그래프에서 알 수 있었던 점은
department: beverages 면 주로 reorder 를 하고
days since prior order 의 숫자가 높을수록 reorder 를 안하게 된다는걸
알 수 있었습니다!
하지만 이 그래프가 제가 예상했던 그래프와는 조금 달랐는데
antecedent에 product name 이 안나오고
department, aisle, days since prior order 등 다른 변수만 나오더라고요 ㅠㅠ
지난번에 EDA 하면서 network graph 로 확인했을때도 그랬었는데
혹시 너무 다양한 product가 있어서 그런걸까요..?
사진 삭제
사진 설명을 입력하세요.
예를들어 product id 209번과 886번 둘다 샐러드인데
제품명이 달라서 따로 분류되는 느낌이 들어요
약간 샐러드 1, 샐러드 2 이렇게 분류되는 느낌
이 문제를 어떻게 처리할지 다음주에 들고와볼게요!
안뇽..
[본 포스팅은 Brightics 서포터즈로서 직접 체험하고 작성한 리뷰입니다.]