따라하면 성공하는 소비자 가치판단 기준 (컨조인트분석)
(앞선 글에 이어)
회귀식의 해석
우리가 지금 하는 것은 순위 소비자조사를 통해서 소비자들이 자기가 선호하는 순서대로 제품에 대해서 순위를 기록하고 그리고 각 선호 제품에 대해 하나씩 속성을 고르라고 했습니다.
그리고 범주형이다 보니 더미 처리를 위해 변수를 늘릴 수밖에 없었습니다. 마지막으로 순위를 종속변수로 하고 더미변수들을 독립변수로 해서 회귀식을 돌린 값입니다. 그 결과가 위에 이미지인데, 지금까지 배운 대로는 P 값이 0.05 이상이면 못 쓰는 것이라 했습니다. 그러면 먼저 디자인은 모두 못 써먹는 것입니다. 자세하게는 디자인을 항목을 독립변수로 순위를 종속변수로 하고 회귀식을 돌리고 P 값을 봐야 하지만, 이런 과정이 없더라도 이 수치들을 보면 아마 디자인 항목이 순위를 결정하는 데에 영향을 주지 않을 것입니다. 그래서 일단 디자인 항목은 모두 사용하지 못합니다. (‘회귀분석 수행(3)’ 시트 아래를 확인하시면, 디자인과 컬러는 사용 못 하는 것으로 결론이 나왔습니다.)
두 번째로 브랜드를 보면 브랜드 A는 0.09로 사용하지 못합니다. 하지만 고민해야 할 것은 0.1 가까운 이 숫자는 통계에서 해석하는 0.05~0.1 사이에 있습니다. 즉 통계적으로 의미가 없어 일반적으로 제거를 하지만 실무적 관점 그러니까 95% 신뢰수준에서는 의미 없지만 90% 수준에서는 의미가 있습니다. 물론 90% 수준은 통계적으로 사용하지 않는 것임은 맞습니다. 그래서 제가 실무적 관점이라는 이야기를 한 것입니다. 즉 브랜드A, B, C, D (D는 기준변수) 중 브랜드 A 가 다른 브랜드 보다 월등히 높은 숫자를 보여 주므로 의미가 있을 수도 있다는 것입니다. 그리고 첨부 데이터의 다른 회귀분석을 봐도 제 주장을 이해하실 수 있습니다.
세 번째로 가격을 보면 ‘가격 2’는 0.65로 매우 높습니다. 0.05 보다 무려 0.6이나 높습니다. 이건 선 넘었습니다. 그래서 빼야 합니다. 즉 가격 변수 범주가 1,2,3, 이 있는데 이때 우리는 가격 3을 기준으로 1, 2만 회귀식을 돌렸고 이때 가격2가 크게 의미가 없으니 가격2는 순위에 전혀 영향을 주지 않는 변수입니다. 이것은 빼고 가겠습니다.
네 번째로 무게를 보면 무게 4는 선 넘어서 제거, 다섯 번째 사이즈 4는 브랜드 A 와 같이 신중하게 결정해야 하는데 저는 사용하기로 결정했습니다.
이렇게 변수들을 넣고 빼면서 P 값을 보고 최종 분석을 마무리했습니다. 쉬트 ‘회귀분석 수행(5)’
이어지는 다음 포스팅에서는 컨조인트 분석을 진행하겠습니다.
(다음 포스팅에 이어서 계속)
.
.
.
생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!