google-site-verification=tiTpc7g9EFArxomgX7IqEflz-fp4nI0F2jLaMkFLPoQ LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 126

상세 컨텐츠

본문 제목

LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 126

카테고리 없음

by 홍승민경영컨설팅(주) 2024. 11. 22. 10:09

본문

다양한 데이터를 기반으로 따라 하면 성공하는 다중회귀 판매예측 방법

 

 

각 변수별 회귀식과 잔차간 자기상관

다음으로 각 변수별 회귀식을 통해 (단순회귀) 자기상관이 가장 적은 변수를 확인 하겠습니다.

종속변수는 역시 판매숫자 이고 독립변수는 단순회귀 이니 광고비용, 영업사원능력, 영업직원 숫자입니다. 그리고 그 결과는 ‘자기상관결과2’ 와 같습니다. 자세한 내용은 첨부 파일을 참조 부탁드립니다.

먼저 각 회귀식별 p 값이 0.05 미만으로 다 사용가능합니다.

하지만 잔차와 직전잔차를 이용해서 상관을 돌리면 다음과 같습니다.

항목 판매숫자-광고 판매숫자-사원능력 판매숫자-사원숫자
잔차-직전잔차상관 0.92 0.79 0.25

 

즉 각 변수별 회귀식을 돌린결과 다 사용가능하다 판단이 되지만 자기상관을 돌려니 가능한 것은 판매숫자-사원숫자만 사용 가능합니다. 그리고 이 데이터는 다중회귀 그러니까 광고,사원능력,사원숫자모두 넣고 돌릴수 없는 데이터입니다.

 

반면 이러한 어려움 없이 아리마(AIRMA) 모델을 쓰면 해결 가능합니다. 아리마 모델을 엑셀에서도 돌릴수는 있습니다. 순서는 1.차분을 구하고 2.차분에 대해 자기 회귀를 구하고 3.오차항을 가지고 이동평균을 구한다음 이때 AR 값하고 MA 값을 적합하게 가정해서 구합니다. 해찾기를 추천드립니다. 4. 새로운 열에 Forecast를 만들고 AR,MA 값을 이용해서 계산 합니다. 5.다시 오차를 계산하고 6. MA를 업데이트 하면 끝.

말도 어렵지만 엑셀에서 직업 아리마 모델 돌리는건 무지 어렵습니다. 그냥 파이썬으로 아리마 모델 하는 것을 추천 합니다. 그리고 아리마 모델 자체가 고급 통계 기법이니 이 책에서는 다루지 않겠습니다.

 

다중공선성과 제거 그리고 상관분석

 

다중공선성에 뜻은 데이터의 경향성이 서로 유사하다는 것입니다. 회귀식에서 각 독립변수가 서로 상관관계가 높으면 규칙적으로 변하게 됩니다. 이런것들은 예측력을 해치는 것이죠.

 

위 예시를 보면, 광고를 많이 하면 당연히 많이 팔립니다. 그리고 영업사원 능력이 높으면 또 많이 팔리겠죠 그리고 영업직원 숫자도 그렇습니다. 여기에 또 상권점수가 높으면 그럼 또 많이 팔릴것이고 마지막으로 해당 점포에 고객만족도가 높으면 당연히 많이 팔릴것입니다. 이거 하나마나 한 이야기죠 하지만 우리는 여기에서 어떤 변수가 가장 중요한지를 알아야 하고 이런 결과를 통해 해당 매장의 판매숫자를 예측해야만 효과적인 자원분배를 할 수 있습니다. 즉 마케팅의 기본 개념이 성립되는 것입니다.

 

근데, 어쩌면 이 중에 어떤 컬럼과 어떤 컬럼은 증가하는 방향성과 줄어드는 방향성이 일치할 것입니다. 즉 각 독립변수별 상관이 높으면 발생하는 것이 다중공선성입니다. 그리고 이러한 상관을 제거하는 방법은 앞서서 연습한 상관있는 변수들을 사용하지 않는 것이 일반적입니다. 하지만 다중공선성을 확인하고 좀 더 정밀한 방법이 다중공선성 제거입니다.

 

방법은 의외로 간단합니다.

상관성 파악 -> 독립변수별 회귀식 진행 및 VIF 계산 -> 독립변수 우선순위 제거 또는 결합-> 회귀식 다시 진행 -> 끝

 

다음 시간에는 상관분석을 통한 상관계수로부터 다중공선성 확인하는 방법에 대해 다루어보겠습니다.

.

.

.

생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!

 

728x90