google-site-verification=tiTpc7g9EFArxomgX7IqEflz-fp4nI0F2jLaMkFLPoQ LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 125

상세 컨텐츠

본문 제목

LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 125

카테고리 없음

by 홍승민경영컨설팅(주) 2024. 11. 21. 09:59

본문

다양한 데이터를 기반으로 따라 하면 성공하는 다중회귀 판매예측 방법

 

 

자기상관

자기상관이란 앞서 확인을 했던 상관관계에서 자기가 자기를 상관하는 것입니다? 오잉? 하실 것인데 쉽게 설명 드리겠습니다. 자기상관은 시계열 데이터 즉 시간의 흐름에 따라 변하는 데이터에서 쉽게 나타는 현상인데, 이러한 시간의 흐름의 각 데이터간 서로 서로 간섭을 하는 것입니다. 이런 것을 자기 상관이라고 합니다. 자기 상관이 있으면 도출된 함수식(회귀방정식)이 아무리 설명력이 높다고 하여도 해당 방정식 사용하지 못합니다. 왜냐하면 자기들끼리 서로 서로 영향을 주니 그걸 사용하면 안되고 그런 자기상관을 제거하고 사용해야 하는 것입니다. 구체적으로 회귀방정식을 통해서 나온 방정식을 실제 값하고의 차이를 분석하는 ‘잔차’ 기억나시나요? 우리가 회귀방정식을 구할 때 간단하게 클릭 한번으로 구하는 그 잔차 말입니다. 이 잔차를 가지고 잔차의 분포도를 보면 바로 자기 상관이 있는지 없는지 확인 가능합니다.

다음 예시 보겠습니다. 다음 데이터는 앞서서 분석한 데이터와 새로이 만든 데이터의 산점도 교입니다. 그리고 자기상관을 확인하기 위해 제가 자기상관이 높게 나오도록 데이터를 조정한 것입니다.

 

먼저, 분산형 차트를 보고 이게 자기상관이 있는지 없는지 확인하기 위해서는 차트를 그대로 복사해서 생성형에 붙여 넣고 물어보면 됩니다. 자기상관이 있는지 없는지

 

이것은 매우 간단한 것이므로 생성형 예시를 생략하겠습니다. 굳이 생성형을 사용하지 않아도 됩니다. 그리고 가끔 생성형이 거짓말을 하니 그냥 눈으로 하겠습니다.

‘광고비용’ 차트를 보면, 규칙성이 보이시나요? 저는 안보입니다. ‘우리제품 판매예측’ 차트를 봐도 역시 규칙성이 안보입니다. 하지만 아래 예시를 보면 한번 내려가면 다음에 내려가고 한번 올라가면 다음에 올라가는 규칙성이 있습니다. 즉 앞선 데이터가 뒤에 데이터에 영향을 주는 패턴이 있습니다. 이러한 패턴이 자기상관입니다. 자기상관은 주로 시계열데이터에서 자주 나온다고 말씀드렸습니다. 즉 이동평균법에서 자주 보이는 현상입니다. 하지만 회귀분석에도 자주 나오는 것이 자기상관입니다. 위 차트의 데이터를 보겠습니다.

 

데이터를 보니 패턴이 보이시나요? 관측수의 흐름 즉 시계열의 흐름에 따라 판매 숫자가 오르락 내리락 이게 반복되는 규칙성이 보입니다.

 

이제 이 상관을 줄이는 방법을 알아보겠습니다.

먼저, 판매숫자를 종속변수로 (우리가 알고 싶은 것) 독립변수를 ‘광고비용+영업사원능력+영업직원숫자’를 잡아서 회귀식을 돌립니다. 그럼 결과는 아래와 같습니다.

이제 도출된 회귀식을 가지고 실제 값과 비교해서 해석하는 잔차를 알아보면

여기까지는 자동으로 만들어 줍니다. 이제 실제 자기 상관이 있는지 없는지 알아야 합니다. 그러므로 이번 잔차와 직전 잔차간의 상관분석을 해서 0.4 이상이면 상관이 있다고 판단하겠습니다. 상관분석을 돌리기 앞서 직전 잔차를 추가하겠습니다.

 

직전잔차는 바로 직전의 잔차입니다. 자기가 자기랑 상관이 있는지 봐야 하니까 현재의 나와 과거의 나와 비교를 하는 것입니다. 이렇게 나온 데이터를 이제 상관계수를 만들어 보는데 이 때 데이터 분석을 이용해도 되지만 간단하게 함수식으로 됩니다. K50에 상관계수를 구할 것이고 함수식은 다음과 같습니다.

 

=CORREL(J30:J48,K30:K48)

-0.8384999

 

잔차와 직전잔차간 상관분석을 한 결과 –0.8 이라는 음의 상관을 확인했고 0.8이면 매우 높은 수치입니다. 즉 매우 심각한 자기상관이 있다는 것입니다. 이 회귀식은 자기상관이 매우 높아서 사용하면 안되는 회귀식입니다. 그럼 각 독립변수 중 누구를 사용하고 누구를 사용하면 안되는지 알아야 합니다.

 

이어지는 포스팅에서는 다음으로 각 변수별 회귀식을 통해 (단순회귀) 자기상관이 가장 적은 변수를 확인 하겠습니다.

.

.

.

생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!

 

728x90