google-site-verification=tiTpc7g9EFArxomgX7IqEflz-fp4nI0F2jLaMkFLPoQ LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 119

상세 컨텐츠

본문 제목

LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 119

카테고리 없음

by 홍승민경영컨설팅(주) 2024. 11. 15. 09:57

본문

다양한 데이터를 기반으로 따라 하면 성공하는 다중회귀 판매예측 방법

 

 

(앞선 글에 이어) 다양한 데이터를 기준으로 다중회귀 분석하기 4

 

다시 본론으로 들어가서 글을 이어가면

 

회귀방정식을 구하기 위한 값들을 보면, P 값에서 못 생긴 애들이 나옵니다.

업력부터 서비스 3까지는 못생긴 애들입니다. 이놈들은 P 값이 0.05 보다 큽니다. 즉 사용하지 못하는 인자들입니다. 그래서 실제로 사용가능 인자들은 ‘우리제품매출,고객사매출,직원수’ 이렇게 3가지입니다. 업력부터 서비스 까지는 사용하기 부적합한 데이터 들입니다. 하지만 우리가 이런 것을 다 이해 할 필요 없이 생성형에 물어 보면 됩니다.

 

요약출력을 그대로 드래그를 해서 생성형에 붙여 넣기를 하고

Input
결과에 대해서 해석해 주고, 사용가능한지에 대해서도 설명해줘
사용가능하다면 다중회귀식을 만들어줘

Output
제공된 회귀분석 결과에 대한 해석과 사용 가능성에 대해 설명드리겠습니다:

1. 모델 적합도:
- 다중 상관계수(0.987)와 결정계수(0.974)가 매우 높아 모델의 설명력이 우수합니다.
- 조정된 결정계수(0.904)도 높아 독립변수 수를 고려해도 모델 설명력이 좋습니다.
- F 통계량(81.00)과 유의확률(5.2e-12)을 보면 모델이 통계적으로 매우 유의합니다.

2. 개별 변수의 유의성:
- X1, X2, X3는 p값이 0.05 미만으로 통계적으로 유의합니다.
- 나머지 변수들(X4-X9)은 p값이 0.05보다 커서 통계적으로 유의하지 않습니다.
생략


출처: ‘라온’ service base by AI:DRIVE with HBC data 27w, 202412turn

 

제가 앞서서 설명드렸던 것보다 생성형이 더 수준높게 나왔습니다.

이제 잔차에 대해서 이야기 해보겠습니다. 잔차를 이용하는 이유는 좀더 정확한 방정식을 구하기 위함입니다. 이제 잔차를 스윽~ 드레그 해서 생성형에 붙여 넣기 하시고

Input
다음은 위에 도출한 회귀식에 대한 잔차 데이터야
이때 ‘0.534606 ’은 표준오차에 1.5를 곱한 것으로 이것을 넘어서면 극단치 취급을 할 거야 분석해줘

Output
1. 표준오차에 1.5를 곱한 값인 0.534606은 극단치를 판단하는 기준이 됩니다. 이 값을 넘어서는 잔차는 극단치로 간주됩니다.

2. 데이터를 살펴보면 다음과 같은 극단치들이 있습니다:
- 관측수 1: 잔차 0.656485116 > 0.534606
- 관측수 25: 잔차 0.610766977 > 0.534606

생략


출처: ‘라온’ service base by AI:DRIVE with HBC data 27w, 2024 1turn

 

여기서 극단치 처리는 매우 작은 수와 매우 큰 수 이여서 그냥 제가 이해가 빠르게 극단치라고 말씀 드렸습니다만, 구체적으로는 ‘아웃라이어’ 라고 하고 아웃라이어는 보통 표준오차의 1.5배에서 2배를 합니다. 이때 절대값으로 합니다. 극단치는 말 그대로 극단치 인데 이 극단치가 가끔 아웃라이어가 아닐 수도 있습니다. 그리고 또 아웃라이어는 통계적으로 규명하기 어려운 데이터를 아웃라이어라 합니다. 그래서 극단치와 아웃라이어는 비슷한 개념이지만 다른 개념입니다.

 

그러면 여기까지 생성형을 시켜서 분석을 했으면 이제 어떻해 할까요? 먼저 회귀 방정식에서 못 써먹는 못생긴애들 제거 해야 겠죠? 그래야 설명력이 올라 가고 좀더 정확한 방정식이 나오지 않을까요? 그리고 실제 데이터에서 관측수 1과 관측수 25는 극단치 이므로 이놈들 제거 해야 합니다. 그러면 더욱 정확한 결과가 나올 것입니다. 이러한 작업은 엑셀에서 직접 하셔야 합니다. 엑셀에서 직접 제거하시고 다시 회귀식을 돌리시면 마무리가 되겠습니다. 그렇게 데이터를 다시 처리 하고 나온 최종 회귀식은 다음 과 같습니다.

(책에서는 텍스트가 작아서 안보일 수 있습니다. 첨부 예시 파일 참조 부탁드립니다.)

 

사실 잔차를 제거하나 안하나 크게 변함이 없습니다.

 

잔차제거를 진행하였고 이제 최종 필요 없는 변수인 업력,제조,서비스1,2,3,4 모두 제거 하고 다중회귀를 다시 돌리겠습니다. 그리고 그 결과는 다음과 같습니다.

 

 

다음 포스팅에 이어서 계속

.

.

.

생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!

 

728x90