google-site-verification=tiTpc7g9EFArxomgX7IqEflz-fp4nI0F2jLaMkFLPoQ LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 120

상세 컨텐츠

본문 제목

LLM( 생성형) 업무효율화, 업무활용, 인공지능 활용하여 일잘 하는법 120

카테고리 없음

by 홍승민경영컨설팅(주) 2024. 11. 16. 10:15

본문

다양한 데이터를 기반으로 따라 하면 성공하는 다중회귀 판매예측 방법

 

 

(앞선 글에 이어) 다양한 데이터를 기준으로 다중회귀 분석하기 5

 

이제 방정식을 구해야 합니다. 역시 생성형을 활용할 예정입니다.

엑셀 파일에서 나온 요약출력을 전부 드레그 해서 생성형에 붙여 넣고

다음 작업을 수행 합니다.

Input
요약 출력
회귀분석 통계량
다중 상관계수 0.994803
결정계수 0.989634
중략

해석해줘 그리고 회귀방정식 도출해줘

Output
이 회귀분석 결과를 다음과 같이 해석할 수 있습니다:

1. 모델 적합도:
- 다중 상관계수(R)는 0.992로 매우 높습니다. 이는 독립변수들이 종속변수를 잘 설명하고 있음을 의미합니다.
- 결정계수(R^2)는 0.985로, 독립변수들이 종속변수 변동의 98.5%를 설명한다는 뜻입니다.
- 조정된 R^2는 0.982로 여전히 높습니다.
중략

5. 회귀방정식:
Y = 2.422 + 0.013*(우리제품 매출) + 0.000059*(고객사 매출) - 0.040*(직원수)

이 모델은 전반적으로 매우 적합하며, 모든 독립변수가 종속변수에 유의한 영향을 미치는 것으로 나타났습니다.


출처: ‘라온’ service base by AI:DRIVE with HBC data 27w, 2024 1turn

 

Y = 2.422 + 0.013*(우리제품 매출) + 0.000059*(고객사 매출) - 0.040*(직원수)

 

 

인사이트 있는 요약출력 해석

위 예시는 제가 책을 작성하기 위해서 만들어둔 가상의 예시입니다.

그래서 사실 데이터가 완전 순수하게 사용 가능한 예시인가? 에서는 다소 자유롭지 못합니다. 왜냐하면 제가 콘텐츠 제작을 위해 가공한 데이터이기 때문입니다. 하지만, 최대한 실제 데이터에 가깝게 만들었습니다. 이런 것을 기준으로 인사이트 있게 해석을 추가해 해서 말씀드리면, 우리는 지금 회귀방정식을 도출하고 그 이후 잔차를 확인하면서 제 주장에 따른 극단치 원래는 아웃라이어를 제거해서 좀 더 설명력이 높은 방정식을 구했습니다. 하지만, 수정 전후 주정된 결정계수를 비교 하면 결정계수가 0.96241, 0.989634 , 0.982178

 

이 정도 설명력 차이면 굳이 아웃라이어 제거가 필요 없습니다. 1) 챕터말미 참조

앞서서 다른 챕터에서도 말씀드렸듯이 설명력이 0.4 이상이면 사회과학 분야에서는 수용합니다. 하지만 이건 0.9 이상입니다. 심지어 더미변수가 5개나 되는데도 말이죠. 매우 높은 설명력을 보여주는 것은 사실 이런 잔차 처리가 필요 없습니다. 하지만 가장 정확한 방법은 앞서서 말씀드렸던 것처럼 각 모델별 잔차처리 그러니까 MAE를 보고 가장 최적화 모델을 선택하시는 것입니다.

 

여기에 한 가지 더 말씀드리면, 이런 다중회귀방정식으로 통해서 X1~X9까지의 P 값들을 확인하니 사실 불필요한 값들이 많이 존재합니다. 이번 예시에서도 무려 5개나 존재합니다. 이 자료들을 제거하시고 사용하는 것이 당연하니, 업종에 따라 적합하게 처리하셔서 사용하시는 것에는 크게 문제없는 도구입니다.

 

다음 포스팅에서는 이렇게 하여 나온 방정식을 사용하는 방법을 살펴보겠습니다.

.

.

.

생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!

 

728x90