google-site-verification=tiTpc7g9EFArxomgX7IqEflz-fp4nI0F2jLaMkFLPoQ
다양한 데이터를 기반으로 따라 하면 성공하는 다중회귀 판매예측 방법
(앞선 글에 이어)
지난 포스팅에서 시각화를 하는방법이 제곱항을 하는 방법보다 더 복잡하다고 설명드렸는데요. 하지만 하나 하나 하면 됩니다.
먼저 시각화를 위해서는 데이터를 블록잡고 -> 차트 -> 산점도(분산형) 차트를 하면 됩니다.
그리고 X값 Y값을 설정하고 난 이후 1차로 차트를 확인 합니다.
다음으로 그래프를 클릭하고 추세선을 추가하면 그 추세를 보고 결정하면 됩니다.
이때 먼저 볼 것은 판매숫자 와 판매가격간의 선형관계를 파악하고 두 번째로 판매숫자와 광고와의 관계를 파악합니다. 그럼 시각화를 하자마자 바로 누구는 선형관계 누구는 비선형관계를 보입니다. 책에서는 안 그렸지만, 직접 데이터 블록 잡고 그림 그리시면, 매우 복합한 그림이 나옵니다. 그리고 그 그림을 잘 처리해야 이쁘게 형상 확인이 가능합니다. 자세한 방법은 역시 생성형을 참조하시는 게 좋습니다. 그래프를 보시고 난 다음 선형과 비선형을 확인하셨을 것입니다. 그래서 각각 다른 회귀식을 적용해야 합니다. 그리고 난 다음 가격과 광고간에 상호작용을 확인해야 합니다. 블라 블라 블라~ 너무 복잡하고 어렵습니다.
차트를 통해서 확인하는 방법은 다른 장에서 매우 자세하게 이야기를 하였으니 많이 생략을 하고, 이제 쉽고, 편하고, 정확하고, 한 번에 다 가능한 거듭제곱을 이용하는게 더 좋습니다.
다시 문제로 들어가서, 우리는 선형인지 비선형인지를 확인하고 그리고 상호작용을 동시에 확인하면서 이것을 포함하는 다중회귀분석을 해야 합니다.
선형 비선형 관계를 거듭제곱으로 한다고 말씀드렸습니다. 이유는 각 데이터를 증폭하면 음수도 양수로 되고 데이터가 커지기 때문에 좀 더 구체적으로 관계를 파악하기 편하기에 이렇게 거듭제곱을 합니다. 두 번째로 상호작용을 확인해야 하는데 가격과 광고비용 간 상호작용이 나오는지 안 나오는지 알아야 하는데 이 두 개를 곱하면, 이게 양으로 증가를 하는지 음으로 증가를 하는지가 나오게 되고 동시에 증가 또는 감소 되는 추세를 보면 이게 선형인지 비선형인지도 동시에 파악이 됩니다. 상호작용이 항상 음수 또는 항상 양수로 되지는 않습니다. 하지만 이런값을 확인하기 위해서 곱해서 해석을 하면 매우 정교하게 확인 가능합니다. 그래서 상호작용을 확인하기 위해서는 이렇게 값을 곱해 줍니다. 또는 상호작용 분석을 하면 하면 각 컬럼간 구체적인 상호작용 정도 파악이 되는데, 이러한 상호작용 분석은 다루지 않고 이 챕터에서는 상호작용이 있다 없다를 파악하고 이를 활용하는 방법을 말씀드리는 것입니다.
광고비용 컬럼 옆에 3개의 컬럼이 추가 되었습니다. 이후 작업은 회귀식을 돌리는 것인데
데이터분석-회귀분석 을 실행해 주시고, Y항 컬럼은 판매숫자, 독립변수는 ‘판매가격’부터 ‘광고제곱’까지 설정하기고 실행. 그럼 결과는 아래처럼 나옵니다.
다음 포스팅에서 회귀분석 통계량을 바탕으로 이제 생성형을 시켜보겠습니다.
(다음 포스팅에 이어서 계속)
.
.
.
생성형인공지능, LLM, 일잘러, RAG응용, 챗지피티 를 활용해서 프로 일잘러 되기 출간 준비중~~!!