- 일주일간의 영화 정보를 가지고 해당 영화 최종 관객 수 예측
- 영화 데이터는 영화진흥위원회 홈페이지와 네이버 영화 홈 사이트에서 추출
- 영화진흥위원회 연도별 박스오피스 목록을 파일로 불러들여서 하나의 파일로 합침
- 누적 관객수가 10000명 이상인 것만 출력
- 영화진흥위원회 오픈 api를 사용하여 영화 기본 정보 및 상세 정보 수집
- 영화고유코드를 이용하여 영화진흥위원회 홈페이지에서 1주일간 영화 상영 데이터 수집
- 네이버 영화 홈 사이트에서 수집
- 개봉전 평점과 평점평가 인원 수집
- 수집한 데이터를 Data Type 통일시켜서 전처리
- 카테고리 데이터들 상대적 점수 부여하여 전처리
- 모델링에 맞게 정립하여 전처리 후 dataset 구성
- OLS 모델
- 최적 모델 찾기 위하여 OLS, ANOVA 이용
- 최종 관객수 예측