데이터 분석/데이터 분석 (python) 3

[Dacon] 데이콘 Basic 여행 상품 분석시각화 경진대회

[Dacon] 데이콘 Basic 여행 상품 분석시각화 경진대회 안녕하세요, 데이콘에서 두번째로 참가하는 대회입니다. 이번 목표는 모든 칼럼에 대해서 분석하는 것을 목표로 삼았습니다. 그래서 모든 칼럼을 이용해서 시각화를 진행하였는데, 다음에는 분석의 컨셉을 잡고 접근하는 것이 인사이트를 더 깔끔하게 도출할 수 있을 것 같네요. 부족하지만, 제 분석을 클릭해주시고, 읽어주셔서 감사합니다. 1. 필요한 라이브러리 불러오고, 그래프 설정하기. 제가 사용할 패키지들을 별칭을 이용하여 불러왔습니다. 그리고 폰트는 맑은 고딕을 이용하고, 그래프 배경은 하얀색 그리드로 지정해주었습니다. 2. 데이터 둘러보기. 일단 df를 이용하여 데이터를 가져왔습니다. 그리고 원본 데이터를 보호하기 위하여, copy를 이용하여 df..

[Dacon] 데이콘 Basic 쇼핑몰 지점별 매출액 분석시각화 경진대회

[Dacon] 데이콘 Basic 쇼핑몰 지점별 매출액 분석시각화 경진대회 안녕하세요, 처음으로 대회를 나갑니다. 제가 Promotion 부분에 NaN 값이 많아서, 어떤 값을 채워야되나 고민이 많았습니다. 통계학적 지식이 부족하여 잘 모르겠어서 공부를 더 하고 채워보도록 하겠습니다. (다른 분들 코드를 살펴보았을 때, 시계열에 관한 내용이 많았는데, 잘 몰라서 공부한 뒤에 다시 분석해보도록 하겠습니다.) 첫 대회인 만큼 주어진 시간 안에서 해결하고 싶었습니다. 부족한 점이 있으면, 댓글로 조언 남겨주시길 바랍니다. 감사합니다. 1. 필요한 라이브러리 불러오기. 제가 사용할 라이브러리를 별칭을 붙여서 불러왔습니다. 2. 데이터 불러오기. csv 파일이기 때문에, pd.read_csv() 함수를 이용해서 데..

[교내 경진대회] 가구 소득 수준에 따른 남녀 연령 별 영양 섭취 질병 예측 모델

[교내 경진대회] 국건영 데이터과학 본 조사의 목적은 국민의 건강수준, 건강행태, 식품 및 영양섭취 실태에 대한 국가 단위의 대표성과 신뢰성을 갖춘 통계를 산출하고, 이를 통해 국민건강증진종합계획의 목표 설정 및 평가, 건강증진 프로그램 개발 등 보건정책의 기초자료로 활용하는 것이다. 1. 대회 참가 학생 소개 및 역할 - 팀 이름 : 수원대 질병 관리 - 대회 참가 학생 소개 및 역할 학번 이름 역할 20516001 강서연 1. 데이터 시각화하기. 2. 모델링하기. 3. Grid Search를 이용하여 의사결정트리 하이퍼 파라미터 튜닝하기. 20516008 김노정 1. [참고용] 조사자들의 전체 기본 정보 전처리 및 시각화 제작하기. 2. 데이터 전처리 및 시각화하기. 3. 최적의 모델 선택 및 시간 ..