책소개
데이터 분석의 핵심은 ‘효율’
챗GPT로 속도를, 엑셀로 정확도를!
순서도에 따라 기초 통계부터 데이터 전처리, 시각화까지 한 권에 담았다
이 책은 실무에서 가장 많이 접하는 데이터 분석 유형을 2가지 프로젝트로 경험할 수 있게 구성했다. 데이터 분석 도구로 ‘엑셀’과 챗GPT의 데이터 분석 플러그인 ‘Data Analyst’를 활용해 가장 트렌디하고 효율적인 분석을 가능케 했다. 데이터가 낯설어도 누구나 쉽게 ‘데이터 분석 순서도’에 따라 실무에 가까운 분석 과정을 경험할 수 있다. 실습에 필요한 모든 파일과 엑셀의 주요 함수, 기능, 단축키까지 준비되어 있으니 데이터 분석 여정에 올라타기만 하면 목적지까지 금세 도달할 수 있을 것이다.
목차
[PART 01 _ 데이터 분석 도구와 친해지기]
Chapter 01 _ 데이터 분석을 위한 도구
_1.1 챗GPT가 있는데 데이터 분석에 엑셀이 필요할까?
_1.2 챗GPT의 Data Analyst 플러그인
__1-2-1 챗GPT에 접속하기
__1-2-2 챗GPT-4로 전환하기
__1-2-3 ‘데이터 분석’ 플러그인 사용해 보기
_1.3 엑셀
__1-3-1 엑셀 최신 버전으로 업데이트하기
_1.4 코파일럿
Chapter 02 _ 챗GPT의 데이터 분석 플러그인 다루기
_2.1 데이터세트 불러오기
__2-1-1 서울시 공공 데이터 내려받기
__2-1-2 데이터 다듬기
__2-1-3 변수 간추리기
_2.2 챗GPT로 데이터 분석하기
__2-2-1 챗GPT-4에 데이터세트 올리기
__2-2-2 원본 매출과 예측 매출을 비교하고 CSV 파일로 저장하기
_2.3 챗GPT 가이드라인
Chapter 03 _ 데이터를 가져오는 방법
_3.1 캐글 데이터
__3-1-1 캐글 데이터세트 검색하고 내려받기
_3.2 공공 데이터
__3-2-1 치킨집 검색 및 파일 내려받기
__3-2-2 약국 정보 검색 및 파일 내려받기
_3.3 웹 데이터
__3-3-1 웹 데이터 불러오기
_3.4 API 데이터
__3-4-1 ‘치킨’ 오픈 API 데이터 가져오기
__3-4-2 ‘약국’ 오픈 API 데이터 가져오기
[PART 02 _ 데이터 분석 기능 손에 익히기]
Chapter 04 _ 데이터세트 분리와 병합
_4.1 데이터 분리
__4-1-1 파워 쿼리
__4-2-2 챗GPT로 데이터 분리하기
__4-2-3 엑셀로 데이터 분리하기
_4.2 데이터 병합
__4-2-1 챗GPT로 데이터 병합하기
__4-2-2 엑셀 파일 병합하기
__4-2-3 엑셀 시트 병합하기
Chapter 05 _ 필요한 데이터만 쏙! 피벗 테이블 및 피벗 차트
_5.1 피벗 테이블
__5-1-1 챗GPT로 피벗 테이블 구현하기
__5-1-2 엑셀로 피벗 테이블 구현하기
_5.2 피벗 차트
__5-2-1 챗GPT로 피벗 차트 만들기
__5-2-2 엑셀로 피벗 차트 만들기
Chapter 06 _ 원하는 데이터를 쉽게 찾는 법, VLOOKUP 함수
_6.1 FORMULATEXT 함수
__6-1-1 엑셀에서 FORMULATEXT 함수 사용하기
_6.2 VLOOKUP 함수
__6-2-1 챗GPT로 VLOOKUP 함수 사용하기
__6-2-2 엑셀에서 VLOOKUP 함수 사용하기
__6-2-3 엑셀에서 VLOOPUP 함수 수정하기
Chapter 07 _ 데이터 시각화의 힘, 조건부 서식
_7.1 데이터 막대
__7-1-1 챗GPT로 데이터 막대 그리기
__7-1-2 엑셀로 데이터 막대 그리기
_7.2 셀 규칙 강조와 새 규칙
__7-2-1 챗GPT로 데이터 시각화하기
__7-2-2 엑셀에서 데이터 셀 규칙 강조 적용하기
__7-2-3 엑셀에서 새 규칙 적용하기
Chapter 08 _ 데이터 분석 순서도
_8.1 데이터 분석에도 순서가 있어?
_8.2 데이터 분석 순서도
[PART 03 _ 실전, 데이터 분석]
Chapter 09 _ 아파트 거래 가격 예측
_9.1 데이터 분석 프로젝트의 시작 3단계
__9-1-1 문제 제기, 데이터 구하기, 타깃 변수 설정
_9.2 데이터 처리 1 - ID 변수, 타깃 변수
__9-2-1 데이터 불러오기
__9-2-2 ID 변수 설정하기
__9-2-3 타깃 변수 생성하기
_9.3 데이터 처리 2 - 기타 변수 데이터 처리
__9-3-1 데이터 타입 확인하기
__9-3-2 데이터 타입 정리하기
__9-3-3 챗GPT로 날짜 변수 전처리하기
__9-3-4 엑셀에서 날짜 변수 전처리하기
__9-3-5 범주형 변수 전처리
_9.4 탐색적 자료 분석 및 시각화
__9-4-1 결측값 50% 초과 변수 제거
__9-4-2 구간 변수 요약 통계
__9-4-3 구간 변수 시각화
__9-4-4 범주형 변수 도수분포표 및 시각화
__9-4-5 이상값 제거
__9-4-6 상관관계 검토
__9-4-7 T-검정
_9.5 모델 실행 전 데이터 처리
__9-5-1 데이터 변환 - 구간 변수 스케일 조정
__9-5-2 데이터 대체 - 결측값 보정
__9-5-3 범주형 데이터 추가 처리 - 트리 기반 데이터세트
__9-5-4 범주형 데이터 추가 처리 - 거리 기반 데이터세트
_9.6 연속형 타깃 변수 모델
__9-6-1 데이터세트 파일 정리
__9-6-2 챗GPT 회귀 모델
__9-6-3 엑셀 회귀 분석
__9-6-4 릿지 모델과 라쏘 모델
__9-6-5 결정 트리 모델
__9-6-6 랜덤 포레스트 모델
__9-6-7 그레이디언트 부스팅, XGBoost, LightGBM 모델
_9.7 최적 모델 선정 및 활용
Chapter 10 _ 공유 자전거 수요 예측
_10.1 데이터 분석 프로젝트의 시작 3단계
__10-1-1 문제 제기, 데이터 구하기, 타깃 변수 설정
_10.2 데이터 처리 1 - ID 변수, 타깃 변수
__10-2-1 데이터 불러오기 & ID 변수 설정하기
__10-2-2 타깃 변수 생성
__10-2-3 타깃 변수 결측값 확인하기
_10.3 데이터 처리 2 - 기타 변수 데이터 처리
__10-3-1 데이터 타입 확인
__10-3-2 날짜 변수 전처리
__10-3-3 범주형 변수 전처리
_10.4 탐색적 자료 분석 및 시각화
__10-4-1 결측값 50% 초과 변수 제거
__10-4-2 구간 변수 요약 통계 검토
__10-4-3 구간 변수 시각화
__10-4-4 범주형 변수 도수분포표 및 시각화
__10-4-5 이상값 제거
__10-4-6 상관관계 검토
__10-4-7 T-검정
_10.5 모델 실행 전 데이터 처리
__10-5-1 구간 변수 스케일 조정
__10-5-2 범주형 데이터 추가 처리
_10.6 연속형 타깃 변수 모델
__10-6-1 회귀 모델
__10-6-2 릿지 모델과 라쏘 모델
_10.7 트리 기반 분류 모델
__10-7-1 결정 트리 모델
__10-7-2 랜덤 포레스트 모델
__10-7-3 그레이디언트 부스팅, XGBoost, LightGBM 모델
_10.8 거리 기반 분류 모델
__10-8-1 로지스틱 회귀·릿지·라쏘 모델
__10-8-2 신경망 모델
__10-8-3 KNN 모델
__10-8-4 SVM 모델
_10.9 최적 모델 선정 및 활용
APPENDIX _ 부록
_Appendix A _ 유용한 엑셀 기능 모음
__A.1 엑셀의 주요 기능
__A.2 엑셀 팁
__A.3 엑셀 단축키
_Appendix B _ 유용한 엑셀 함수 모음
__B.1 엑셀의 주요 함수
저자소개
출판사리뷰
Part 1. 데이터 분석 도구와 친해지기
Part 1에서는 이 책에서 다루는 주요 도구인 엑셀과 챗GPT를 소개합니다. 도구들의 UI와 기능을 간단히 살펴본 다음 캐글, 공공데이터, 웹 데이터 등 다양한 경로에서 원하는 데이터세트를 구하는 방법을 알려드립니다.
Part 2. 데이터 분석 기능 손에 익히기
Part 2에서는 챗GPT와 엑셀을 병행해 데이터세트를 분리·병합, 데이터 서칭, 시각화 등을 살펴봅니다. 이 과정에서 챗GPT의 프롬프트에 익숙해지고 엑셀의 파워 쿼리, 피벗 차트, 주요 함수를 익히게 됩니다.
Part 3. 실전, 데이터 분석
실무에서 데이터를 분석하는 과정을 담은 ‘데이터 분석 순서도’를 따라 2개의 프로젝트를 진행합니다. 데이터 처리부터 분석, 시각화 그리고 최적 모델 선정까지 단계를 밟으면서 데이터 분석에 필요한 기초 통계까지 쉽게 다다를 수 있습니다.
★이 책의 대상 독자★
- 실무 경험이 부족한 초보 데이터 분석가
- 엑셀의 데이터 분석 기능을 깊이 활용하고 싶은 엑셀 사용자
- 업무에서 데이터 분석이 필요한 직장인
- 이론과 실습을 병행하는 교재가 필요한 학생
★이 책의 실습 예제 다운받기★
https://github.com/jasonyim2/book4