Shonny Data
데이터 분석 종합반 - 전체 강의 다시보기 ② 본문
실전 데이터분석 다시보기
진행과정
강의를 들으면서 강의자료를 보지않고 작성할 수 있는 코드는 스스로 작성해보기
유사한 코드는 다른 케이스를 찾아보며 비교하면서 이해하기
주요 내용
① 요일 및 시간 별 수강생 숫자 구하기
○ 순서
1. 날짜 포맷 설정
2. 날짜 포맷 변경
3. 요일 추출
4. 요일 인덱스 설정
5. 요일 별 수강생 숫자 구하기
6. 시간 추출
7. 시간 별 수강생 숫자 구하기
1) format = '%Y-%m-%dT%H:%M:%S.%f'
2) sparta_data['date_time'] = pd.to_datetime(sparta_data['date'], format=format)
(date_time 컬럼생성) .to_datetime (바꿀 컬럼 선택, 포맷은 위 포맷처럼)
3) sparta_data['date_time_week'] = sparta_data['date_time'].dt.day_name()
4) weeks = {'Monday', 'Tuesday', 'Wednesday', 'Thurday', 'Friday', 'Saturday', 'Sunday'}
5) weekdata = sparta_data.groupby(['date_time_week'])['user_id'].count()
weekdata = weekdata.agg('weeks')
6) sparta_data['date_time_hour'] = sparta_data['date_time'].dt.hour
7) hourdata = sparta_data.groupby(['date_time_hour'])['user_id'].count()
hourdata = hourdata.sort_index()
② 지역 별 수강생 추출하기
○ 순서
1. 지역 인덱스
2. 지역 관련 데이터만 뽑아서 다시 테이블 생성
3. 중복된 지역값 정리 ( .drop_duplicates )
4. 정렬 ( .sort_valus )
5. 인덱스 재부여 ( .reset_index )
6. 지역 별 수강생 추출
7. 표 합치기
1) category_ragnge = set(sparta_data['area']) >> 경기, 강원, … , 제주 (총 12개)
2) area_info = sparta_data ['area', 'latitutde', 'longitude']
3) area_info = area_info.drop_duplicates('area')
4) area_info = area_info.sort_values(by=['area'], ascending = [True])
5) area_info = area_info.reset_index()
6) number_of_students = sparta_data.groupby(['area'])['user_id'].count()
7) result = pd.merge (area_info, numer_of_students, on = "area")
'Sparta_coding_club > Python' 카테고리의 다른 글
[Python] loc / iloc 문법 (1) | 2024.01.23 |
---|---|
[Python] datetime / timestamp 문법 (1) | 2024.01.23 |
Python - 파이썬 문법 뽀개기 총정리 ① (0) | 2024.01.04 |
데이터 분석 종합반 - 파이썬 친해지기 / Pandas / Matplotlib / 날짜 추출 / group by (1) | 2024.01.04 |
데이터 분석 종합반 - 전체 강의 다시보기 (2) | 2023.12.21 |