Shonny Data

데이터 분석 종합반 - 전체 강의 다시보기 ② 본문

Sparta_coding_club/Python

데이터 분석 종합반 - 전체 강의 다시보기 ②

데이터분석쇼니 2024. 1. 4. 22:20


실전 데이터분석 다시보기

진행과정

강의를 들으면서 강의자료를 보지않고 작성할 수 있는 코드는 스스로 작성해보기
유사한 코드는 다른 케이스를 찾아보며 비교하면서 이해하기

 

주요 내용

① 요일 및 시간 별 수강생 숫자 구하기

 ○ 순서

  1. 날짜 포맷 설정
  2. 날짜 포맷 변경 
  3. 요일 추출
  4. 요일 인덱스 설정
  5. 요일 별 수강생 숫자 구하기
  6. 시간 추출
  7. 시간 별 수강생 숫자 구하기

더보기

1)  format = '%Y-%m-%dT%H:%M:%S.%f'

2)  sparta_data['date_time'] = pd.to_datetime(sparta_data['date'], format=format)
        (date_time 컬럼생성)             .to_datetime (바꿀 컬럼 선택, 포맷은 위 포맷처럼)

3)  sparta_data['date_time_week'] = sparta_data['date_time'].dt.day_name()

4)  weeks = {'Monday', 'Tuesday', 'Wednesday', 'Thurday', 'Friday', 'Saturday', 'Sunday'}

5)  weekdata = sparta_data.groupby(['date_time_week'])['user_id'].count()
     weekdata = weekdata.agg('weeks')

6)  sparta_data['date_time_hour'] = sparta_data['date_time'].dt.hour

7) hourdata = sparta_data.groupby(['date_time_hour'])['user_id'].count()
    hourdata = hourdata.sort_index()
  

 

② 지역 별 수강생 추출하기

○ 순서

  1. 지역 인덱스
  2. 지역 관련 데이터만 뽑아서 다시 테이블 생성
  3. 중복된 지역값 정리  ( .drop_duplicates )
  4. 정렬 ( .sort_valus )
  5. 인덱스 재부여 ( .reset_index )
  6. 지역 별 수강생 추출
  7. 표 합치기

더보기

1)  category_ragnge = set(sparta_data['area'])    >> 경기, 강원, … , 제주 (총 12개)

 

2)  area_info = sparta_data ['area', 'latitutde', 'longitude']

3)  area_info = area_info.drop_duplicates('area')

4)  area_info = area_info.sort_values(by=['area'], ascending = [True])

5) area_info = area_info.reset_index()

 

6) number_of_students = sparta_data.groupby(['area'])['user_id'].count()

7) result = pd.merge (area_info, numer_of_students, on = "area")