Sparta_coding_club/Python

데이터 분석 종합반 - 전체 강의 다시보기

데이터분석쇼니 2023. 12. 21. 21:03


오늘의 목표설정

더보기
  • SQL 문제 15개 풀기
  • 데이터분석 강의 5회차 마무리
  • SQL 강의 1~2회차 복습
  • 데이터분석 강의 2~3회차 복습

 

 


주요 내용 정리하기

○ SQL 문제풀기

  -  문제를 보고 해결방법은 잘 떠오른다. 하지만 디테일한 부분에는 계속해서 오류가 있는 편.

[SQL] 주요 내용 다시 보기

--시간 함수 → 날짜 데이터에서 시(HH)만 추출
select HOUR(DATETIME)
-- 5월인 데이터만 추출

WHERE APNT_YMD LIKE '2022-05%' 
WHERE SUBSTR(MONTH(APNT_YMD) = '05')
-- 여러개 중 하나를 포함하고 있는 데이터 추출

REGEXP_LIKE (OPTIONS, '___ | ___ | ___')
OPTIONS LIKE '%__' OR OPTIONS LIKE '%___'

 

○ 데이터분석 강의

  -  데이터분석의 단계에 대해서는 이해를 했지만, 비슷한 예제를 가설화하여 데이터와 연결하고 분석하는 단계는 앞으로 여러 케이스 분석을 통해 좀 더 연습해야 할 것 같다.

  -  강의를 마치고 다시 처음부터 파이썬 강의를 들어보니, 좀 더 이해가 잘되기 시작했다. 앞에서 그렇구나 하고 넘어간 부분이 아 ~ 이래서 이렇구나! 라는 부분으로 바뀐 것 보니 좀 뿌듯하면서도 한번 더 개념잡기가 잘 되는 것 같다.

  - 그리고 더불어서 이전에는 파이썬 코드를 보고 이해하느라 놓쳤던 중요한 부분을 보기 시작했다. 어떤 문제해결을 위해 어떻게 가설을 세우고 어떤 방법으로 데이터를 분석해나가는지 보기 시작했다. 그부분을 함께 정리하며 복습을 진행중이다.

 

1. 타이타닉에서 생존한 사람들 중 부유한 사람들이 많다?

- 가설 : 부유한 사람들이 더 많이 생존했다. 

해결방법
  1.  생존(Survived)과 관련된 항목 찾기 
  2.  Survived 데이터 중심으로 상관계수 확인하기
  3.  상관계수를 그래프로 확인하여 큰 영향을 미친 항목 확인하기

 

2. 생존율과 나이가 관계가 있다?

- 가설 : 나이가 어릴수록 더 많이 생존했다. 

해결방법
  1.  탑승자 나이(Age)와 생존율(Survived)의 관련된 항목 확인
  2.  나이 데이터를 연령대 구간별로 분류 
  3.  연령대별 데이터를 확인하여 각 항목의 평균값 확인
  4.  그래프로 표기하여 수치가 큰 나이대 확인 

  -  반복문은 어렵지만 이제서야 조금 어떤 것인지 이해가 되어 가는 것 같다. 

 

 


느낀 점


아직은 첫 걸음마 단계지만, 그래도 배우면 배울수록 더 재밌어지는 것 같다.

조금 더 욕심이 나서 [파이썬, 코딩 도장] 이라는 책을 샀다.
매일 조금씩 풀어보면서 파이썬이랑 친해질 생각이다.

그리고 자격증 ADsP와 SQLD 중 하나를 선택해야 할지 고민이다.
우선은 둘다 동시에 쳐보는 것이 목표긴 하나, 통계에 R이 나오는 부분이 있어 감당이 될지는 모르겠다.
우선은 SQLD 강의는 현재 신청해 놓았으니 SQLD는 무조건 보는 것으로 땅땅땅