목록Sparta_coding_club (34)
Shonny Data

Github 설정을 하고 싶어서 VScode에서 이것저것 설치해보는 중 Note: you may need to restart the kernel to use updated packages. 오류 발생 pip install --upgrade pip 이때 pip 버전을 23.2.1 에서 24.0으로 업그레이드 해주니 문제 해결

회귀분석 (Regression) 독립변수(X)로 종속변수(y)를 예측하는 것을 의미 독립변수는 결과에 영향을 미치는 원인 회귀분석 관련 용어 회귀 (Regression) : 두 변수 간 관계가 일반화된 선형관계의 평균으로 돌아간다는 것을 의미 선형성(Linearity) : 두 변수 간 관계가 하나의 직선 형태로 설명될 수 있는 것을 의미 최소제곱추정량 (Least Square Estimator) : (실제값 - 예측값) 의 제곱을 한 값들의 합이 최소가 되는 값 회귀분석 종류 선형회귀분석 (Linear Regression Analysis) - 설명변수와 종속변수 간의 관계를 일차식으로 모델링하여 분석 단순 회귀분석 (Simple Regression Analysis) - 설명변수가 하나인 모델 다중 회귀분..

기본 수학 연산 numpy.add : 어레이의 요소 단위로 덧셈 계산을 합니다. numpy.subtract : 어레이의 요소 단위로 뺄셈 계산을 합니다. numpy.multiply : 어레이의 요소 단위로 곱셈 계산을 합니다. numpy.divide : 어레이의 요소 단위로 나눗셈 계산(true division)을 합니다. numpy.true_divide : 어레이의 요소 단위로 나눗셈 계산(true division)을 합니다. numpy.floor_divide : 어레이의 요소 단위로 나눗셈 계산(floor division)을 합니다. numpy.remainder : 요소 단위로 나눗셈의 나머지를 반환합니다. numpy.mod : 요소 단위로 나눗셈의 나머지를 반환합니다. numpy.prod : 주어진..

| Numpy 의 random 모듈 랜덤 모듈은 다양한 함수를 사용해서 특정 범위, 개수, 형태를 갖는 난수 생성에 활용 random.rand( ) random.randint( ) random.randn( ) random.standard_narlmal( ) random.normal( ) random.random_sample( ) random.choice( ) random.seed( ) ■ random.rand ( ) 주어진 숫자만큼 난수 어레이를 생성하는 함수 import numpy as np a = np.random.rand(5) # [0.41626628 0.40269923 0.80574938 0.67014962 0.47630372] b = np.random.rand(2, 3) # [[0.8373995..

#38. 조건별로 분류하여 주문상태 출력하기 지문 FOOD_ORDER 테이블에서 5월 1일을 기준으로 주문 ID, 제품 ID, 출고일자, 출고여부를 조회하는 SQL문을 작성해주세요. 출고여부는 5월 1일까지 출고완료로 이 후 날짜는 출고 대기로 미정이면 출고미정으로 출력해주시고, 결과는 주문 ID를 기준으로 오름차순 정렬해주세요. #39. 성분으로 구분한 아이스크림 총 주문량 지문 상반기 동안 각 아이스크림 성분 타입과 성분 타입에 대한 아이스크림의 총주문량을 총주문량이 작은 순서대로 조회하는 SQL 문을 작성해주세요. 이때 총주문량을 나타내는 컬럼명은 TOTAL_ORDER로 지정해주세요. FIRST_HALF ICECREAM_INFO 테이블 아이스크림 맛, 상반기 아이스크림 총주문량 아이스크림 맛, 아이..

| 랜덤 함수 이란 random 은 굉장히 유용한 여러가지 함수들을 포함하고 있는 모듈 무작위로 여러가지의 작업을 수행해준다 1. 난수 생성 (실수 혹은 정수) 2. 무작위 추출 3. 무작위로 순서 섞기 (셔플) 등등 ■ 랜덤 모듈 임포트 랜덤 모듈이 포함된 함수 전체를 사용하기 위해서 먼저 import를 해줘야 한다 #랜덤모듈 전체 임포트 import random #랜덤모듈이 포함하는 일부 함수만 임포트 from random import random, randint, randrange ■ 각 함수의 기능 random( ) : 0 이상 1 미만의 실수 난수 생성 random.random() randint( ) : 정수 난수 생성 random.randint( ) random.randint(start, st..

| 결측치 확인 DataFrame.isna( ) = isnull( ) DataFrame.notna( ) = notnull( ) isna 메서드와 notna 메서드는 DataFrame 내의 결측값을 확인해서 bool 형식으로 반환하는 메서드 입니다. isna 의 경우 결측값이면 True, 정상값이면 False notna 의 경우 결측값이면 False, 정상값이면 True col = ['col1','col2','col3','col4'] row = ['row1','row2','row3'] data = [[1,2,pd.NA,4], [np.nan,6,7,8], [9,10,11,None]] df = pd.DataFrame(data,row,col) print(df.isna()) >> col1 col2 col3 col..

| 결측치 제거 Pandas로 데이터를 다루다보면 특정 셀의 정보가 NaN으로 표시될 때가 있음 → 결측치 결측값 - NaN, NA, None... 결측값이란 데이터에 존재해야 하지만 누락되어 존재하지 않는 값 NaN (Not a Number) 의 약어 결측값이 많을 경우 데이터의 통계적 신뢰성이 떨어지고 모델링에 악영향을 끼치기 때문에 전처리 필요 dropna fillna ■ dropna dropna 함수는 결측값이 포함된 행이나 열을 삭제하는데 사용 DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) axis : {0: index / 1: columns} 결측치 제거를 진행 할 레이블입니다. how : {'any' ..

#33. 상품 별 오프라인 매출 구하기 지문 PRODUCT 테이블과 OFFLINE_SALE 테이블에서 (LEFT JOIN) 상품코드 별 매출액(판매가 * 판매량) 합계를 출력하는 SQL문을 작성해주세요. 매출액을 기준으로 내림차순 정렬해주시고 매출액이 같다면 상품코드를 기준으로 오름차순 정렬해주세요. (ORDER BY) PRODUCT OFFLINE_SALE 테이블 상품 ID, 상품코드, 판매가 오프라인 상품 판매 ID, 상품 ID, 판매량, 판매일 #34. 있었는데요 없었습니다 지문 관리자의 실수로 일부 동물의 입양일이 잘못 입력되었습니다. 보호 시작일보다 입양일이 더 빠른 동물의 아이디와 이름을 조회하는 SQL문을 작성해주세요. 이때 결과는 보호 시작일이 빠른 순으로 조회해야합니다. ANIMAL_INS..

| 데이터 프레임 인덱싱 데이터 프레임에서 특정 행이나 열(Column)을 골라낼 때 사용하는 방법 ■ 01. loc loc 은 location 의 약어 데이터 프레임의 행 / 칼럼의 라벨이나 불(bool)로 인덱싱하는 방법 사람이 읽을 수 있는 라벨 값으로 특정 값들을 불러오는 방법 □ 데이터 프레임의 행과 열 불러오기 df.loc[행 인덱싱 값, 열 인덱싱 값] df.loc[0] -- 행의 값이 0인 데이터 값 불러와줘 df.loc[0, 'Name'] -- 행의 값이 0인 데이터에서 'Name'(컬럼값)의 값을 불러와줘 □ 데이터 프레임의 범위 불러오기 df.loc[:] -- 전체 값을 보여줘 df.loc[:,:] -- 전체 행의 전체 열(컬럼)값을 보여줘 df.loc[:, 'Name'] -- 전체 ..