데이터분석 3

혼자 공부하는 머신러닝 + 딥러닝 6

6-1 군집 알고리즘 !wget https://bit.ly/fruits_300 -O fruits_300.npy # -O는 숫자0이 아니라 알파벳 O output --2023-11-15 07:28:05-- https://bit.ly/fruits_300 Resolving bit.ly (bit.ly)... 67.199.248.10, 67.199.248.11 Connecting to bit.ly (bit.ly)|67.199.248.10|:443... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: https://github.com/rickiepark/hongong-ml/raw/master/fruits_300.np..

데이터분석 2023.11.18

[데이터분석] 혼자 공부하는 데이터분석with파이썬 7-1 통계적으로 추론하기

모수검정 표준점수 중심극한정리 신뢰구간 가설검정 순열검정 분석 대상 데이터를 모두 수집하기 어려울 때 샘플 데이터로 전체 데이터에 대한 통계량을 추론하거나 데이터에 대한 가설을 검증할 수 있다. ✏️ 모수검정 - 모집단에 대한 파라미터를 추정하는 방법. (파라미터: 평균, 분산 등) - 모집단에서 선택한 일부 샘플을 표본이라고 한다. - 모수검정은 모집단의 데이터에 대해 어떤 가정을 전제로 하고 수행되는 경우가 많다. ex)모집단의 몸무게가 정규분포를 따른다. ✏️ 표준점수 구하기 - 표준점수(z 점수): 데이터가 정규분포를 따른다고 가정하고 각 값이 평균에서 얼마나 떨어져 있는지 표준편차를 사용해 변환한 점수 - z = (z점수를 구하려는 파라미터값 - 모집단의 평균) / 모집단의 표준편차 ✏️ z점수..

데이터분석 2023.09.30

[데이터분석] 혼자 공부하는 데이터분석with파이썬 3-1 불필요한 데이터 삭제하기

열 삭제하기 gdown 패키지: 구글드라이브 파일 다운받는 패키지. 판다스에서 NaN은 누락된 값, 비어 있는 값을 의미 loc 메서드에 슬라이싱 사용 → : 으로 행과 열을 지정하여 새로운 데이터프레임을 만들 수 있다. loc 메서드와 불리언 배열 중간에 있는 열을 제외하는 데에 사용 index클래스 객체인 columns 속성과 비교 연산자≠을 이용하여 얻는다.(넘파이 배열) drop()메서드 판다스에서 제공하는 데이터프레임 행/열 삭제 함수 첫 번째 매개변수: 삭제하려는 열 이름(여러 개를 리스트로 전달 가능), 두 번째 매개변수: axis=1(0이면 열, 디폴트값), 추가 매개변수: inplace=True(drop함수값을 따로 변수에 저장하지 않고 데이터프레임을 바로 수정할 수 있게 함) dropn..

데이터분석 2023.09.15