본문 바로가기

반응형

┄┈┄  ┄┈┄

(100)
기초 통계(1) 확률 변수(Random variable), 확률 분포(Probability Distribution), 정규분포(Normal Distribution), 표준정규분포(Standard Normal Distribution) 01. 변수 - 그 값이 무작위 시행 (random experiment)에 의해 결정되는 것 - 하나의 숫자를 무작위 시행의 각 결과에 할당(assign)하는 함수 - 표본공간에서 실수로의 함수 - 변수가 특정한 값을 취하는 것 = 하나의 사건 - 데이터 중, 공통의 측정 방법으로 얻은 같은 성질의 값 - 통계학에서 변수의 개수는 '차원'이라 표현되기도 함. *서로 독립인 두 사건 P(A∩B)=P(A)P(B) 또는 P(A│B)=P(A) * 독립인 두 변수 P(X=x, Y=y) = P(X=x)P(Y=y) P(X=x|Y=y) = P(X=x) 02. 변수의 종류 변수의 종류에 따라 확률을 계산하는 방법이 다르기 때문에 이를 구분하는 것이 필요. 2-1. 이산 변수 : 셀 수 있는 변수 (finite varia..
[Docker] 윈도우11에서 도커 설치하기 1. WSL2 (Window Subsystem for Linux 2) 활성화 - Docker는 linux기반으로 동작하기 때문에, window 환경에서 linux를 사용할 수 있도록 WSL2를 활성화 해야함. 1-1. 관리자 권한으로 Window PowerShell 실행 1-2. 명령어 실행 # Windows SubSystem Linux를 활성화시키는 명령어 > dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart # VirtualMachinePlatform 기능을 활성화시키는 명령어 : WSL2 버전에 필요한 명령어 > dism.exe /online /enable-feature /fea..
[통계] 사전 확률 (Prior Probability) / 가능도(Likelihood) / 사후 분포(Posterior Distribution) 사전확률(Prior Probability) - 새로운 정보나 데이터를 얻기 전에, 어떤 가설이나 사건에 대해 갖고 있는 초기 믿음 - ex) 코로나에 걸릴 확률이 20%라고 가정했을 때 20%가 그 병에 대한 사전 확률. 아직 어떠한 검사 결과도 보지 않았을 때 그 병에 걸렸을 것이라고 믿는 초기 확률값 가능도(Likelihood) - 주어진 데이터가 특정 가설이나 파라미터값에 대해 얼마나 '잘 맞는지'를 나타낸값 - 사전 확률과는 다르게, 새로운 데이터를 바탕으로 계산됨 - ex) 병원에서 코로나 검사를 받았고 결과가 양성이 나왔다고 했을 때, 이 검사 결과가 처음에 생각했던 그 병을 실제로 가지고 있을 '가능성'을 얼마나 높이는지. 즉, 양성 결과가 나올 확률을 가능도(likelihood)라고 할 수..
CrossEntropyLoss Label Smoothing code 01. 클래스 별 weight 계산 # 클래스별 샘플 수 count_class_0 = 10000 #y_train에있는 0과1의 갯수 count_class_1 = 400 # 전체 샘플 수 total_count = count_class_0 + count_class_1 # 클래스별 가중치 계산 weight_class_0 = total_count / (2 * count_class_0) weight_class_1 = total_count / (2 * count_class_1) # 가중치 텐서 생성 weights = torch.tensor([weight_class_0, weight_class_1]) weights = weights.to(device) 02. Label Smoothing Loss function 정의..
CalibratedClassifierCV python code 01. Import library & make dataset import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestClassifier from sklearn.calibration import CalibratedClassifierCV, calibration_curve from sklearn.metrics import roc_auc_score from sklearn.model_selection import train_test_split from tqdm import tqdm_notebook as tqdm import os i..

반응형