반응형

STUDY/ADsP 5

ADsP시험 D-1 개인용 내용 정리 -5

로지스틱 회귀분석 glm 독립변수는 연속형, 종속변수가 범주형인 경우 적용되는 회귀분석 모형 일반 선형 회귀분석 로지스틱 회귀분석 종속변수 연속형 변수 이산형(범주형)변수 모형 탐색 방법 최소자승법(LSM, 최소제곱법) 최대우도법(MLE), 가중최소자승법 모형 검정 F-test, T-test x제곱 test odds 값(x) : 성공이 일어날 가능성이 실패보다 x배 signoid함수 logistic 함수라 불리기도 하며 log_odds값을 연속형 0~1 사이의 값으로 바꾸는 함수 승산비(odds ratio)=관심있는 사건이 발생할 상대 비율 x=1, y=1이 되는 상대적 비율 ex) odds_a=1 odds_b=0.25 odds_ratio=4 의사결정나무 모형 장점 : - 구조가 단순 해석이 쉽다. - ..

STUDY/ADsP 2022.05.20

ADsP 시험 D-1 개인용 내용 정리-4

R studio R의 데이터 형 scalar - 단일 - 수치/문자/논리-단일 factor - 1d - 수치/문자 -단일, 범주형 vector - - 하나이상의 스칼라(=길이가 1인 벡터) 원소들을 갖는 단순한 형태의 집합 - 숫자, 문자, 논리형 데이터를 원소로 사용 가능 - 동일한 자료형을 갖는 값들의 집합 하나의 열(column)로 구성 - 백서 생성 :c(value1, value2,...) - 서로 다른 타입을 연결할 경우 문자열 취급 seq(from, to, by) - v1=seq(1, 10, 2) >>>>v1 num형 [1:5] 차 원형 1, 3, 5, 7 9 1부터 10까지 2 스텝으로 생성 - v2=seq(1, 10, length=4) >>>>v2 num형 [1:4] 차 원형 1, 4, 7..

STUDY/ADsP 2022.05.20

ADsP 시험 D-1 개인용 내용 정리-3

회귀분석 독립변수 - 다른 변수에 영향을 받지않고 독립적으로 변화하는 수 종속변수 - 독립변수의 영향을 받아 값이 변화 잔차(오차항) : 계산에 의해 얻어진 이론 값과 , 실측값의 차이 (모집단 - 오차, 표본집단- 잔차) 회귀 모형의 가정 - 선형성 ; 독립변수의 변화따라 종석변수도 변화 하는 선형모형 - 독립성 : 잔차와 독립변수의 값이 관련되어 있지 않다 - 정규성 : 잔차항이 정규분포를 이뤄야 한다 - 등분산성 : 잔차항들의 분포는 동일한 분산 - 비상관성 : 잔차들끼리 상관이 없어야 한다 Normal Q-Q plot - 정규성(정상성), 잔차가 정규분포를 잘 따르고 있는지 확인하는 그레프 - 잔차들이 그레프 선상에 있어야 이상적 Scale-Location - 등분산성, y축이 표준화 잔차를 나타..

STUDY/ADsP 2022.05.20

ADsP 시험 D-1 개인용 내용 정리-2

계층적 군집분석 - 가장 유사한 개체를 묶어 나가는 과정 반복 원하는 개수의 군집을 형성 - 유사도 판단은 두 개체 간의 거리에 기반하므로 거리측정에 대한 정의가 필요 - 이상치에 민감 - 사전에 군집 수 K를 설정할 필요가 없는 탐색적 모형 - 병합적 방법에서 한번 군집이 형성되면 군집에 속한 개체는 다른 군집으로 이동할 수 없다 - Hclust(), Cluster 패키지의 agnes(), mclust() 함수 사용 1. 최단 연결법(단일 연결법) - 두 군집 사이의 거리의 최솟값을 측정, 건립된 군집을 찾는데 중점 2. 최장 연결법(완전연결법) - 두 군집 사이의 거리의 최댓값을 측정 3. 중심연결법 - 두 군집의 중심 간의 거리를 측정 4. 와드 연결법 - 군집 내 오차 제곱합에 기초하여 군집을 수..

STUDY/ADsP 2022.05.20

ADsP 시험 D-1 개인용 내용 정리 -1

범위 뒤죽박죽 내 맘대로 정리 데이터 분석 분석기획 - 분석 주제 유형 분석대상(What) 분석대상을 알고있다 분석대상을 모른다 분석방법(How) 분석방법을 알고있다. Optimization 최적화 Insight 통찰 분석방법을 모른다 Solution 솔루션 Discovery 발견 HOW/ OS - ID로 외우자 과제 중심 접근방식 - 단기, Speed & Test, Quick-Win 마스터플랜 단위 - 중장기 Accuacy& Deploy, Long Term 분석기획 시 고려사항 - 가용한데이터 - 데이터 유형 분석이 선행(정형/비정형/반정형) - 유즈케이스탐색 - 장애 요소들에 대한 사전 계획 수립 데이터 유형분류 정형 - ERD, CRM 등 엑셀을 생각 반정형 Comptitor Pricing , se..

STUDY/ADsP 2022.05.20
반응형