본문 바로가기
반응형

자격증관련/ADsP2

통계분석의 이해 - 특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 - 조사대상에 따라 총조사(Census)와 표본조사(Sampling)으로 구분 ex. 인구주택 총 조사 등 - 모집단에서 샘플을 추출하여 진행하는 조사 모집단(Population) : 조사하고자 하는 대상 집단 전체 원소(Element) : 모집단을 구성하는 개체 표본(Sample) : 추출한 모집단 일부 원소 모수(Parameter) : 모집단에 대한 정보 - 표본에서 얻은 자료를 통해 모집단 전체의 특성을 추론 함으로써 생기는 오차 - 모집단을 대표할수 있는 표본단위들이 조사대상으로 추출되지 못하면 발생 - 표본오차를 제외한 조사의 전체 과정에서 발생할 수 있는 모든 오차 - 표본추출방법에서 기인하는 오차 단순랜덤.. 2023. 9. 13.
기초분석 및 데이터관리 데이터마트 - 데이터 웨어하우스와 사용자 사이 중간층에 위치 요약변수 - 분석에 맞게 종합한 변수, 데이터마트에서 가장 기본적인 변수 - 데이터 분석을 위해 만들어지는 변수 ex) 총 구매 금액, 금액 횟수, 구매 여부 등 파생변수 - 사용자(분석가)가 특정 조건을 만족하거나, 특정 함수에 의해 값이 만들어 의미를 부여한 변수 ex) 구매지수 [resahpe 패키지] : melt(), cast() [sqldf 패키지] : sql명령어 사용 가능하게 해주는 패키지 [plyr 패키지] : apply함수 기반, 데이터와 출력변수를 동시에 배열로 치환하여 처리해주는 패키지 [data.table 패키지] : 데이터 핸들링 패키지 - 큰 데이터의 탐색, 연산, 병합에 유용 - 기존의 data.frame 보다 월등히.. 2023. 9. 12.
반응형