
데이터 요약표본추출확률분포표본분표*기술통계란 데이터 분석의 목적으로 수집된 데이터를 확률, 통계적으로 정리,요약하는 기초적인 통계이다.*기술통계는 분석 초기 단계에서 데이터 분포의 특징을 파악하려는 목적으로 주로 산출한다.*통계적 수치를 계산하고 도출(평균, 분산, 표준편차)하거나 그래프를 활용하여 데이터에 대한 전반적인 이해를 돕는다.1. 데이터 요약(1) 기초 통계량평균 (mean) : 표본평균(X), 모평균(뮤), 가중평균중위수최빈값범위 (최대데이터 값-최소데이터값)분산 : 표본분산( 데이터값과 평균차이인 편차의 제곱의 합 / n-1) , 모분산(모집단의 분산 나누기 n)표준편차 : 분산의 양에 제곱근평균의 표준 오차 : 표본 평균의 표본 추출 분포에 대한 표준 편차. 모집단으로부터 수많은 표본들을..

시공간 데이터 탐색다변량 데이터 탐색비정형 데이터 탐색1. 시공간 데이터 탐색(1) 시공간 데이터시공간 데이터의 특징이산적 변화 : 데이터 수집 주기가 일정하지 않은 데이터. 시간의 변화에 따라 데이터가 추가됨연속적 변화 : 일정한 주기로 수집되는 데이터를 이용해 연속적으로 표현. 함수 이용시공간 데이터의 타입포인트 타입 : 하나의 노드로 구성되는 공간 데이터 타입라인 타입 : 서로 다른 두 개의 노드와 두 노드를 잇는 하나의 세그먼트로 구정폴리곤 타입 : n개(n≥3)의 노드와 n개의 세그먼트로 구성폴리라인 타입 : n개(n≥3)의 노드와 n-1개의 세그먼트로 구성(2) 시공간 데이터 탐색 절차주소를 행정구역으로 변환 : 엑셀split : split("a,bc",",")find : 문자열에서 가장 왼쪽..

빅데이터 플랫폼빅데이터와 인공지능개인정보보호법 제도개인정보 활용1. 빅데이터 플랫폼(1) 빅데이터 플랫폼의 개념가치를 추출하기 위한 과정 (수집 → 저장 → 처리 → 분석 → 시각화 과정)을 규격화한 기술특화된 분석 (의료, 환경, 범죄, 자동차)을 지원하는 빅데이터 플랫폼이 발전하는 추세임(2) 빅데이터 플랫폼 구성 요소수집 : 원천 데이터의 정형/반정형/비정형 데이터 수집 ex) ETL , EAI, 크롤러저장 : 정형/반정형/비정형 데이터 저장 ex) RDBMS, NoSQL분석 : 텍스트 분석, 머신러닝, 통계, 데이터 마이닝 ex) SNS 분석, 예측 분석활용 : 데이터 가시화 및 BI, Open API 연계 ex) 히스토그램, 인포그래픽 등*EAI_Enterprise Architecture Int..