데이터분석
-
기술통계 분석과 시각화 (Visualization) - 기초편데이터 분석 (Data Analysis) 2023. 9. 9. 02:20
이번주에는 기술 통계 분석과 시각화 기법에 대해 소개한다. 고도화된 분석을 수행하기 전에 위 두가지를 먼저 선행하지 않는다면 데이터 분석 방향성을 잘못잡고 삽질할 가능성이 매우 높다. 데이터 분석은 무엇보다도 데이터에 대한 이해가 필수적인데, 기술통계 분석과 그래프가 본연의 데이터 이해를 돕는데 효과적이다. 여담으로 데이터 분석가로 업무를 수행하며 느꼈던 점은, '데이터 분석 앞에서 거만떨지말자!'이다 😂 데이터 분석의 본질은 fancy한 모델을 사용하거나, 최신 분석 모델을 사용하는 것이 아니라 설정한 가설이나 알고 싶은 포인트가 있는지 고민하고 데이터를 어떻게 해석하는가에 달려있다. 그러나 멋진 분석 용어들과 모델들을 뒤로하고, 기술통계량과 간단한 시각화로 분석을 마친 경우에는 완전한 분석을 하지 않..
-
데이터 형식과 타입데이터 분석 (Data Analysis) 2023. 9. 3. 00:49
데이터 분석에는 다양한 종류의 데이터가 활용된다. 이번 편에서는 데이터 종류를 형식 (Format) 과, 타입 (Type) 에 따라 용어를 알아본다. 1. 데이터 형식 (Data Formats) 데이터 형식는 크게 정형, 비정형, 반정형 3가지로 나눌 수 있다. 1-1. 정형 데이터 (Strunctured Data) 정형 데이터는 데이터가 구조화되어 있어서, 관계형 데이터베이스(RDB)와 같이 데이터 스키마가 명확히 정의된 데이터를 의미한다. 정형 데이터를 다루기 위해 SQL (Structured Query Language) 을 활용할 수 있다. 관계형 데이터베이스를 관리하는 시스템 (RDBMS) 는 대표적으로 Oracle, MySQL, PostgreSQL, MS-SQL 등이 있다. 예시: 엑셀 파일 등..
-
데이터 분석 목표과 절차데이터 분석 (Data Analysis) 2023. 8. 27. 21:46
이번 편에서는 데이터 분석 필요성을 먼저 알아본 후, 데이터 분석 절차에 대해 다룬다. 본 편 마지막에는 데이터 분석을 하며 느꼈던 주관적인 의견도 짤막하게 추가하였다. 1. 데이터 분석 이란 1-1. 데이터 분석이란 무엇인가 데이터 분석은 수많은 데이터를 수집하고 정제한 후, 이를 분석하여 유용한 인사이트를 도출하는 과정을 말한다. 1-2. 데이터 분석의 필요성 데이터 분석을 통해 조직이나 개인은 데이터에 기반해 더 객관적이고 효과적인 의사결정을 내려, 문제를 해결 및 설정한 목표를 달성에 도움을 줄 수 있다. 구체적으로 아래 사례들을 비롯해 다양한 측면에서 데이터 분석이 필요하다. 데이터 분석 활용 사례 인사이트 도출: 데이터 분석을 통해 기존에 인식하지 못했던 패턴이나 관계를 발견하고 유용한 정보를..
-
데이터 저장소 파헤치기데이터 분석 (Data Analysis) 2023. 8. 25. 23:28
본격적으로 데이터 분석을 다루기에 앞서, 데이터 저장소에 대해 먼저 알아본다. 각 데이터 저장소들이 어떤 의미를 가지는지 이해하기 위해 다음의 순서로 설명한다. 빅 데이터 - 데이터 웨어하우스 - 데이터 마트 - 데이터 레이크 1. 빅 데이터 (Big Data) 빅데이터는 정형 (Structured Data), 비정형 데이터 (Unstructured Data)를 모두 포함한다. 정형 데이터 정의: 미리 정의된 구조 또는 규칙을 따르는 데이터 예시: 날짜, 이름, 우편번호 등 규칙에 따라 적재된 데이터 비정형 데이터 정의: 정해진 구조 없이 저장된 데이터 예시: 텍스트, 이미지, 영상 등 빅데이터 자체만으로 의미를 가지긴 어렵고, 이를 가공하고 분석하여 정보를 얻는다. 빅데이터를 가공 및 분석하기 전에 빅..