데이터분석가
-
기술통계 분석과 시각화 (Visualization) - 기초편데이터 분석 (Data Analysis) 2023. 9. 9. 02:20
이번주에는 기술 통계 분석과 시각화 기법에 대해 소개한다. 고도화된 분석을 수행하기 전에 위 두가지를 먼저 선행하지 않는다면 데이터 분석 방향성을 잘못잡고 삽질할 가능성이 매우 높다. 데이터 분석은 무엇보다도 데이터에 대한 이해가 필수적인데, 기술통계 분석과 그래프가 본연의 데이터 이해를 돕는데 효과적이다. 여담으로 데이터 분석가로 업무를 수행하며 느꼈던 점은, '데이터 분석 앞에서 거만떨지말자!'이다 😂 데이터 분석의 본질은 fancy한 모델을 사용하거나, 최신 분석 모델을 사용하는 것이 아니라 설정한 가설이나 알고 싶은 포인트가 있는지 고민하고 데이터를 어떻게 해석하는가에 달려있다. 그러나 멋진 분석 용어들과 모델들을 뒤로하고, 기술통계량과 간단한 시각화로 분석을 마친 경우에는 완전한 분석을 하지 않..
-
데이터 형식과 타입데이터 분석 (Data Analysis) 2023. 9. 3. 00:49
데이터 분석에는 다양한 종류의 데이터가 활용된다. 이번 편에서는 데이터 종류를 형식 (Format) 과, 타입 (Type) 에 따라 용어를 알아본다. 1. 데이터 형식 (Data Formats) 데이터 형식는 크게 정형, 비정형, 반정형 3가지로 나눌 수 있다. 1-1. 정형 데이터 (Strunctured Data) 정형 데이터는 데이터가 구조화되어 있어서, 관계형 데이터베이스(RDB)와 같이 데이터 스키마가 명확히 정의된 데이터를 의미한다. 정형 데이터를 다루기 위해 SQL (Structured Query Language) 을 활용할 수 있다. 관계형 데이터베이스를 관리하는 시스템 (RDBMS) 는 대표적으로 Oracle, MySQL, PostgreSQL, MS-SQL 등이 있다. 예시: 엑셀 파일 등..