da 5

SQL, EDA, 시각화

도입 오늘은 EDA에 대한 간단한 수업과 더불어 SQL로 데이터에 대해 가설을 세우고 인사이트를 도출하는 과정을 한다. EDA ☑️ EDA의 분석 대상 1. 일변량 분석 - 단일 변수의 데이터 분포를 이해하는 데 중점. - 이를 통해 변수의 중심 경향, 분산, 왜도, 첨도 등을 분석 가능. 중심 경향성: 평균, 중앙값, 최빈값 등을 통해 데이터의 중심이 어디에 위치하는지 파악합니다. 변동성: 표준편차, 분산, 범위, 사분위수 범위(Q1, Q3)를 사용하여 데이터의 퍼짐 정도를 분석합니다. 왜도(Skewness): 데이터가 얼마나 비대칭인지 측정합니다. 왜도가 0에 가까울수록 대칭을 이룹니다. 첨도(Kurtosis): 데이터가 얼마나 뾰족한가를 나타내며, 정규 분포의 첨도를 기준으로 비교합니다. 2. 다변..

SQL 쿼리 공부 feat. DBeaver

도입 오늘은 모빌리티에서 주신 데이터를 바탕으로 sql 쿼리 공부를 했다. 작업환경은 dbeaver에서 했는데, 창배치를 아래와 같이 했더니 약간 spider와 비슷하게 생겼다. SQL 쿼리문 ☑️ 기업 내 데이터 활용 단계 ☑️ DA가 sql에서 주로 쓰는 것 - select - join - union (사실 많이 안쓰긴함) - 서브쿼리 - creat view CREATE [OR REPLACE] VIEW 뷰 이름 AS 쿼리 출처: https://devjhs.tistory.com/434 [키보드와 하루:티스토리] ☑️ 뷰(VIEW)란 무엇인가? 쉽게 말하면 하나의 가상 테이블. 1개 혹은 그 이상의 테이블에서 SELECT로 테이블을 Join하거나 자신이 보고자 하는 컬럼을 넣어서 만든 가상의 테이블. 출..

엑셀 데이터 분석 feat. 그로스쿨 대표님 (3일차)

도입 그로스쿨 '최기영' 대표님의 데이터 분석가 말말말! - 큰 조직(대기업)으로 갈수록 데이터 분석가 업무가 specialist의 영역으로 간다. - 데이터 확인 > 가설 세우고 > 가설 세우기 위한 데이터 확보 > 시각화 > 인사이트 도출 > 전략 제시 - specialist일수록 교체 되기 쉽다. 즉, 어느 조직이던 들어가기 쉽지만, 들어가기 쉽다는건 그만큼 교체도 많이 된다. - 반면, generalist는 잡다하게 일을 많이해서 불안하다. 하지만, 대체 가능성이 적어진다. - 데이터 분석가들이 요즘 generalist가 되어가는 추세이다. - 데이터를 많이 다뤄본 역량을 어필해야한다! - 데이터 분석가로서의 역량이 지금 부족해도 일단, 자기소개서에 역량이 있다고 작성해라 -> 하면 당연히 생긴다..

쏘카(SOCAR) 데이터 분석가 현업자 특강

도입 오늘은 쏘카에서 데이터 분석가 현업자 분이 와서 취업 특강을 해주셨다. 쏘카도 평소에 가고 싶던 회사이기 때문에 완전 경청했다. 데이터 분석가 취업 특강 ☑️ 데이터 분석하는 이유 - 갖고 있는 자원에서 최적의 선택 : 가진 자원이 한정적이고 인력도 부족하여 이 상황에서 최적의 선택을 내린다 - 구성원들 간의 합의를 위해 : 데이터를 기반으로 증명하는 것은 가장 객관적 ☑️ 데이터 분석 예시 1. 어느 지역에 카페 차릴지 고민 중 -> 대학생 많이 사는 지역에 카페 열면 장사 더 잘될까?=> '지역별 대학생 거주인구 수'와 '지역별 카페의 1년 내 폐점률' 두 변수 간 상관관계 분석 2. 학생을 위한 교육용 sw의 부정사용범 잡고 싶다. 어떻게하면 잡을 수 있을까?=> 일반 학생들의 하루 접속량 통..

태블로 공부 2일차 - 태블로 인터페이스

도입 오늘부터 태블로 공부를 시작할거다. 일요일은 원래 쉬려고 했으나, 영상 길이가 짧기 때문에 스낵 스터디의 느낌으로 간다! 화이팅~~ [태블로 기초] 2. 태블로 인터페이스 ☑️ 각종 패널들 1. 메뉴 2. 데이터 / 분석 3. 페이지 / 필터 / 마크 - 자동: 데이터 유형 선택 - 색상, 크기, 텍스트 등 다양한 옵션 선택 가능 4. 행 / 열 ☑️ 데이터 패널 데이터 패널에 있는 모든 값들 = 필드(차원 + 측정값) - 차원: '데이터 목록'이자 상단 영역 - 측정값: 하단 영역 -> '측정값'을 집계(합계, 평균, 최대, 최소 등)할 때, 기준이 되는 것이 '차원'의 데이터들이다. ☑️ 마크 패널에서 그래프 종류 바꾸기 1. 영역 2. 라인 3. 원 '원'처럼 데이터 종류에 따라 크기 조절이 ..