데이터 23

태블로 특강 - 1일차

태블로 특강 ☑️ 데이터 시각화로 설득하는 법 1. 지표 자체만 전달 2. 지표에 대한 비교 시각화 3. 지표에 액션을 유도하는 의미 부 => 전달하고자 하는 메시지에서 출발해 시각화 통한 비교와 평가로 액션을 유도하는 방향으로 설득 ☑️ 시각화의 시작은 '목적' 일단 그래프를 그려보고 나서 인사이트 도출 X 비교가 쉬워짐 : 범주 간 지표 scale이 차이나면 좋고 나쁨을 평가하기 어려움 - '전체'와 비교, '비슷한 카테고리'와 비교해 어떤지 평가 5. WHEN: 데이터 집계 기준이 되는 날짜 단위 : 의미 있는 인사이트 얻기 위한 단위로 구분 ☑️액셔너블한 데이터 시각화 1. high level 지표뿐만 아니라, input 지표를 파고들 수 있어야한다! - high level 지표란 수익과 직접적으..

데이터 분석가 특강

데이터 분석가 특강 ☑️ 데이터 활용 분야 - 예측 분석 - 마케팅 분석 - 고객 인사이트 - 비즈니스 성과분석 - 인공지능 - 빅데이터 ☑️ 데이터 분석가 - 데이터 시각화 역량 - 분석 위한 통계 지식 - sql 지식 - 리포팅(프레젠테이션) 능력 - 비즈니스/도메인 지식 ☑️ 데이터 분석가 업무 1. 데이터 전처리 및 수집 계획, A/B 테스트 설계 및 결과 분석 2. 분석 위한 적합한 모델 선택 및 사용 등등 데이터 분석가에게 코딩 능력도 중요하지만 도메인 knowledge가 제일 중요하다! ☑️ 데이터 분석 5단계 문제 정의 -> 데이터 수집 -> 전처리 -> 모델링 -> 시각화&탐색 ☑️ 데이터 수집 참고 사이트 - 데이터 안심구역 - 한국복지패널 - kosis - 구글 트렌드 - 네이버 데이..

Python 실습_day3 (seaborn)

seaborn ☑️ 산점도 (scatterplot) import seaborn as sns # 산점도_기본 sns.scatterplot(data = mpg, x = 'displ', y = 'hwy') sns.scatterplot(data = 사용할 데이터, x = 'x축 컬럼', y = 'y축 컬럼') # x축, y축 범위 설정 sns.scatterplot(data = mpg, x = 'displ', y = 'hwy').set(xlim = [3, 6], ylim = [10, 30]) sns.scatterplot(data = mpg, x = 'displ', y = 'hwy').set(xlim = [시작점, 끝점]) # '시작점 ~ 끝점' 범위 내에서 등분으로 범위 정해짐 # hue sns.scatterpl..

태블로 공부 5일차 - 도넛차

도입 오늘은 인기 많은 '도넛 차트'에 대해 배웠다. [태블로 기초] 3. '도넛 차트' 그리 ☑️ ctrl + 드래그 'ctrl + 드래그' 앤 드랍 안하면 [색상/크기/레이블/세부정보/도구설명/각도] 안에 못넣는다. ☑️ 머리글 제거 왼쪽 세로축 우클릭 - '머리글 표시'해제 -> 머리글 제거 되어 더 넓게 화면 쓸 수 있다. ☑️ 최종 완성된 도넛 차트 '각도'에도 '매출'과 같은 항목을 넣어줘야 도넛차트 내 구분이 잘 산다!

Python 실습_day1

도입 오늘은 python을 배우는 첫날이다.나는 이전까지 6개월 간 python을 배웠고, 최근 빅분기 실기를 준비하느라공부를 했어서 어느정도 알긴 하지만그래도 처음부터 배운다는 마음으로 내가 놓치고 있는 부분까지 완벽하게 배워서 숙달하려고 한다.실습 환경은 jupyter notebook으로 진행했다! python ☑️ 파이썬이란? - SW 개발- GUI/웹/DB 프로그래밍- 데이터/수치 분석 ☑️ 파이썬 연산 1. 제곱연산 a**b => a^b 2. 사칙연산 a=3b=4a+b -> 결과: 7 3. 조건문 (홀짝 판별) a = 13 b = a % 2 if b == 1: print('홀수') else: print('짝수') 결과: 홀수 3. 문자열 3-1. format 함수 이용한 포매팅 3-2. 기본 문..

SQL, EDA, 시각화

도입 오늘은 EDA에 대한 간단한 수업과 더불어 SQL로 데이터에 대해 가설을 세우고 인사이트를 도출하는 과정을 한다. EDA ☑️ EDA의 분석 대상 1. 일변량 분석 - 단일 변수의 데이터 분포를 이해하는 데 중점. - 이를 통해 변수의 중심 경향, 분산, 왜도, 첨도 등을 분석 가능. 중심 경향성: 평균, 중앙값, 최빈값 등을 통해 데이터의 중심이 어디에 위치하는지 파악합니다. 변동성: 표준편차, 분산, 범위, 사분위수 범위(Q1, Q3)를 사용하여 데이터의 퍼짐 정도를 분석합니다. 왜도(Skewness): 데이터가 얼마나 비대칭인지 측정합니다. 왜도가 0에 가까울수록 대칭을 이룹니다. 첨도(Kurtosis): 데이터가 얼마나 뾰족한가를 나타내며, 정규 분포의 첨도를 기준으로 비교합니다. 2. 다변..

SQL 쿼리 공부 2일 feat. DBeaver

도입 오늘은 DBeaver로 하는 SQL 쿼리 공부 2일차이다. 앞으로 SQL 프로젝트를 한다고 하니, 부족함 없이 공부를 해야겠다. SQL 쿼리문 ☑️ COALESCE 오른쪽 테이블에서 가져온 컬럼값은 비어 있을 수(NULL) 있다. - 3. RIGHT JOIN · 쿼리문: SELECT e.employee_id, e.name, d.department_name FROM employees RIGHT JOIN departments d ON e.department_id = d.department_id; · 예상 결과: employee_id name department_name 1 Alice HR 2 Bob IT NULL NULL Marketing RIGHT JOIN은 오른쪽 테이블의 모든 레코드와 왼쪽 테이블..

SQL 쿼리, A/B 테스트, 샘플링 feat. 그로스쿨 대표님

도입 오늘은 SQL 쿼리문에 대하여 배웠다. 실습은 아래 사이트에서 가능하다! https://www.w3schools.com/sql/trymysql.asp?filename=trysql_func_mysql_ascii MySQL Tryit Editor v1.0 WebSQL stores a Database locally, on the user's computer. Each user gets their own Database object. WebSQL is supported in Chrome, Safari, and Opera. If you use another browser you will still be able to use our Try SQL Editor, but a different version, us..

SQL by 스프레드 시트 feat. 그로스쿨 대표님

도입 오늘은 스프레드 시트에서 SQL 쿼리문을 짜는 수업을 했다.평소에 SQL은 쫌 했지만,스프레드시트에서 한 건 처음이었다. SQL (in 구글 스프레드시트) ☑️ QUERY 함수 1. 기본구조 = QUERY(data, "query", [headers]) data: 쿼리를 적용할 데이터 범위나 테이블. query: SQL과 유사한 쿼리 문자열. [headers]: 데이터에 포함된 헤더의 수를 지정 (옵션). 2. 예시 데이터를 선택하고 필터링: =QUERY(A1:C10, "SELECT A, B WHERE C > 100") 데이터 그룹화 및 집계: =QUERY(A1:C10, "SELECT A, SUM(B) GROUP BY A") 정렬과 제한: =QUERY(A1:C10, "SELECT A, B ORDER ..

데이터 분석 by EXCEL feat. 그로스쿨 대표님

도입 오늘은 다시 그로스쿨 대표님이 돌아오셨다! 엑셀로 하는 데이터 분석과 크롤링까지 실습했다. 웹 크롤링 (in 구글 스프레드시트) ☑️ importxml - URL: https://finance.naver.com/marketindex/ - Xpath는 내가 크롤링할 지수가 있는 페이지에서 'F12' 누르고 '검사할 페이지 요소 선택'으로 선택 후 마우스 우클릭 한다. 그 다음 '복사 - XPATH 복사'를 하면 된다. - 함수: =IMPORTXML( URL , xpath_검색어) ☑️ importHTML - importhtml 함수는 URL 내 내가 원하는 요소(TABLE 같은)를 불러오는 것이다. - E1 자리엔 "URL"이 들어가야한다. - 9는 페이지 내 9번째 "TABLE" 요소라는 의미.