청취사 18

태블로 특강 - 1일차

태블로 특강 ☑️ 데이터 시각화로 설득하는 법 1. 지표 자체만 전달 2. 지표에 대한 비교 시각화 3. 지표에 액션을 유도하는 의미 부 => 전달하고자 하는 메시지에서 출발해 시각화 통한 비교와 평가로 액션을 유도하는 방향으로 설득 ☑️ 시각화의 시작은 '목적' 일단 그래프를 그려보고 나서 인사이트 도출 X 비교가 쉬워짐 : 범주 간 지표 scale이 차이나면 좋고 나쁨을 평가하기 어려움 - '전체'와 비교, '비슷한 카테고리'와 비교해 어떤지 평가 5. WHEN: 데이터 집계 기준이 되는 날짜 단위 : 의미 있는 인사이트 얻기 위한 단위로 구분 ☑️액셔너블한 데이터 시각화 1. high level 지표뿐만 아니라, input 지표를 파고들 수 있어야한다! - high level 지표란 수익과 직접적으..

통계 검정 및 분석 (검정통계량, p-value, t검정 등)

통계분석 통계 분석은 2가지로 나뉜다. ☑️ 기술 통계 분석 : 데이터를 요약해 설명 ☑️ 추론 통계 분석 : 단순 숫자 요약을 넘어 어떤 값이 발생할 확률을 계산 ☑️ 통계적 가설 검정 : 유의확률(p-value)를 이용해 가설 검정. - 대체로 0.05 (5%)를 판단 기준으로 삼는다. - 5% 초과: 집단간 차이가 통계적 유의 x - 5% 미만: 통계적으로 유의하다.(우연이 아니다) ☑️ t-test (t 검정) : 두 집단 평균 비교 : 두 집단의 평균에 통계적으로 유의한 차이가 있는지 알아볼 때 사용하는 통계분석 기법 ☑️ 상황 및 데이터 종류별 검정 방법 t-검정 (t-test) 독립 표본 t-검정 (Independent samples t-test): 두 독립적인 집단 간의 평균 차이를 비교 ..

Python 실습_day3 (seaborn)

seaborn ☑️ 산점도 (scatterplot) import seaborn as sns # 산점도_기본 sns.scatterplot(data = mpg, x = 'displ', y = 'hwy') sns.scatterplot(data = 사용할 데이터, x = 'x축 컬럼', y = 'y축 컬럼') # x축, y축 범위 설정 sns.scatterplot(data = mpg, x = 'displ', y = 'hwy').set(xlim = [3, 6], ylim = [10, 30]) sns.scatterplot(data = mpg, x = 'displ', y = 'hwy').set(xlim = [시작점, 끝점]) # '시작점 ~ 끝점' 범위 내에서 등분으로 범위 정해짐 # hue sns.scatterpl..

Python 실습_day2

도입 오늘은 python을 배우는 첫날이다.나는 이전까지 6개월 간 python을 배웠고, 최근 빅분기 실기를 준비하느라공부를 했어서 어느정도 알긴 하지만그래도 처음부터 배운다는 마음으로 내가 놓치고 있는 부분까지 완벽하게 배워서 숙달하려고 한다.실습 환경은 jupyter notebook으로 진행했다! python ☑️ 반올림, 소수점 n자리까지 출력, 띄어쓰기 ☑️ 딕셔너리 get 함수 - 딕셔너리명.get('key') -> value 출력 ☑️ 딕셔너리에 새로운 key:value 추가 딕셔너리명['key'] = value ☑️ 리스트 컴프리헨션

Python 실습_day1

도입 오늘은 python을 배우는 첫날이다.나는 이전까지 6개월 간 python을 배웠고, 최근 빅분기 실기를 준비하느라공부를 했어서 어느정도 알긴 하지만그래도 처음부터 배운다는 마음으로 내가 놓치고 있는 부분까지 완벽하게 배워서 숙달하려고 한다.실습 환경은 jupyter notebook으로 진행했다! python ☑️ 파이썬이란? - SW 개발- GUI/웹/DB 프로그래밍- 데이터/수치 분석 ☑️ 파이썬 연산 1. 제곱연산 a**b => a^b 2. 사칙연산 a=3b=4a+b -> 결과: 7 3. 조건문 (홀짝 판별) a = 13 b = a % 2 if b == 1: print('홀수') else: print('짝수') 결과: 홀수 3. 문자열 3-1. format 함수 이용한 포매팅 3-2. 기본 문..

SQL, EDA, 시각화

도입 오늘은 EDA에 대한 간단한 수업과 더불어 SQL로 데이터에 대해 가설을 세우고 인사이트를 도출하는 과정을 한다. EDA ☑️ EDA의 분석 대상 1. 일변량 분석 - 단일 변수의 데이터 분포를 이해하는 데 중점. - 이를 통해 변수의 중심 경향, 분산, 왜도, 첨도 등을 분석 가능. 중심 경향성: 평균, 중앙값, 최빈값 등을 통해 데이터의 중심이 어디에 위치하는지 파악합니다. 변동성: 표준편차, 분산, 범위, 사분위수 범위(Q1, Q3)를 사용하여 데이터의 퍼짐 정도를 분석합니다. 왜도(Skewness): 데이터가 얼마나 비대칭인지 측정합니다. 왜도가 0에 가까울수록 대칭을 이룹니다. 첨도(Kurtosis): 데이터가 얼마나 뾰족한가를 나타내며, 정규 분포의 첨도를 기준으로 비교합니다. 2. 다변..

SQL 쿼리 공부 2일 feat. DBeaver

도입 오늘은 DBeaver로 하는 SQL 쿼리 공부 2일차이다. 앞으로 SQL 프로젝트를 한다고 하니, 부족함 없이 공부를 해야겠다. SQL 쿼리문 ☑️ COALESCE 오른쪽 테이블에서 가져온 컬럼값은 비어 있을 수(NULL) 있다. - 3. RIGHT JOIN · 쿼리문: SELECT e.employee_id, e.name, d.department_name FROM employees RIGHT JOIN departments d ON e.department_id = d.department_id; · 예상 결과: employee_id name department_name 1 Alice HR 2 Bob IT NULL NULL Marketing RIGHT JOIN은 오른쪽 테이블의 모든 레코드와 왼쪽 테이블..

SQL 쿼리 공부 feat. DBeaver

도입 오늘은 모빌리티에서 주신 데이터를 바탕으로 sql 쿼리 공부를 했다. 작업환경은 dbeaver에서 했는데, 창배치를 아래와 같이 했더니 약간 spider와 비슷하게 생겼다. SQL 쿼리문 ☑️ 기업 내 데이터 활용 단계 ☑️ DA가 sql에서 주로 쓰는 것 - select - join - union (사실 많이 안쓰긴함) - 서브쿼리 - creat view CREATE [OR REPLACE] VIEW 뷰 이름 AS 쿼리 출처: https://devjhs.tistory.com/434 [키보드와 하루:티스토리] ☑️ 뷰(VIEW)란 무엇인가? 쉽게 말하면 하나의 가상 테이블. 1개 혹은 그 이상의 테이블에서 SELECT로 테이블을 Join하거나 자신이 보고자 하는 컬럼을 넣어서 만든 가상의 테이블. 출..

SQL 쿼리, A/B 테스트, 샘플링 feat. 그로스쿨 대표님

도입 오늘은 SQL 쿼리문에 대하여 배웠다. 실습은 아래 사이트에서 가능하다! https://www.w3schools.com/sql/trymysql.asp?filename=trysql_func_mysql_ascii MySQL Tryit Editor v1.0 WebSQL stores a Database locally, on the user's computer. Each user gets their own Database object. WebSQL is supported in Chrome, Safari, and Opera. If you use another browser you will still be able to use our Try SQL Editor, but a different version, us..

SQL by 스프레드 시트 feat. 그로스쿨 대표님

도입 오늘은 스프레드 시트에서 SQL 쿼리문을 짜는 수업을 했다.평소에 SQL은 쫌 했지만,스프레드시트에서 한 건 처음이었다. SQL (in 구글 스프레드시트) ☑️ QUERY 함수 1. 기본구조 = QUERY(data, "query", [headers]) data: 쿼리를 적용할 데이터 범위나 테이블. query: SQL과 유사한 쿼리 문자열. [headers]: 데이터에 포함된 헤더의 수를 지정 (옵션). 2. 예시 데이터를 선택하고 필터링: =QUERY(A1:C10, "SELECT A, B WHERE C > 100") 데이터 그룹화 및 집계: =QUERY(A1:C10, "SELECT A, SUM(B) GROUP BY A") 정렬과 제한: =QUERY(A1:C10, "SELECT A, B ORDER ..