「데이터 취준공부/「모빌리티 특화 전Z전능 데이터 분석가 양성과정

데이터 리터러시 특강 feat. 그로스쿨 대표님

kyleDA 2023. 10. 30. 16:44

도입


오늘은 데이터 리터러시 특강을 했다.어제까지 감기 때문에 몸이 아파서 오늘 올 수 있을지 걱정했는데, 다행히 약을 먹고자서 좀 괜찮다..몸이 아프면 다 내 손해고, 내 고생이니 빨리 나아서 앞으로 나아가자..!

 

오늘 '데이터 리터러시' 강의와 관련하여 무려 '그로스쿨' 대표님인'최기영' 대표님께서 목요일까지 수업을 진행하실 예정이다!

 

 

데이터 리터러시(문해력): 데이터를 읽고 이해한 것을 바탕으로 분석 결과를 전달하는 능력


☑️ 성과

= 동기 x 지식 x 실습 x 적용 x 습관

 

☑️ 우리 목표

: 데이터 분석/가시화가 무엇인지 알고 직접 실습 및 적용이 목표.


☑️ 데이터 정의

: 관찰, 실험, 조사 등으로 얻은 자료

 

☑️ 데이터 분석이란

- 상황 분석: 지금 무슨 일이 일어남?

- 원인 분석: 왜 이런 일이 발생?

- 예측 분석: 앞으로 어떻게 ?

 

=> 현재를 개선하고 미래를 예측해 더 나은 성과를 얻자.

 

☑️ 데이터는 결국 '가시화'를 해야한다.

- 그래프로 패턴 및 경향성을 파악해야

- 숨겨진 의미를 찾을 수 있다.

- 더 빠르게

 

☑️ A/B 테스트

: 두 가지 콘텐츠를 비교하여 방문자/뷰어가 더 높은 관심을 보이는 버전을 확인

- 주요 측정지표를 기반으로 가장 성공적인 버전을 측정하기 위해 변형(B) 버전과 비교하여 컨트롤(A) 버전을 검증

 

☑️ 데이터 읽기와 가시화 프로세스

: 데이터 저장 > 가설 수립 > 데이터 확보/탐색 > 데이터 처리 > 가시화 > 인사이트 도출 


☑️ 실습

- 가설: 날짜별로 치킨 판매량이 어떻게 다를까?

데이터 1, 2

- 일단 이 두 데이터를 합쳐야한다.

 

- date 함수를 통해 날짜 형식을 '년.월.일'로 바꾼다.

 

이중 if 문

- if(조건식, 참일 때 return 값, 거짓일 때 return 값)

 

처리한 데이터 바탕으로 '날씨'와 '치킨 판매량'의 상관관계 파악

 

☑️ 반드시 알아야할 엑셀 함수

: lookup, if, pivot table


☑️ 상관관계 vs 인과관계

[1] 상관관계(Correlation)

- 두 변수 간의 관계를 나타내는 통계적 척도.

- 한 변수가 변할 때 다른 변수도 일정한 방식으로 변하는 경향이 있는지를 측정.

- '-1(음의 상관관계) ~ 1(양의 상관관계)' 사이의 값

 

[2] 인과관계

- 한 변수의 변화가 다른 변수의 변화를 유발하는 관계

- 실험적 또는 관찰적 연구 설계를 통해 다양한 변수를 통제하고, 인과관계가 존재한다는 강력한 증거를 제시해야 함.

- 즉, 직접적인 발생의 원인이 되어야한다.

 

'판매량'과 '날씨' 두 변수의 pearson 상관관계 확인. PEARSON(범위Y, 범위X)


☑️ 엑셀 서식

숫자의 서식이 '일반 텍스트'로 되어 있어 합이 0으로 표시.

하지만, 서식을 정상적으로 '숫자'로 하면 합이 80으로 잘 계산된다.

 

☑️ count 함수

: A2부터 A전체값을 세어라(값이 계속 추가되어도 자동적으로 세어진다)

+ count 함수는 값이 '숫자'인 것만 센다!

(숫자 아닌 것도 세려면 -> COUNTA() )


☑️데이터 읽기와 가시화

· 가설 수립

: 분석 목적에 따라 문제를 명확(분석 대상 및 범위 지정)하게 정의

 

분석 결과 토대로 문제 재정의 필요 시, -> 가설 재수립

가설로 분석을 수행하지만, 분석 결과로 새로운 가설을 수립하기도 한다!