「데이터 취준공부/「모빌리티 특화 전Z전능 데이터 분석가 양성과정

SQL 쿼리, A/B 테스트, 샘플링 feat. 그로스쿨 대표님

kyleDA 2023. 11. 15. 16:13

도입


오늘은 SQL 쿼리문에 대하여 배웠다.

실습은 아래 사이트에서 가능하다!

https://www.w3schools.com/sql/trymysql.asp?filename=trysql_func_mysql_ascii

 

MySQL Tryit Editor v1.0

WebSQL stores a Database locally, on the user's computer. Each user gets their own Database object. WebSQL is supported in Chrome, Safari, and Opera. If you use another browser you will still be able to use our Try SQL Editor, but a different version, usin

www.w3schools.com

 

 

SQL 쿼리문


☑️ BETWEEN

  • 설명: 특정 범위 안의 값 선택
  • 예시: SELECT * FROM employees WHERE age BETWEEN 25 AND 35;
  • 작성방법: BETWEEN 다음에 최소값과 최대값을 지정합니다.

 

☑️ IN

  • 설명: 지정된 값 목록 중 하나와 일치하는 항목 선택
  • 예시: SELECT * FROM products WHERE category IN ('Electronics', 'Books');
  • 작성방법: IN 다음에 괄호 안에 비교할 값들을 쉼표로 구분하여 나열합니다.

 

☑️ CASE

  • 설명: 조건에 따라 다른 결과를 반환
  • 예시

SELECT name,

CASE WHEN age < 20

THEN 'Teenager'

WHEN age

BETWEEN 20 AND 60

THEN 'Adult'

ELSE 'Senior'

END AS age_group

FROM peopl;e;

  • 작성방법: CASE 다음에 조건을 지정하고 WHEN, THEN으로 결과를 정의합니다.

CASE WHEN 조건 THEN '참'일 때 반환 ELSE '거짓'일 때 반환

 

☑️ IS NULL / NOT NULL

  • 설명: 값이 NULL인지 아닌지를 검사
  • 예시: SELECT * FROM customers WHERE phone_number IS NULL;
  • 작성방법: 필드명 뒤에 IS NULL 또는 IS NOT NULL을 사용합니다.

 

☑️ Sub Query 

  • 설명: 다른 쿼리 내에 포함된 쿼리
  • 예시:

SELECT * FROM employees WHERE salary > (SELECT AVG(salary) FROM employees);

  • 작성방법: 주 쿼리 내에서 괄호를 사용하여 서브 쿼리를 정의합니다.

 

A/B 테스트


☑️  A/B 테스트

: 사용자를 무작위로 나눠(A/B) 테스트해 더 나은 반응을 보이는 조건을 찾는 실험

- 통제 그룹: 기존 제품 및 기능 제공

- 실험 그룹: 새로운 버전 제공

※ A/B 테스트가 유용X인 경우도 있음

 

☑️ 다양한 AB 테스트 케이스 확인 가능한 사이트

https://www.abtestcases.com/

 

AB Testing Case Studies from the world’s data driven marketeers | CRO cases

CRO cases…

www.abtestcases.com

 

Sampling


☑️ Sampling

: 전체를 다 보는 것은 사실상 불가능 -> 일부만 뽑아(sampling) 분석 해 전체를 추정

 

☑️ 정규분포

: 자연 현상이나 여러 통계적 데이터에서 보여지는 분포 패턴

- 평균을 중심으로 몰려 있고 멀어질수록 빈도 감소

정규분포 그래프

 

- 1sd 안에 약 70%의 데이터가 들어감

- 2sd 안에 약 95%의 데이터가 들어감

 

☑️ 통계적 추정

: 정규 분포의 특성을 활용해 정규분포의 특성을 따르는 테스트(실험)의 결과 예측이 가능

-> 샘플링을 통한 모집단 추정 (정규분포라고 가정)