광고 데이터
데이터 전처리 & 분석 데이터 : 2025.08.01 ~ 2025.08.29 (임의 생성 데이터) random.randint, random.choice 활용 지표 계산 : CTR, CPC, 전환율, CPA, ROAS, CPM 전처리 : INF → NaN → 0 대체, 반올림 처...
데이터 전처리 & 분석 데이터 : 2025.08.01 ~ 2025.08.29 (임의 생성 데이터) random.randint, random.choice 활용 지표 계산 : CTR, CPC, 전환율, CPA, ROAS, CPM 전처리 : INF → NaN → 0 대체, 반올림 처...
SQL ORDER 데이터 분석 최신 날짜 데이터 확인하기 SELECT * FROM orders ORDER BY order_date DESC LIMIT 100; 데이터가 많아 로딩하는게 시간이 많이 소요되어 limit로 제한을 두었다. 데이터는 25.06월까지 존재한다. 6 ~ 8월 데이터를 확인하기 위해 2024년의 데이터를 가지고 진행했다. ...
획득을 사용자 획득과 트래픽 획득 두 종류로 구분한다. 사용자 획득은 사람 단위이며 트래픽 획득은 세션 단위다. ex) 한 명의 사람이 총 5번 방문했다면 사용자 획득은 1(명의 사람), 트래픽 획득은 5(번의 방문)가 된다. 사용자가 웹사이트에 방문하여 세션이 시작되면 session_start 이벤트를 실행, 해당 사용자가 처음 방문...
Excel 데이터 구조 시트 목록: info, date, 출고, 입고, 반품 특징 정리 idx가 같으면 fruit, date도 같다. idx, fruit가 같아도 location은 다를 수 있다. type은 입고, 출고, 미출고, 반품이 있다. date는 입고 날짜를 의미 중복 데...
Jupyter Notebook에서 No Kernel로 인해 실행이 되지 않았다. stack overflow를 보고 해결했다. Anaconda Prompt 에서 아래와 같이 입력 후 실행되었다. python -m pip install --upgrade setuptools python -m ensurepip --upgrade python -m pi...
Kaggle의 e-commerce-customer-for-behavior-analysis 데이터를 가지고 진행했다. 데이터 가져오기 및 확인 import pandas as pd df = pd.read_csv('ecommerce_customer_data_large.csv') df.head() # df.tail() in...
문제 정의 사용자들의 학습성과를 높이려면? 기능 구현을 하면서 사용자들의 학습 성과를 높이려면 어떤 요소가 중요한지 고민하며 분석을 진행했다. 데이터는 Kaggle의 ONLINE EDUCATION SYSTEM REVIEW 데이터를 사용했으며 실제 프로젝트 데이터는 양이 적어 편향된 결과를 가져올 수 있어 제외했다. 데이터 전처리 impo...
1. 기술 통계 1.1 모수 검정 vs 비모수 검정 모수 검정: 모집단의 분포에 대한 가정을 하고 검정 예: t-검정, ANOVA, 회귀 분석 비모수 검정: 모집단의 분포를 가정하지 않고 검정 예: Mann-Whitney U Test, 카이제곱 검정 비모수 검정이 필요한 ...
데이터 분석 1. 데이터 가져오기 import pandas as pd # CSV 파일 불러오기 data = pd.read_csv('../kaggle/StudentPerformanceFactors.csv') print(data.head()) pandas : 데이터 처리 및 분석을 위한 라이브러리 read_csv : CSV 파일을 데이터프레임 형태로...
Python을 활용한 파이 차트 이미지 생성 이번 글은 python에서 파이 차트를 만들어 js에서 이미지로 보여주는 과정을 정리한 글이다. 1. DB 연결하기 환경변수 설정 환경 변수 파일(.env)을 활용하여 DB 연결 정보를 보호한다. DB_TYPE=mysql DB_DRIVER=pymysql DB_HOST=127.0.0.1 DB_USE...