자동화 Python 기본 문법 및 개념 파일 실행 __name__ == "__main__" 해당 파이썬 파일이 직접 실행될 때만 그 안의 코드를 실행하도록 하는 구문 다른 파일에서 import할 경우에는 실행되지 않는다. Import 다른 파일에서 실행할 때 import 구문으로 가져오기 위해 파일명을 간단하게 작성 # a.py def ...
광고 데이터
데이터 전처리 & 분석 데이터 : 2025.08.01 ~ 2025.08.29 (임의 생성 데이터) random.randint, random.choice 활용 지표 계산 : CTR, CPC, 전환율, CPA, ROAS, CPM 전처리 : INF → NaN → 0 대체, 반올림 처...
Sql order 데이터 분석
SQL ORDER 데이터 분석 최신 날짜 데이터 확인하기 SELECT * FROM orders ORDER BY order_date DESC LIMIT 100; 데이터가 많아 로딩하는게 시간이 많이 소요되어 limit로 제한을 두었다. 데이터는 25.06월까지 존재한다. 6 ~ 8월 데이터를 확인하기 위해 2024년의 데이터를 가지고 진행했다. ...
Google analytics
획득을 사용자 획득과 트래픽 획득 두 종류로 구분한다. 사용자 획득은 사람 단위이며 트래픽 획득은 세션 단위다. ex) 한 명의 사람이 총 5번 방문했다면 사용자 획득은 1(명의 사람), 트래픽 획득은 5(번의 방문)가 된다. 사용자가 웹사이트에 방문하여 세션이 시작되면 session_start 이벤트를 실행, 해당 사용자가 처음 방문...
입출고, 반품 데이터
Excel 데이터 구조 시트 목록: info, date, 출고, 입고, 반품 특징 정리 idx가 같으면 fruit, date도 같다. idx, fruit가 같아도 location은 다를 수 있다. type은 입고, 출고, 미출고, 반품이 있다. date는 입고 날짜를 의미 중복 데...
No kernel
Jupyter Notebook에서 No Kernel로 인해 실행이 되지 않았다. stack overflow를 보고 해결했다. Anaconda Prompt 에서 아래와 같이 입력 후 실행되었다. python -m pip install --upgrade setuptools python -m ensurepip --upgrade python -m pi...
E commerce
Kaggle의 e-commerce-customer-for-behavior-analysis 데이터를 가지고 진행했다. 데이터 가져오기 및 확인 import pandas as pd df = pd.read_csv('ecommerce_customer_data_large.csv') df.head() # df.tail() in...
상호작용과 성과 분석
문제 정의 사용자들의 학습성과를 높이려면? 기능 구현을 하면서 사용자들의 학습 성과를 높이려면 어떤 요소가 중요한지 고민하며 분석을 진행했다. 데이터는 Kaggle의 ONLINE EDUCATION SYSTEM REVIEW 데이터를 사용했으며 실제 프로젝트 데이터는 양이 적어 편향된 결과를 가져올 수 있어 제외했다. 데이터 전처리 impo...
분석 방법 정리
1. 기술 통계 1.1 모수 검정 vs 비모수 검정 모수 검정: 모집단의 분포에 대한 가정을 하고 검정 예: t-검정, ANOVA, 회귀 분석 비모수 검정: 모집단의 분포를 가정하지 않고 검정 예: Mann-Whitney U Test, 카이제곱 검정 비모수 검정이 필요한 ...
데이터 분석
데이터 분석 1. 데이터 가져오기 import pandas as pd # CSV 파일 불러오기 data = pd.read_csv('../kaggle/StudentPerformanceFactors.csv') print(data.head()) pandas : 데이터 처리 및 분석을 위한 라이브러리 read_csv : CSV 파일을 데이터프레임 형태로...