SQL ORDER 데이터 분석 최신 날짜 데이터 확인하기 SELECT * FROM orders ORDER BY order_date DESC LIMIT 100; 데이터가 많아 로딩하는게 시간이 많이 소요되어 limit로 제한을 두었다. 데이터는 25.06월까지 존재한다. 6 ~ 8월 데이터를 확인하기 위해 2024년의 데이터를 가지고 진행했다. ...
Google analytics
획득을 사용자 획득과 트래픽 획득 두 종류로 구분한다. 사용자 획득은 사람 단위이며 트래픽 획득은 세션 단위다. ex) 한 명의 사람이 총 5번 방문했다면 사용자 획득은 1(명의 사람), 트래픽 획득은 5(번의 방문)가 된다. 사용자가 웹사이트에 방문하여 세션이 시작되면 session_start 이벤트를 실행, 해당 사용자가 처음 방문...
입출고, 반품 데이터
Excel 데이터 구조 시트 목록: info, date, 출고, 입고, 반품 특징 정리 idx가 같으면 fruit, date도 같다. idx, fruit가 같아도 location은 다를 수 있다. type은 입고, 출고, 미출고, 반품이 있다. date는 입고 날짜를 의미 중복 데...
No kernel
Jupyter Notebook에서 No Kernel로 인해 실행이 되지 않았다. stack overflow를 보고 해결했다. Anaconda Prompt 에서 아래와 같이 입력 후 실행되었다. python -m pip install --upgrade setuptools python -m ensurepip --upgrade python -m pi...
E commerce
Kaggle의 e-commerce-customer-for-behavior-analysis 데이터를 가지고 진행했다. 데이터 가져오기 및 확인 import pandas as pd df = pd.read_csv('ecommerce_customer_data_large.csv') df.head() # df.tail() in...
상호작용과 성과 분석
문제 정의 사용자들의 학습성과를 높이려면? 기능 구현을 하면서 사용자들의 학습 성과를 높이려면 어떤 요소가 중요한지 고민하며 분석을 진행했다. 데이터는 Kaggle의 ONLINE EDUCATION SYSTEM REVIEW 데이터를 사용했으며 실제 프로젝트 데이터는 양이 적어 편향된 결과를 가져올 수 있어 제외했다. 데이터 전처리 impo...
분석 방법 정리
1. 기술 통계 1.1 모수 검정 vs 비모수 검정 모수 검정: 모집단의 분포에 대한 가정을 하고 검정 예: t-검정, ANOVA, 회귀 분석 비모수 검정: 모집단의 분포를 가정하지 않고 검정 예: Mann-Whitney U Test, 카이제곱 검정 비모수 검정이 필요한 ...
데이터 분석
데이터 분석 1. 데이터 가져오기 import pandas as pd # CSV 파일 불러오기 data = pd.read_csv('../kaggle/StudentPerformanceFactors.csv') print(data.head()) pandas : 데이터 처리 및 분석을 위한 라이브러리 read_csv : CSV 파일을 데이터프레임 형태로...
Python을 활용한 파이차트 이미지 생성
Python을 활용한 파이 차트 이미지 생성 이번 글은 python에서 파이 차트를 만들어 js에서 이미지로 보여주는 과정을 정리한 글이다. 1. DB 연결하기 환경변수 설정 환경 변수 파일(.env)을 활용하여 DB 연결 정보를 보호한다. DB_TYPE=mysql DB_DRIVER=pymysql DB_HOST=127.0.0.1 DB_USE...
Socketio와 nltk를 사용한 챗봇 구현
Python-SocketIO와 NLTK를 사용한 챗봇 구현 Python-SocketIO를 활용하여 실시간 양방향 통신을 구현하고 NLTK를 사용한 간단한 챗봇 기능을 추가했다. Spring과 WebSocket으로 채팅을 구현한 경험이 있어 이를 비교하면서 적용하니 이해가 더 쉬웠다. Spring WebSocket 경험이 있다면 SocketIO을 이...