본문 바로가기

전체 글21

일자별 시간별 10분 단위 집계하기 / CASE WHEN 구문, SUBSTR , CONCAT 활용 테이블 구성이 아래와 같다고 해보자 (예시를 위해서 간단하게 작성했을 뿐 실제 로그에는 더 많은 정보가 담겨 있습니다) * Table name : sample1 time userid 2020-08-22 10:01:30.33 14321 2020-08-22 10:15:56.11 12341 2020-08-22 10:17:21.33 43563 2020-08-22 10:20:32.34 23456 원하는 결과물 > dt hhmm au 2020-08-22 10:00 1 2020-08-22 10:10 2 2020-08-22 10:20 1 일자별 시간별 10분 단위 집계 방법 작업하면서 유용하다고 생각했던 SQL 조건절입니다. 개인에 따라 추구하는 성능, 함수 등의 차이로 서로 옳다고 생각하는 방법이 다를 수 있습니다... 2020. 8. 30.
SQL 실무 함수 정리에 앞서 (PostgreSQL, HiveQL, Redshift) 포스팅의 목적/ 학부 시절 SQLD를 취득해 Data Analysis 직무 쪽으로 취업 후 별다른 발전없이 살아온 것 같아 자기발전을 위해 1) 그동안 사용해왔던 함수들을 정리하고 2) 지금까지는 성능을 고려하지 않은 쿼리를 짜왔다면 이제부턴 성능을 고려한 쿼리를 짜기 위해 내가 어떤 점들을 개선해 나가면 좋을지를 정리하고 싶어졌다! 약간의 중장기적인 목적으로는 심심하기도 하고 성장을 위해 SQLP 취득도 고려 중! 그동안의 사용 경험/ * 학부시절 : mySQL * 실무 : PostgreSQL(Redshift) , Apache HiveQL - 대부분은 유사하나 이것저것 쓰다보니 앞으로의 포스팅에서 혼재될 수 있음을 이해부탁드립니다. 시스템/1) PostgreSQL- 오픈소스 RDB로 다양한 플랫폼을 지.. 2020. 8. 16.
Python으로 주식 데이터 불러오기 - pandas_datareader PC 환경 MAC, anaconda 사용 ​ 미루고 미루던 공부를 물욕에 이끌려 시작 ㅎ0ㅎ ​ * 구글링을 통해 공부한 걸 정리하는 용도입니다 * ​ ​ 방법 1. 네이버 크롤링 (네이버는 크롤링이 막혀서 불가능, 크롤링 시도하면 해당 IP 차단된다고 들음. ) 방법 2. 증권사 API 연결 ( 증권사 프로그램, 보안 프로그램 설치가 필요, MAC에서 작업 불가) 방법 3. Yahoo Finance의 데이터 받아오기 ​ ​ 맥북 터미널은 command + space bar > 터미널 입력 window는 시작 > cmd 입력 # 사전 셋팅(terminal)에서 할 것 pip install pandas-datareader # 환경 셋팅 import pandas as pd ##pandas는 말해뭐해 impo.. 2020. 3. 24.