미국 주식 데이터 수집 #4 저장된 데이터 분석
안녕하세요!
지난 포스팅까지 우리는 미국 주식 데이터를 불러오고, 가공하여서, 저장해보았습니다. 구슬이 서말이라도 꿰어야 보배라고 하죠? 아무리 많은 데이터를 쌓아놓는다고 하더라도 활용하지 않으면 그저 저장 공간만 차지할 뿐입니다. 직접 수집한 데이터로 투자할 종목을 찾아내는데까지가 "직접" 해보아야 할 영역입니다 : )
1. 저장 데이터 확인
SELECT COUNT(*) FROM STOCK_INFO_USA;
--COUNT(*)
--6772
워낙 데이터 수집 및 저장에 오래 걸려서 아직도 진행 중이긴 하지만(중간에 계속 소스코드를 수정하고, 다시 수집하고 해서 엄청 오래 걸렸네요😅), 현재까지 얼마나 데이터가 수집되었는지 확인해보겠습니다. 대상 리스트에 약 9천개의 종목이 있었던 걸로 기억하는데, 그 중에 정상적으로 수집된 것이 6,700여개 정도 되네요. 미국 주식의 종류에 따라서 정보가 있는 것도 있고, 없는 것도 있어서 있는 것들로만 저장을 했었습니다.
FINVIZ나 STOCKROW 등 스크리닝 서비스를 제공하는 사이트에서도 전체 리스트의 수가 달라서 조금 의아했었는데, 위의 이유가 아닐까 싶습니다. 전체 데이터를 완벽하게 갖추지 못 하는 것이 아쉽기는 하지만, 그래도 종목을 선별해내는 데에는 충분한 데이터라고 생각됩니다.
2. 간단한 데이터 분석
SELECT * FROM (
SELECT *
FROM STOCK_INFO_USA
WHERE MARKET_CAP > 0
ORDER BY MARKET_CAP
LIMIT 1000
) A
WHERE VOLUME >= 100000
AND PRICE1 >= -60
AND LIAB/EQUITY*100 < 250
AND RE_QOQ1 > 0
AND OI_QOQ1 > 0
AND NI_QOQ1 > 0
AND RE_QOQ2 > 0
AND OI_QOQ2 > 0
AND NI_QOQ2 > 0
;
이제 저장된 데이터로 간단하게 종목을 한 번 추출해보도록 하겠습니다. 위 쿼리를 간단히 살펴보겠습니다.
- 시가총액이 하위 약 30%
- 거래대금이 10만 달러(약 1억원) 이상
- 1개월 등락률이 -60% 이상
- 부채비율이 250% 미만
- 매출액, 영업이익, 순이익의 현분기 증가율 0 초과
- 매출액, 영업이익, 순이익의 전분기 증가율 0 초과
위 조건에 해당하는 종목들을 조회하는 쿼리입니다. 18개 종목이 아래와 같이 조회되네요.
한 달 사이에 283%가 상승한 종목도 눈에 띄네요 : )
쿼리를 조작해서 간단하게 여러가지 정보들도 분석해볼 수 있습니다. 위 종목들의 기간별 평균 등락률을 확인해보니 꽤나 높게 나타나네요.
1개월 등락률 평균 | 3개월 등락률 평균 | 6개월 등락률 평균 |
28.267777186301018 | 42.79333265622457 | 55.66444391674466 |
물론 매출액, 영업이익, 순이익의 증가율이 0 초과라는 조건은 이런 식으로 데이터를 추출할 수 있다라는 것을 보여드리기 위한 예시일 뿐입니다. 실제로 고속성장 종목들을 추출하고 투자하는 과정은 앞으로의 포스팅을 통해서 보여드릴 수 있도록 하겠습니다 : )