미국 주식 데이터 수집 #0 못 찾겠으니 직접 모아보자!

 안녕하세요! 지난 번 포스팅에서 미국 대형 기술주를 매도하고 슈퍼 가치 전략을 운영하게 되었다고 알려드렸습니다(자세한 내용은 아래 포스팅 참고해주세요).

 

2020년 11월 미국 주식 매수(슈퍼 가치 전략)

 안녕하세요! 오늘은 새로운 전략으로 미국 주식 종목을 매수하여서 일지를 기록해봅니다. 올해 초 매수했던 미국 IT 대형주들의 성장세가 주춤하면서 새로운 종목들에 눈을 돌리게 되었습니다

lazyquant.tistory.com

 

 미국 주식 장에서 처음으로 도전해 본 퀀트 전략이 나름 나쁘지 않은 수익률을 거두고 있어서(1주일 밖에 안됐지만😂), 조금 더 다양한 전략들을 구사해보고 싶다는 욕구가 마구마구 생겨났습니다. 슈퍼 가치 전략의 경우에는 PER/PBR/PSR/PCR이라는 비교적 유명한(?) 지표들만을 사용했기 때문에 무료로 제공하는 스크리너로도 충분히 종목을 선정할 수 있었습니다.

 

 하지만 그 외 다양한 전략들을 시도하기에는 스크리너가 약간 애매했습니다. 성장성 지표가 있기는 하지만, YoY, QoQ를 구하기는 어려운 등 약간 아쉬운 면이 있었습니다. 그렇게 한동안 데이터를 찾아 떠돌았지만, 지금까지 찾지 못 했습니다.(4차 산업혁명 시대 데이터의 소중함을 뼈저리게 느끼고 있..)

 

 

절실히 느끼는 데이터의 중요성😥

 

 "역시나 엄청난 데이터를 깔끔하게 정리해주시는 분은 퀀트킹님밖에 없는가..!"라고 생각하며 포기를 하려고 했습니다. 하지만 퀀트 투자하면서 분기별 리밸런싱 하고 나면 뭐하겠습니까?! 남는 시간에 데이터 모으고, 분석하고, 전략 세우고, 백테스트하고 그러는 거 아니겠습니까? 다음 리밸런싱 때까지 시간이 많이 남았으니 느긋한 마음으로 직접 데이터를 모아보기로 하였습니다.

 

 그리고 이 포스팅은 그 첫번째 시간입니다! 시리즈물로 기획해볼 생각인데, 소리 소문 없이 사라질지도 모릅니다.

 

1.어디서 데이터를 모을 것인가?

 제가 원하는 형태의 데이터를 찾기 위해 investing.com, iex, stockrow 등 많은 사이트를 돌아보았습니다. 그런데 크롤링을 하기에 딱 적합한 사이트는 없어보였습니다. 그렇게 구글링을 하며 전전긍긍하고 있었는데, 등잔 밑이 어둡다고? 평소에 자주 쓰던 Yahoo Finance에서 제가 원하는 형태의 데이터를 제공했습니다.

 

출처:Yahoo Finance

적절히 크롤링하면 미국 주식에 대한 거의 모든 데이터를 모을 수 있을 것 같았습니다.

 

참고) Yahoo Finance의 Financial 탭

 

Apple Inc. (AAPL) Income Statement - Yahoo Finance

Get the detailed quarterly/annual income statement for Apple Inc. (AAPL). Find out the revenue, expenses and profit or loss over the last fiscal year.

finance.yahoo.com

 

2.어떻게 데이터를 모을 것인가?

 수천개가 넘는 종목의 데이터를 일일히 복사+붙여넣기를 할 수는 없기 때문에, 처음에는 크롤링을 해야겠다고 마음을 먹었습니다. 그러다가 크롤링 작업을 딱! 시작하기 전에, 혹시 이런 데이터를 제공하는 API나 라이브러리가 있지 않을까? 하고 찾아봤더니! 무료 오픈소스 라이브러리가 존재했습니다🤣

 

참고) Yahoo_fin 오픈소스 소개

 

Yahoo_fin Documentation - Open Source Automation

Python's yahoo_fin package lets you download historical stock price data, real-time prices, fundamentals data, option prices, cryptocurrency info, and more!

theautomatic.net

 

3.어떤 데이터를 모을 것인가?

 아직 Yahoo_fin 라이브러리를 직접 사용해보지 않아서, 원하는 데이터를 다 제공해줄지는 모르겠지만, 우선 필요한 데이터를 대략적으로 정리해보았습니다.

 

티커, 종목명, 시가총액, 등락률, OPM, ROE, ROA, PCR, PFCR, PSR, PER, PBR, EV/EBITDA, NACV, 유동비율, 부채비율, 매출액, 영업이익, 순이익, 거래대금, 분기별 실적, 연도별 실적

 

이 정도가 있으면 대략적으로 원하는 전략들을 실행해볼 수 있을 것 같습니다. Yahoo_fin이 이 모든 데이터를 제공해주면 참 좋겠지만, 안 되더라도 크롤링이 있으니 꾸준히 시도해볼 예정입니다.

 

 앞으로 미국 주식 데이터 모으기 시리즈 기대해주시고, 지켜봐주세요 : )

 

댓글()