2021년 8월 4일 수요일

DB construction - 2. 데이터를 어디서 가져오지?

금융 관련 데이터를 구하기 위한 여러 노력을 했었는데, 생각보다 쉽지 않더라구요. 
지금까지 찾아본 내용들을 정리하면서 앞으로의 방향을 찾아보려고 합니다.

크게 구할 수 있는 데이터의 종류를 나누어보면
일별 주가 데이터 / 거래별 체결 데이터 / 재무제표 데이터 정도가 될 것 같아요!
차례차례 보통 어디서 구했는지 정리를 좀 해보겠습니다. 크롤링도 하고 이곳저곳 돌아다니면서 데이터를 구해왔었는데, 그 중 가장 편리했던 방법들만 좀 적어보겠습니다.

1. 일별 주가 데이터
일별 주가 데이터를 구하는 방법도 여러가지가 있지만, 가장 편하게 사용했던 건 역시
FinanceDataReader였던 것 같습니다. 물론 구매해서 사용하면 더 깔끔하게 받을 수 있겠지만, 굳이 구매하지 않아도 편하게 받아와서 사용할 수 있어서 좋습니다.


단점이라면 저번 포스팅에서 말했던 '깨끗한' 데이터를 구하기는 어렵다는 단점이 있습니다.
네이버와 인베스팅닷컴 등에서 크롤링을 해서 가져오는 데이터라 상폐 관련 정보라던지, 수정주가 외의 정보 등은 가져올 수 없습니다. 그럼에도 굉장히 깔끔하고 편리하게 되어있어서 많은 분들이 이미 사용하고 계실거라 생각합니다.


2. 거래별 체결 데이터
거래별 체결 데이터는 상대적으로 얻기 어려운데, 물론 직접 구매할 수도 있습니다.
한국거래소와 계약이 맺어져있는 코스콤에서 제공되는 정보를 월 단위로 구독하여 받아볼 수 있습니다. 아마 개인이 이렇게 하기에는 갖춰져야할 서버의 사양이라던지, 금액적인 부분 또한 상당히 부담이 되기 때문에 실질적으로는 힘들겠죠. 가격은 제 기억으로는 월 1800만원 정도였던 것으로 기억합니다. 아무튼! 거의 모든 개인투자자분들은 증권사가 제공하는 API를 활용해서 체결데이터를 받아보고 계실 겁니다. 보통 대신증권, 이베스트, 영웅문 요 정도에서 이용하고 계실 겁니다. 제 경우에는 키움증권 API를 사용하는데, 아직 완벽히 시스템을 갖춰놓은 것은 아닌지라 열심히 보수중입니다...하하 그래도 구성만 잘 해놓으면 양질의 데이터를 구할 수 있기 때문에 보수가 끝나면 나중에 따로 포스팅해보겠습니다.  

3. 재무제표 데이터
가장 편리하게 구하는 방법은 역시 구매하는 방법이겠죠.. 이건 그리 비싸지 않아서 저도 강의를 들으면서 하게되는 프로젝트나 Replication 때에 종종 사용했습니다. FnSpace에서 구매하여 편리하게 사용할 수 있더라구요. csv나 excel로 받아볼 수도 있고, 제 경우에는 python에서종목별로 요청하여 따로 받아서 사용했습니다. 그러나 직접 구해도 깔끔하게 구할 수 있을 것 같아서 여기에 좀 더 시간을 투자해보려고 합니다.

제 계획은 대충 DART에서 제공하는 Dart openAPI 서비스를 활용할 건데, 여기서 제공하는 정보를 어떻게 잘 활용해야 하는지가 관건이라 그 부분을 다음에 이어서 포스팅해보겠습니다!

댓글 없음:

댓글 쓰기