저번 포스팅에 이어서,
DART openAPI를 활용하여 재무제표 데이터를 좀 긁어모아보려고 합니다.
Link - https://opendart.fss.or.kr/
자세한 내용은 openDART 개발가이드를 보시면 아실 수 있겠지만, 간단히 정리해보겠습니다.
openDART를 통해 접근할 수 있는 데이터는 크게 4가지로 나뉩니다.
1. 공시정보
2. 사업보고서 주요정보(증감자, 배당, 자사주, 최대주주, 임원 관련 공시)
3. 상장기업 재무정보
4. 지분공시 종합정보
로 구분되는데요, 재무제표 데이터를 얻기 위해서 활용되는 것은 3. 상장기업 재무정보입니다.
그런데, openDART 홈페이지에 들어가보면 굳이 api를 활용해서 데이터를 받지 않아도 공시정보활용마당 - 재무정보일괄다운로드 를 통해 2015~2021년도의 데이터를 받아볼 수 있습니다.
저도 처음에는 이 방법으로 직접 데이터를 받아서 사용하려고 했었는데요, 데이터를 열어서 뜯어보니 몇몇의 오류가 존재했습니다. (개인적인 의견 + 2021년 8월 4일 기준입니다)
우선, 가장 큰 문제로는 데이터가 일반적으로 인식되는 방법과는 조금 다르게 분포되어 있습니다.
사실 이는 데이터가 갖춰야 할 가장 중요한 부분에서 잘못된 것인데요, 일괄다운로드를 살펴보면 분기별로, 재무제표별로 구분이 되어있습니다. 그런데 이 분기별로 데이터를 나누는 과정에서 착오를 불러일으킬 여지가 존재합니다.
몇몇의 기업들은 통상의 분기별 보고를 하지 않고, 회계기준 분기를 다르게 잡는 기업들이 존재합니다. 예를 들면 사업보고서를 제출할 때 1월부터 12월까지 잡는게 아니라 4월부터 3월까지 잡는 등의 경우이죠. 이런 기업들의 경우에 위의 분기별 분류 항목이 잘못 기록되어 있습니다. 상장기업 종목코드를 받아볼 때 가장 먼저 등장하는 기업인 3S의 경우가 딱 이에 해당하는데요, 2015년 제출된 사업보고서를 보면 2014년 4월 ~ 2015년 3월로 잡혀있는데, openDART의 재무정보 일괄다운로드를 확인해보면 이 데이터가 2015년 4Q 데이터에 들어가 있습니다. 문의를 넣어봤는데 아직 답변이 없어서 어떻게 될지는 잘 모르겠습니다.
금감원 전자공시팀에서 답변을 해주셨습니다.
이를 잘못 해석하면 17년 3월결산의 데이터가 17년 4분기 데이터로 잡혀서 여러모로 골치아픈 상황이 발생할 수 있습니다.
물론 위를 보정하기 위해 회계기준이 다르게 잡혀있는 기업들만 따로 빼서 분기를 바꿔줘서 사용할 수는 있습니다만, 어차피 2015년 데이터까지밖에 접근할 수 없고, 또 상장폐지 기업은 제공하지 않으며, DART에서 제공되는데까지 시차가 좀 있어서 좀 더 깨끗하고 실시간에 가까운 데이터를 구하기 위해서 직접 다른 방법을 사용하여 정리해보려고 합니다.
다시 처음으로 돌아가서, 이제 api를 활용해서 데이터를 구해야 하는 상황으로 돌아왔습니다. 위의 3. 상장기업 재무정보 부분을 살펴보면 세부적으로는 다섯 가지로 나뉩니다.
(1) 단일회사 주요계정
(2) 다중회사 주요계정
(3) 재무제표 원본파일
(4) 단일회사 전체 재무제표
(5) XBRL택사노미재무제표양식
여기서 (5)는 그냥 IFRS기준 양식을 알려주는 것이므로 크게 중요하지는 않습니다. 또한, 주요계정은 재무상태표와 손익계산서의 일부분만을 제공하므로 원하는 데이터에 미치지 못합니다. (이 정도만 구할거였으면 크롤링하는게 훨씬 낫습니다.) 남은 선택지는 단일회사 전체 재무제표와 재무제표 원본파일입니다.
재무제표 원본파일(XBRL)은 예전에는 다운받아서 잘 열렸었는데 지금은 왜인지 에러가 발생하더라구요. 해결되면 이어서 시도해보겠습니다. 아마 해결되면 가장 편리하게 사용할 수 있을 것으로 기대합니다.
결국 지금 남은 선택지는 (4) 단일회사 전체 재무제표입니다.
예시로서 하나를 받아와보겠습니다.
<삼성전자의 2018년 재무제표내 데이터>
위를 받을 때에는 opendartreader라는 라이브러리를 사용하였습니다. 정말 편리하게 잘 정리해주셔서 유용합니다. 깃헙 링크 남겨놓겠습니다.
Link - https://github.com/FinanceData/OpenDartReader
정말 잘 정리되어 있는 모습입니다. 살짝의 문제점을 꼽자면 우선 재무정보 일괄다운로드와 같은 틀을 공유하는 건지 회계기준이 다르게 잡혀있는 기업의 경우 조금 착오가 생길 수 있습니다. 즉, 여기서는 1Q, 2Q 이렇게 나누지 않고 사업보고서, 반기보고서, 분기보고서 이렇게 나누고 있어 틀린 건 아니지만 가공하기가 살짝 까다롭습니다. 그래도 틀린 건 아니어서 충분히 사용할만합니다. 보다 큰 단점이라면 2015년 이후의 데이터만 제공한다는 점입니다.
2015년 이후의 데이터만 얻기 위해서라기에는 투자한 시간이 조금 아깝기 때문에 어떻게든 그 이전의 데이터까지 깔끔하게 얻어오는 방법을 찾고 싶은데요, 한편 재무제표 원본파일의 경우 아직 문제가 해결되지 않아서 확인해보지는 못했지만 보고서 번호를 기준으로 하기 때문에 2015년 이전 데이터들에도 접근할 수 있지 않을까 기대해봅니다.
2015년 이전의 데이터들에 접근할 수 있는 다른 좋은 방법을 고민해서 다음 포스팅으로 돌아오겠습니다.
댓글 없음:
댓글 쓰기