본문 바로가기
생활/정보

퀀트투자 무엇인가? 장단점 장점 및 단점

by 마오와 함께 2022. 7. 27.
반응형

 

투자 이미지1


퀀트 투자란

 

기관투자가들의 전유물이던 ‘퀀트 투자(계량 투자)가 개인 투자자 사이에서도 유행처럼 번지고 있다. 퀀트 투자란 오로지 ‘숫자’에만 기반해 투자 결정을 내리는 방식이다. 각종 주식 커뮤니티에선 자신이 찾은 ‘퀀트 전략(공식)’을 수익률 시뮬레이션 결과와 함께 올린 글을 심심찮게 볼 수 있다. 퀀트 투자를 도와주는 서비스에는 개인 가입자가 빠르게 늘고 있다.


퀀트 트레이딩은 수치 계산을 기반으로 트레이딩에 있어 가장 중요한 전략 수립을 바탕으로 수학·통계지식을 이용해 빅데이터를 분석하고, 시장의 흐름을 파악, 가장 적합한 투자 로직(Logic)을 찾아 모델링을 하는 단계로 이뤄진다.


이때 투자 알고리즘은 투자자 또는 기관이 어떤 성향, 가치 및 전략을 추구하느냐 에 따라 달라질 수 있다. 또한 여러가지 전략을 융합하면서 하나의 전략에서 수익률이 떨어지더라도 다른 전략들로 수익을 계속 낼 수 있기 때문에 리스크를 줄일 수 있는 방식이 바로 퀀트 방식이다. 얼마나 효율적으로 포트폴리오를 구성하는지, 실제 시장에서는 또 어떻게 달라지는지 등까지도 분석할 수 있는 것이 퀀트의 영역이 된다.


특히 퀀트 투자는 전통적인 투자 방식이 갖고 있는 문제점을 보완시킨다는 점에서 더욱 각광받고 있다.


숫자로 된 모든 것이 퀀트의 분석 대상이다. 미국 자산운용사 블랙록의 퀀트 투자 자회사인 SAE는 직장 평가 사이트인 ‘글라스도어’ 의 기업 평판 점수도 주가 전망에 활용한다. 개인이 따라 할 수 있는 가장 쉬운 퀀트 투자법은 기업의 각종 투자지표를 활용해 종목을 발굴하는 것이다.


예를 들어 저(低)주가수익비율(PER·주가/주당 순이익)과 저 주가순자산비율(PBR·주가/주당 순자산)을 동시에 만족시키는 종목에만 투자해도 시장 수익률을 거뜬히 앞선다. 인텔리퀀트에 따르면 저PER과 저PBR을 동시에 만족시키는 종목에만 지난 5년간 투자했다면 수익률이 105.6%로, 같은 기간 코스피지수 상승률 27.72%를 크게 앞선다.

 

 

 

 

이 밖에 주가매출액비율(PSR·주가/주당 매출), 주가현금흐름비율(PCR·주가/주당 영업현금흐름) 등을 조합해 투자자 자신만의 전략을 세울 수 있다.


미국의 전설적인 헤지 펀드 투자자 조엘 그린블라트가 ‘마법 공식’ 이라고 이름 붙인 전략도 있다. 영업이익(EBIT) 대비 기업가치(EV)가 낮고, 자본수익률(ROC·영업이익/투자자본)이 높은 20~30개 종목에 투자하는 방법이다. 개인 투자자들 사이에선 이렇게 각종 지표를 조합해 자신만의 ‘마법 공식’을 찾아내는 일이 한창 벌어지고 있다.

 

 



 

퀀트 투자 장점

 

1. 투자결정의 신속성

퀀트투자 방식은 즉각적이고 신속한 의사결정을 내릴 수 있습니다.

일반적인 투자방식이 여러 투자정보들을 사람이 직접 비교판단해서 투자결정을 내리는데 해 퀀트투자는 이러한 중간단계가 사라져 보다 빠른 대응이 가능합니다. 컴퓨터 프로그램밍을 통해 빠르면 하나의 데이터가 투입되는 즉시 이를 반영하여 매수나 매도에 나설 수 있습니다.


2. 넓은 분석범위

퀀트투자 방식은 보다 많은 범위의 종목들을 분석할 수 있습니다.

일반적인 투자방식이 여러 투자정보들을 사람이 직접 비교판단해서 투자결정을 내리기 때문에 시간과 인력의 제약으로 분석대상이 되는 종목들이 제한될 수 밖에 없습니다. 반면, 퀀트투자는 이러한 과정을 컴퓨터 프로그램밍으로 대신하기 때문에 제한이 없습니다.


3. 감정의 배제

퀀트투자 방식은 투자자의 공포와 탐욕으로부터 자유롭습니다.

일반적인 투자방식은 투자자의 심리상태에 크게 영향을 받아 같은 투자정보를 보더라도 각각 다르게 판단을 내릴 수 있으며 경계해야 할 공포와 탐욕으로 인해 비이성적인 투자판단을 내릴 수 있습니다. 반면, 퀀트투자는 이러한 투자판단을 미리 정의된 프로그래밍을 통해 내리기 때문에 운영자의 주관적인 감정이 개입될 여지가 최소화됩니다.


4. 투자평가의 용이함

퀀트투자 방식은 투자전략이 적절하게 실행되고 있는지를 평가하기 쉽습니다.

일반적인 투자방식은 올바르게 투자되고 있는지를 비교할 수 있는 적절한 대상이 없어서 코스피나 코스닥 등 시장의 수익률 정도만을 가지고 비교할 수 있습니다. 반면, 퀀트투자는 자체적인 시뮬레이션 수익률을 함께 비교함으로써 전략자체의 실행이 적절한지에 대해서도 비교할 수 있습니다.


5. 합리적인 리스크 관리

퀀트투자 방식은 사전에 정의된 투자원칙을 고수하여 리스크를 관리합니다.

일반적인 투자방식이 투자자 개개인의 당시 심리상태와 잘못 세워진 투자전략에 영향을 받아 계좌 전체의 수익률에 치명적인 위험이 나타날 수 있습니다. 반면, 퀀트투자는 시뮬레이션을 통해 미리 정의된 투자원칙을 고수하며 시뮬레이션상에 나타난 리스크 수준까지만 위험에 노출됩니다.

 


 

퀀트 투자 단점 (문제점)

 

 1. 데이터 Bias 문제

금융 관련 데이터는 정상적으로 들어온 데이터처럼 보여도 그 데이터에는 시뮬레이션 과정에 굉장히 해로운 Bias가 존재합니다. 

 

크게 두 가지 Bias가 문제가 됩니다.

 

첫 번째는 생존편향(Survivorship bias)입니다.

 

예를 들어 현재 코스피 전체 재무 / 가격 데이터를 크롤링해와 데이터를 정리하고 시뮬레이션을 한다고 했을 때, 처음 보면 아무 문제가 없어보이지만 여기에는 대부분 상장폐지된 종목들이 빠져있기 때문에 생존편향 문제가 발생합니다.

위 그림은 굉장히 유명한 예인데, 전투에서 생존한 전투기들 조사한 결과 피탄결과가 위와 같았습니다. 만약 위 결과를 보고 빨간 지점을 강화하는 선택을 한다면 그건 잘못된 선택입니다. 왜냐하면 생존한 전투기들은 저 지점을 맞고도 무사귀환을 한 것이고, 생존하지 못한 전투기들은 사실 엔진에 피탄되면서 생존하지 못 했기 때문입니다.


금융데이터도 동일합니다. 현재 한국 증시에 상장된 데이터를 가지고 크롤링을 해오면 지금까지 살아남은 주식들만 보게 됩니다. 결국 생존편향이 존재하게 됩니다. 이 데이터를 통해 퀀트 시뮬레이션을 하고 여기서 좋은 전략이라고 생각된 전략을 실제로 투자했을 때 예상과는 다른 결과를 가져오게 됩니다. 대표적으로 소형주와 소위말해 잡주에 투자하면 높은 수익률을 내는 것처럼 보이게 됩니다. 하지만 이건 이미 사라진 소형주 잡주를 고려하지 못 했기 때문이겠죠.


이 문제를 해결하려면 사실 크롤링보다는 상장폐지 종목까지 전체 제공하는 데이터벤더의 데이터를 이용해야합니다. 한국벤더로 데이터가이드, 퀀티와이즈가 있고, Refintiv, Factset, S&P, Bloomberg, Quandl Sharadar 등등이 있습니다


두 번째는 미래참조편향(Look-ahead bias)입니다.

 

단어만 들어도 이상한 미래참조, 이게 뭘까요? 예를 들어 내가 다운 받은 데이터에 2013–09–30 날짜에 삼성전자의 총자산이 xxx원으로 찍혀있다고 가정해봅시다. 이 데이터는 2013–09–30에 실제 확인 가능했을까요? 대체로 아닙니다. 왜냐하면 일반적으로 Fiscal Year Date 기준으로 재무 데이터가 찍히기 때문입니다. 이게 무슨 소리냐면 2013년 3분기의 마지막 날은 2013–09–30입니다. 그리고 2013년 3분기 데이터는 2013–09–30 날짜로 찍히게 됩니다.


문제는 2013년 3분기 공시 데이터는 2013–09–30이 아니라 두세달 뒤부터 확인 가능하다는 점입니다. 그런데 2013–09–30에 이용가능한 데이터라고 생각하고 시뮬레이션에 활용하면 어떻게 될까요? 해당 기업이 좋은 실적을 냈는지 나쁜 실적을 냈는지 미리 몇 달전에 안다고 착각하는 효과가 발생합니다. 거시경제지표도 마찬가지입니다. 2013년 3분기 GDP는 2013–09–30에 찍혀오지만 이 때 확인가능한 데이터가 아닙니다.


이를 해결하기 위해서는 Point-in-Time 이라는 데이터베이스 형태가 필요합니다. 쉽게 말해서 실제 그 때 확인가능했던 데이터만 찍혀있는 데이터베이스입니다. 당연히 Point-in-Time 데이터베이스는 더 비싸고 (억 소리 날 수 있습니다), 제대로 제공하는 곳도 별로 없습니다.


그리고 더 문제는 Point-in-Time은 데이터 전처리 과정이 몇 배이상 어려워집니다. DB 특성상 와이드 포맷이 아니라 롱포맷 형태로 적혀있는데, 이게 각 시점별로 effective date -> through date 사이에 어떤 값으로 존재했다가 각 row로 존재하고, 시뮬레이션에 편한 형태로 만드려면 너무 어렵습니다.

 

어찌어찌해서 여기까지 문제를 해결했다고 하더라도 문제는 여전히 해결되지 않습니다. 여기서 전부 다룰 수는 없지만 대표적으로 위 처리를 하더라도 아래 문제점들은 여전히 존재합니다.


  • 장외시장(OTC)에서 장내로 넘어온 경우의 미래참조 편향
  • 인수합병 / 분할로 인한 편향
  • 기업 / 증권 고유값 문제 (고유값 부재문제는 생존편향과도 연결)
  • 최초공시 / 수정고시로인 한 미래참조 편향
  • 등등 … 

위 문제점들을 해결하려면 또 별도의 처리가 필요합니다. 다 언급하기에는 이것도 엄청 많을 거 같습니다.


2. 데이터 길이와 경제사이클

사실 위처럼 데이터 전처리한다 하더라도 대체로 일반적으로 구할 수 있는 데이터는 고작해봤자 대략 2000년도부터일겁니다. 그 전도 구할 수는 있지만 한국의 경우 K-GAAP -> IFRS 전환 문제도 있었고, 가장 고퀄리티의 비싼 데이터베이스를 가져다가 처리하더라도 위 문제를 해결한 데이터는 1986년 정도부터 이용할 수 있습니다. 그 이전은 어쩔 수 없이 가정에 의한 데이터처리가 필요하죠. (QRAFT에서는 미국 데이터에 대해 가정에 의한 데이터처리는 1950년부터, Point-in-Time 데이터 처리는 1986년부터하고 있습니다)

 

문제는 2000년부터 이용하면 2020년까지 대충 20년 정도의 데이터만 학습에 이용할 수 있습니다. 20년도 길어보이지만 짧은 경제사이클이 대체로 5년 정도라고 보면 유의미한 유효표본 수는 훨씬 적어집니다. 


3. 시계열 데이터에 따른 시뮬레이션 오류

저희가 이용하는 데이터는 시계열 데이터이기 때문에 시간적 연속성이 존재합니다. 시간적 연속성이 존재한다는 것은 t시점에 t+1 데이터를 볼 수 없다는 것을 의미합니다.

 

따라서 시뮬레이션 과정에서 t 시점에서는 t 시점 이전의 데이터만 확인해서 모델링을 해야합니다. 만약 이걸 안 지키고 전체 시점 데이터로 시뮬레이션 과정을 거치고 이에 대한 하이퍼 파라미터 튜닝을 한다면 오버피팅 가능성이 매우 높아지게 됩니다.

 

문제는 이걸 위해 rolling 방식으로 t 시점에 t 시점 이전데이터만 보고 t+1추론 / t+1시점에 t+1시점 이전데이터만 보고 t+2 추론 이 과정을 거치다보면 굉장히 많은 시뮬레이션을 반복해야되고, 컴퓨팅 리소스는 배 이상으로 들게 됩니다.

 


반응형

loading