딥 러닝을 사용하여 S & amp; P 500 가격을 예측하는 모델을 구축 한 방법

대부분의 사람들이 투자 은행과 거래를 생각할 때, 그들은 거래와 저주를 외치며 미친 듯이 달리는 수트 앤 타이 은행 가로 가득 찬 회사를 생각합니다. 어떤 사람들은 Wolf of Wall Street에서 완전히 혼란스러운 장면을 상상합니다. 현실은 이것이 진실에서 멀어 질 수 없다는 것입니다. 헤지 펀드 Citadel Group의 평균 하루에 뉴욕 증권 거래소 자체보다 더 많은 주식을 매일 발행 함에도 불구하고 엄청나게 조용합니다! 새로운 월스트리트 거래자, 고주파 알고리즘 거래 플랫폼을 만나보세요.

알고리즘 거래 시스템 및 작동 방식

이러한 전략은 거의 모든 단일 헤지 펀드, 투자 은행 및 사모 펀드 회사에서 사용되며 투자 은행의 표준이되었습니다. 투자를 위해 기계 학습 솔루션에만 의존하는 헤지 펀드 인 Two Sigma는 500 억 달러 이상의 자산을 처리하여 세계에서 세 번째로 큰 헤지 펀드가되었습니다. 알고리즘 거래 또는 거래 결정을 자동화하기 위해 컴퓨터 화 된 시스템을 사용하는 것이 거의 30 년 동안 금융 업계에서 널리 사용되었지만 최근에는 인공 지능이라는 주요 요인이 작용했습니다.

이전에는 이러한 알고리즘 거래 플랫폼에 주식을 사고 팔 때와 투자를 할당하는 방법에 대한 특정 규칙이 있어야했습니다. 프로그래머가 필수 규칙을 생략하면 수백만 달러의 손실이 발생할 수 있습니다. 머신 러닝과 자연어 처리를 통해 이러한 모델은 더 이상 특정 규칙에 의존 할 필요가 없으며 고성능 주식의 특정 재무 지표가 갖는 경향에 따라 패턴을 형성 할 수 있습니다. 그러나 머신 러닝의 결과로 이러한 자동화 된 거래 시스템의 아키텍처가 크게 변경되었습니다.

알고리즘 거래 플랫폼의 기본 레이아웃

대부분의 알고리즘 거래 플랫폼은 주가, 재무 지표 등과 같은 과거 데이터의 재무 정보를 활용하여 사전 거래 분석을 구축합니다. 자연어 처리를 사용하여 이제 많은 플랫폼에서 Thomson Reuters, Bloomberg 등과 같은 최고 기업의 금융 시장 뉴스를 활용하여 감정 을 읽고 할당하거나 뉴스를 해독 할 수 있는지 여부를 결정합니다. 좋든 나쁘 든. 이를 사용하여 당사 플랫폼은 거래 신호 (구매 / 판매 / 보류)를 형성하고 거래소 또는 전자 통신 네트워크 (ECN)에서 거래를 실행할 수 있습니다. 이러한 플랫폼은 모든 은행과 회사에서 표준 관행이되어 거래의 70 % 이상이 컴퓨터를 통해 이루어집니다.

이 업계에서 머신 러닝의 엄청난 잠재력을 깨닫고 Google Finance API 및 Kaggle의 시계열 기록 데이터를 사용하여 S & amp; P 500의 주가를 예측하는 딥 러닝 모델을 개발하여 기술을 키우기로 결정했습니다.

자체 가격 예측 모델을 만든 방법

이 업계에서 머신 러닝의 엄청난 잠재력을 깨닫고 Google Finance API 및 Kaggle의 시계열 기록 데이터를 사용하여 S & amp; P 500의 주가를 예측하는 딥 러닝 모델을 개발하여 기술을 키우기로 결정했습니다. 회귀 모델은이 모델이 주식의 미래 가격에 대한 수치 값과 예측에 대해 얼마나 확신하는지에 대한 확률을 출력하므로이를 위해 가장 잘 작동했습니다.

네트워크 아키텍처 설계

내 모델의 아키텍처는 매우 단순하며 여러 연구 논문과 개인 프로젝트, 특히 스탠포드 전기 공학과의 일부 연구원이 작성한이 우수한 논문을 모델로합니다. 위의 이미지는 각 데이터 배치가 왼쪽에서 오른쪽으로 만 흐르는 것을 보여주는 아키텍처를 나타냅니다. 이 문서를 사용하여 모델의 예측과 실제 학습 목표 사이의 편차 측정 값을 생성하는 간단한 방법 인 평균 제곱 오차 (MSE)를 사용하기로 결정했습니다.

모델의 입력은 2 차원 행렬로 구성되고 출력은 1 차원 벡터입니다. 이러한 자리 표시자는 X 가 입력이거나 S & amp; P 500에 속한 모든 주식의 주가이고 Y 는 출력 또는 1 분 후의 S & amp; P 500 지수 값입니다.

드롭 아웃을 사용하여 오 버핏 방지 및 정확도 향상

드롭 아웃은 신경망이 과적 합 되는 것을 방지하기 위해 머신 러닝 모델에서 정규화하는 기술입니다. 과적 합은 본질적으로 모델이 학습 데이터를 잘 모델링하는 경우입니다. 테스트 및 검증 세트와 같은 새로운 데이터의 성능에 부정적인 영향을 미칠 정도로 훈련의 세부 사항과 노이즈를 학습합니다. 이는 무시되거나 “삭제”되는 임의의 뉴런을 무작위로 선택하여 작동합니다. 모델의 가중치에 대한 업데이트와 순방향 패스에 대한 무시 된 뉴런 기여는 역 전파의 뉴런에 적용되지 않습니다. 이로 인해 다른 뉴런은 누락 된 뉴런에 대한 예측을 수행하는 데 필요한 모든 표현을 “들어가서”처리해야합니다. 이로 인해 모델에서 학습되는 다중 독립적 내부 표현 이 생성되고 네트워크가 뉴런의 특정 가중치에 덜 민감 해집니다. 네트워크는 일반화 능력이 더 높아지고 과적 합 가능성이 낮아질 수 있습니다. 아래 그림과 같이 모델의 네 가지 숨겨진 레이어에 모두 통합하여 테스트 평균 제곱 오차를 낮추었습니다. 사용 된 드롭 아웃 비율은 50 % 또는 0.5였습니다. 즉, 반복 할 때마다 뉴런의 절반이 무작위로 “드롭 아웃”됩니다.

모델 훈련 방법

이 모델은 S & amp; P 500의 주가 지수 성과뿐만 아니라 500 개 주식의 분 단위 데이터로 구성된 .csv 형식으로 컴파일 된 데이터를 사용합니다. 다행히 사용 된 데이터는 이미 정리되고 준비되었습니다. , 마지막 관측치가 이월됨에 따라 테이블의 누락 된 데이터가 이전 관측치로 이어집니다. 데이터의 80 %는 학습에 사용되었으며 나머지는 모델 테스트에 사용되었습니다.

pyplot.plot (data [& # x27; SP500 & # x27;]) 을 사용하여 시계열 데이터 표시 :

데이터를 가져와 자리 표시 자, 변수, 비용 함수 및 AdamOptimizer를 정의한 후 네트워크는 미니 배치 교육 을 통해 교육되었습니다. 여기에서 데이터 세트에서 무작위 샘플을 가져 와서 네트워크에 공급합니다. 데이터 배치 Y 는 현재 배치의 대상 데이터 Y 와 비교되는 출력 레이어에 도달 할 때까지 네트워크의 숨겨진 레이어를 통과합니다. 최적화 도구와 비용 함수를 사용하여 모델은 가중치 및 편향과 같은 매개 변수를 업데이트합니다. 이는 각 데이터 배치에 대해 반복됩니다. 모든 배치에서 한 번의 전체 반복을 에포크 라고합니다.

결과

테스트 세트에 대한 모델의 성능 또는 배우지 않았지만 따로 ​​따로 설정 한 데이터 세트의 20 %입니다. 결과를 ​​시각화하기 위해 매 5 번째 배치마다 성능을 취해 교육 과정의 애니메이션으로 결합했습니다. 최종 테스트 MSE는 목표가 조정되기 때문에 0.00141에 도달하지만 절대 백분율 오류는 7.57 %로 꽤 괜찮은 결과입니다. 탈락률과 같은 것을 활용하고 모델을 중지하는 기준을 가지면 원래 테스트 결과보다 훨씬 낫지 만 모델의 성능을 최적화 할 수있는 다른 방법이 많이 있습니다. 아래 애니메이션의 결과를 살펴보면 모델이 점점 더 많은 데이터 배치를 통해 실행됨에 따라 데이터 세트의 패턴을 학습하기 시작하고 가깝게 될 때까지 주가 지수 가격을 더 정확하게 예측하는 것을 볼 수 있습니다. 타겟 데이터를 미러링합니다.

결론

알고리즘 거래 플랫폼을 사용하여 분당 수억 건의 거래가 수행됩니다. 인공 지능, 특히 기계 학습 및 자연어 처리의 추가 구현으로 주식 시장에서의 사용은 계속해서 확대 될 것입니다. 알고리즘 거래는 대부분의 기업과 거래소에서 거래자 수가 감소하는 주요 원인 중 하나이지만, 산업이 자동화로 이동함에 따라 AI 사용은 다른 것을 암시합니다. 분석가 및 투자 은행가에 대한 필요성 감소. Goldman Sachs와 같은 상위 기업의 분석가 수는 지속적으로 감소하고 있으며, 상위 헤지와 경쟁하기위한 엔지니어의 필요성은 증가했습니다. Two Sigma 및 Citadel과 같은 기금. 기계 학습은이 산업을 크게 혼란에 빠뜨릴 것입니다. 금융 산업은 그 어느 때보 다 더 많은 기술 기반 직원을 필요로 할 것입니다. 이 때문에 업계에 진입하는 사람들이 프로그래밍과 기술에 대해 잘 알고있는 것이 그 어느 때보 다 중요합니다. 그러나 우리의 미래에 투자 은행 일자리를 잃는 것에 대한 긍정적 인 점이 하나 있습니다. 투자자의 손에 더 많은 투명성과 통제권을 약속하는 핀 테크 스타트 업과 기업의 유입, 그리고 업계에 진출하고자하는 모든 투자자를위한 경쟁의 장을 마련 할 기회를 제공합니다.

핵심 요약

다음 단계

이 기사가 마음에 드 셨다면 다음 단계에 따라 향후 프로젝트 및 기사를 계속 확인하세요!

이 기사를 읽어 주셔서 감사합니다.이 기사에서 무언가를 얻고 투자 업계에서 AI의 힘에 대해 자세히 알아 보시기 바랍니다.