Alternative Daten in der Praxis erfassen: Wie können neuronale Netze die Nachrichtenstimmung verstehen?
Dr. Axel Groß-Klußmann aus dem Quoniam Research Forecasts-Team hat sich auf die Suche nach dem besten Ansatz zur Analyse täglicher Stimmungswerte für über 1.000 Wirtschaftsthemen gemacht. Die neuronalen Netzwerkmodelle sind wettbewerbsfähig, wenn es um die Erklärung von Aktienmarktbewegungen, Währungsänderungen, Anleiherenditen und die Vorhersage von Wirtschaftswachstum geht. Seine Arbeit wurde kürzlich in „Digital Finance“ veröffentlicht.

Axel, Du hast kürzlich deine Forschungsarbeit „Learning deep news sentiment representations for macro-finance“ in Digital Finance veröffentlicht. Was hat Dich motiviert, dieses Thema zu untersuchen?
Bei Quoniam arbeiten wir seit mehr als 10 Jahren daran, zu verstehen, ob die Stimmung, die aus unstrukturierten Nachrichtenflussdaten hervorgeht, dazu beitragen kann, zukünftige Marktbewegungen vorherzusagen. Bei der Hintergrundrecherche in diesem Bereich haben wir eine Reihe von Methoden angewandt, um schließlich den effektivsten Ansatz für die Auswahl der Nachrichtenthemen mit dem größten Einfluss auf den Markt zu finden.
Wann immer wir versucht haben, alternative Stimmungsdaten mit Finanzzeitreihen zu verknüpfen, war das größte Hindernis die Auswahl oder Gewichtung der zugrunde liegenden Geschichten oder Themen. Um Nachrichten, die zu Tausenden von Themen gesammelt wurden, mit einzelnen Finanzinstrumenten zu verknüpfen, ist eine Form der Dimensionsreduktion erforderlich. Die meisten statistischen Standardverfahren ließen jedoch zu wünschen übrig. Oft wurden zu viele Daten verworfen, während andere Ansätze zu einer Gewichtung der Themen führten, ohne den Kontext unseres Anwendungsfalls zu berücksichtigen.
Da neuronale Netze für diese Art von Aufgaben sehr gut geeignet sind, habe ich einfach eine Idee weiterverfolgt, die ich dazu hatte, wie man neuronale Netze einsetzen könnte, um das zu erreichen, was wir wollten. Dank der jüngsten Softwarefortschritte ist es sehr einfach geworden, neuronale Netze anzupassen und zu trainieren. Wir mussten also nur herausfinden, wie wir die Stärken der neuronalen Netze auf unseren Anwendungsfall im Finanzbereich übertragen konnten, und zwar mit viel weniger Datenpunkten, als normalerweise für das Training dieser Modelle verwendet werden.
Wie bist Du diese Fragen im Einzelnen angegangen?
Die zentrale Frage, die wir zu beantworten suchten, lautete: Welche Themen sind für den Markt relevant? Ich habe versucht, eine Reihe statistischer Verfahren wie die Hauptkomponentenanalyse (PCA), die partielle Methode der kleinsten Quadrate (PLS), die Ridge-Regression und die Lasso-Regression anzuwenden, um Muster in den Nachrichtendaten zu finden. Diese Methoden helfen, die Komplexität der Daten zu reduzieren oder eine Überanpassung zu vermeiden, können aber bei der Erfassung sehr komplexer oder verborgener Beziehungen an ihre Grenzen stoßen. Um mit der komplexen Natur von Nachrichtendaten umgehen zu können, benötigten wir aussagekräftigere Modelle. Deshalb haben wir uns Autoencodern zugewandt – einer Art neuronales Netzwerk, das sich durch die Aufdeckung tieferer Muster auszeichnet, indem es die Daten auf flexiblere Weise komprimiert und rekonstruiert.
Heutzutage sind verschiedene Softwarelösungen in diesem Bereich praktisch auf Knopfdruck verfügbar, so dass man ein neuronales Netz im Handumdrehen implementieren kann. Technisch gesehen habe ich PyTorch verwendet, ein beliebtes Open-Source-Paket für Deep Learning. In diesem Framework habe ich eine benutzerdefinierte Architektur für überwachte Autocoder programmiert, die sowohl Dimensionalitätsreduktion als auch überwachtes Lernen integriert. Einfach ausgedrückt, ermöglicht es diese spezielle Architektur dem Modell, kompakte Repräsentationen von Sentiment-Daten zu lernen, die durch das Monitoring bereits gut an unseren Anwendungsfall im Finanzbereich angepasst sind.
Was hast Du festgestellt?
Positiv war, dass das Training und die Codierung der neuronalen Netze viel einfacher waren als ursprünglich angenommen. Vor allem hat die Analyse den Mehrwert der individuellen Anpassung bei der Konstruktion statistischer Signale deutlich gemacht. Insbesondere die Implementierung von benutzerdefinierten Verlustfunktionen führte zu Datenrepräsentationen, die uns wesentlich besser gefielen als die der Standardansätze. Die Ergebnisse in den verschiedenen Anwendungsfällen sprachen durchweg für neuronale Netze. Interessanterweise war die Komplexität der neuronalen Netze in Bezug auf die Tiefe zweitrangig. Auch wenn es schwierig war, nach Berücksichtigung von Mehrfachselektionen usw. etwas deutlich Besseres als die Standardansätze zu erhalten, lieferten die neuronalen Netze Datenrepräsentationen, die für uns Praktiker relevanter waren.
Wie setzt Du diese Erkenntnisse bei Quoniam im Investitionsprozess um?
Während wir uns mit der Einbeziehung von aus neuronalen Netzen abgeleiteten Datendarstellungen in Anlagestrategien befassen, wird der vorgeschlagene Ansatz im Research-Prozess hilfreich sein. Ein Beispiel ist die Überprüfung von Datensätzen, die aus Text abgeleitete numerische Stimmungswerte für viele Themen enthalten. Der in dem Papier skizzierte Rahmen gibt uns einen sehr wettbewerbsfähigen Benchmark-Ansatz an die Hand, der direkt umsetzbare Signale erzeugen kann.
Darüber hinaus wenden wir diese Erkenntnisse in unserer Strategie Quoniam Global Data Sentiment an. Quoniam Global Data Sentiment ist eine liquide Long/Short-Strategie, die marktbewegende Stimmungsschwankungen identifiziert und darauf reagiert, bevor sie eingepreist werden, indem sie unstrukturierte Nachrichtenströme analysiert, um wichtige Investitionssignale zu identifizieren. Unser Prozess beginnt mit über 1 Million Geschichten, die in über 50.000 Themen unterteilt sind und täglich erfasst werden. Der Ansatz des neuronalen Netzwerks zur Dimensionsreduktion hilft uns bei der Auswahl der günstigsten der 50.000 Themen und verschafft uns einen Vorteil bei der Extraktion der besten Renditesignale. Die Strategie ist seit über drei Jahren in Kraft und hat vielversprechende Ergebnisse gezeigt.
Lernen Sie mehr zu diesem Thema im veröffentlichten Aufsatz:
Learning deep news sentiment representations for macro-finance