Cloud, Python & Co.: Next Level Research bei Quoniam

Ein effizientes Research in der Cloud aufsetzen, zehntausende Zeilen Code auf Python migrieren – und das alles weitgehend im Home Office? Unser Research Team hat es möglich gemacht. Ein Interview mit Dr. Volker Flögel, Head of Research, und Andre Fröhlich, Head of Research Technology.

Wieso krempelt ihr das Research von Quoniam um?

Dr. Volker Flögel (VF): Um für unsere Kunden einen noch höheren Mehrwert zu stiften. Schnelles, effizientes Research wirkt sich unmittelbar auf die Stärke und Vielfalt unserer Investmentstrategien aus. Damit wir auch in Zukunft riesige Datenmengen schnell verarbeiten zu können, ist eine bestimmte Infrastruktur notwendig.

Und die war nicht mehr gegeben?

Andre Fröhlich (AF): Wir kommen aus einer Welt, in der das Research direkt am Arbeitsplatzrechner durchgeführt wurde. Mit den Programmiersprachen SAS, R und T-SQL. Mit diesem Technologie-Stack haben wir seit der Gründung vor über 20 Jahren gearbeitet. Irgendwann entsteht ein Berg an Skripten und kleinen Programmen und man muss sich die Frage stellen, ob man so weitermacht oder wichtige technologische Weichenstellungen angeht. Wir haben uns für Zweiteres entschieden.

Welche Themen seid ihr konkret angegangen?

VF: Nach einer umfangreichen Analyse haben wir uns für Python entschieden – eine zukunftsfähige Programmiersprache, die nun stringent genutzt wird. Um nicht nur einheitlich, sondern auch schnell unterwegs zu sein, verlagern wir unser Research schrittweise in die Cloud. Python- und Cloud-Umstellung sind also die wichtigsten Punkte, die wir parallel angehen.

„Schnelles, effizientes Research wirkt sich unmittelbar auf die Stärke und Vielfalt unserer Investmentstrategien aus.“

Dr. Volker Flögel
Head of Research

Wie entscheidet man sich, mit welcher Programmiersprache man die nächsten Jahre arbeiten möchte? Ist das nicht sehr kompliziert?

AF: Definitiv. Wir haben ausgewertet, welche Sprachen wichtige Unternehmen im Data-Science- und Machine-Learning-Bereich anwenden, welche am stärksten gewachsen sind und am häufigsten eingesetzt werden. Dabei hat sich Python als führende Programmiersprache herauskristallisiert. Sie ist weltweit State of the Art – und deshalb stellen wir auch bei Quoniam auf sie um.

20 Jahre Coding-Arbeit auf Python umstellen – klingt nach einem Mammutprojekt.

VF: Ja! 850 SAS-Skripte, die seit 1999 entstanden sind, werden migriert. Die zehn längsten Skripte enthalten mehr als 8.000 Zeilen Code. Das lässt sich nur mit einem super Team umsetzen.

1750 

SAS-Skripte werden auf Python umgestellt

ca. 700.000 

Zeilen Code, allein die zehn längsten Skripte > 8000 Zeilen

ca. 10 TB 

Daten werden migriert

16.000

Datenbanktabellen, verteilt auf 38 Datenbanken, werden in den Data Lake migriert


Wieso geht das Research jetzt in die Cloud?

AF: Moderne Verfahren im Bereich Machine Learning und Künstliche Intelligenz sind sehr rechenaufwändig. Wenn ich ein Machine-Learning-Modell auf einem einzelnen Arbeitsplatz-PC rechne, dauert das mitunter ewig und benötigt viel Arbeitsspeicher. Ein Beispiel ist die gleichzeitige Berichtsanalyse von hunderten börsennotierten Unternehmen, bei denen durch Natural Language Processing (NLP) die unsystematischen Informationen aus den Texten in messbare Faktoren umgerechnet werden.

VF: Für so umfangreiche Jobs kann man entweder große Server kaufen und in ein eigenes Rechenzentrum stellen oder in die Cloud gehen. Eigene Server machen nur Sinn, wenn die hohe Last kontinuierlich und planbar ist, wir die Rechenleistung also permanent abrufen. Mietet man Rechenleistung in der Cloud an, ist das bedarfsgerechter. Im Research ist die Auslastung der Rechenpower sehr unterschiedlich und Ergebnisse sollten möglichst schnell vorliegen – das führt zu großen Lastspitzen. Es gibt aber auch viele Aufgaben, bei denen nur wenig Rechenleistung benötigt wird. Aus diesem Grund ist die Cloud für uns sinnvoller. Hinzu kommt, dass wir über die Cloud Zugriff auf verschiedene hilfreiche Tools und Services haben, die stetig aktualisiert werden und On-Premise nicht verfügbar wären.

„Seit Frühjahr 2021 führen wir realistische, Mehrwert stiftende Research-Projekte in der Cloud durch.“

Andre Fröhlich
Head of Research Technology

Wie ist das Projekt zur Cloud-Umstellung abgelaufen?

AF: Bevor es an die eigentliche Umstellung ging, haben wir eine detaillierte Vorstudie gemacht. Als Finanzdienstleister gibt es viele regulatorische und rechtliche Vorgaben, die wir in Verbindung mit der Cloud beachten müssen. Wir haben uns für die Microsoft Azure Cloud entschieden. Nach der Vorstudie ging die Umstellung los. Seit Beginn des zweiten Quartals 2021 führen wir realistische, Mehrwert stiftende Research-Projekte in der Cloud durch.

Wie sieht die Infrastruktur dahinter aus?

AF: Unsere neue Research-Plattform setzt auf der Open-Source-Technologie Kubernetes auf. Das ist die Basis, mit der man alle möglichen Applikationen, zum Beispiel Jupyterhub, deployen kann. Mit dem Kubernetes Cluster kann man nach Bedarf neue virtuelle Computer hochfahren, die vom System auch wieder heruntergefahren werden, wenn man sie nicht mehr benötigt. Das spart Ressourcen und ermöglicht u. a. verteiltes Rechnen auf hunderten virtuellen Computern, bei dem anschließend die Ergebnisse wieder aggregiert werden. Außerdem haben wir mehrere neue Python Libraries entwickelt, die den Researchern deutlich mehr Flexibilität bieten als die alten SAS-Skripte.

„Unsere neue Python Library für die Berechnung heuristischer Backtests erleichtert mir das Testen neuer Investmentstrategien deutlich. Ein positiver Aspekt ist die hohe Geschwindigkeit, mit der die Backtests berechnet werden. Der Hauptvorteil liegt aber in der Flexibilität der Library. Auch komplexe Strategien können wir damit effizient analysieren, zum Beispiel Strategien, in denen Aktien nur bei bestimmten Events, etwa bei positiven Gewinnmitteilungen, gekauft werden.”

Bernhard Lohner
Associate Director, Research Forecasts

Und wie geht es jetzt weiter?

VF: Seit Anfang 2021 setzen wir die ersten beiden Prognosemodelle in Python um. Die Migration von weiteren Modellen erfolgt in der zweiten Jahreshälfte. Diese Modelle anschließend in die Cloud zu migrieren, ist ein weiteres großes Thema. Was die Cloud betrifft, fokussieren wir uns zunächst auf den rechen- und speicherintensiven Research-Prozess, bevor wir sukzessive die gesamte Research-Plattform in die Cloud migrieren. Parallel dazu liegt ein Schwerpunkt auf der Weiterentwicklung unserer bestehenden Analysefähigkeiten in der Cloud.

Was war das Besondere an dem Projekt?

AF: Die tolle teamübergreifende Zusammenarbeit, obwohl wir seit März 2020 weitgehend im Home Office waren. Am Projekt haben nicht nur Researcher, sondern auch Vertreter aus Governance, IT, Application Development, Portfolio Management und Implementation mitgewirkt. Zudem haben uns verschiedene externe Dienstleister unterstützt. Nur durch das Engagement jedes Einzelnen sind wir so gut vorangekommen!

DAS KÖNNTE SIE AUCH INTERESSIEREN