Sentimentanalyse und NLP im Assetmanagement

Bild: Wordcloud

Sentimentanalyse im Assetmanagement

Die Sentimentanalyse beschäftigt sich im Assetmanagement mit der Auswertung von Stimmungen der Marktteilnehmer. Sie kommt aus dem Bereich Behavioural Finance und versucht ein tiefgreifendes Verständnis über die Anlegerpsychologie zu erlangen, um Rückschlüsse auf das Verhalten der Marktteilnehmer zu ziehen. Als Sentiment kann man die Aggregation der Stimmung aller Investoren zu einem Markt, Sektor oder einem expliziten Anlagewert verstehen. Neben den klassischen Verfahren, wie der technischen oder der fundamentalen Analyse, bietet die Sentimentanalyse eine optimale Ergänzug zur Identifizierung von Renditetreibern. Die Sentimentanalyse ist im Assetmanagement ein vergleichsweise junges Forschungs- und Anwendungsfeld. Durch den enormen Aufstieg der sozialen Medien und neuer Methoden wie dem Natural Language Processing hat es in jüngster Vergangenheit jedoch enorm an Relevanz gewonnen!

Steigende Relevanz der Sentimentanalyse im Assetmanagement

Zahlreiche empirische Studien zeigen, dass die Stimmung der Investoren ein guter Indikator für kurzfristige Preisentwicklungen ist, da Emotionen einen starken Einfluss auf die menschliche Entscheidungsfindung haben. Seit den 1990er Jahren gibt es daher Marktstimmungsindikatoren, die versuchen die Stimmung der Investoren gegenüber einem gesamten Markt, wie dem S&P 500,  abzubilden. Wir möchten Ihnen in Kürze drei solcher Heuristiken vorstellen:

VIX

Der CBOE Volatility Index (VIX) misst die implizite Volatilität von Optionen auf den amerikanischen Index S&P 500. Investoren kaufen Optionen, um ihr Portfolio abzusichern. Gehen sie davon aus, dass die Volatilität im Markt steigt, bieten sie Ihre Optionen zu einem teureren Preis an und der Index steigt. Der VIX gibt daher einen guten Hinweis auf das Ausmaß der Angst im Markt. Ein hoher VIX Wert deutet auf unruhige Märkte hin. Ein niedriger VIX Wert deutet hingegen auf niedrige Kursschwankungen hin. Der VIX wird auch als Angstbarometer bezeichnet.

Put / Call Ratio

Eine ähnliche Herangehensweise bietet die Put/Call Ratio. Sie misst das Verhältnis von Verkaufsoptionen (Puts) zu den Kaufoptionen (Calls). Sind mehr Puts als Calls im Umlauf, rechnen Investoren eher mit einem Rückgang des Marktes und vice versa.

Safe Havens

Wenn Anleger ängstlich sind, schichten sie ihr Geld gerne in vermeintlich sichere Anlagequellen wie Edelmetalle, Staatsanleihen oder relativ stabile Währungen. Starke Anstiege solcher Vermögenswerte resultieren oft aus der Angst der Anleger, dass der Aktienmarkt sich nach unten bewegen könnte.

Limitationen solcher Heuristiken

Solche Heuristiken erlauben einen schnellen Überblick über die allgemeine Stimmung am Markt. Allerdings liegt auch genau hier die Krux. Wer detaillierte Informationen zu einzelnen Sektoren oder expliziten Anlagewerten erhalten möchte, muss auf komplexere Methoden zurückgreifen.

NLP im Assetmanagement

State of the Art Methoden wie Künstliche Intelligenz erlauben Schlussfolgerungen von der Stimmung der Anleger gegenüber ganzen Märkten, einzelnen Sektoren oder expliziten Anlagewerten auf deren zukünftige Preisentwicklung. Eine einfache Einführung in das Thema Künstliche Intelligenz finden Sie in unserem Blogbeitrag Künstliche Intelligenz für Einsteiger. Durch die automatisierte Auswertung von Social Media- und Forenbeiträgen, Ad-Hoc Nachrichten, Geschäftsberichten oder weiteren Text- und Sprachdaten steht uns heute eine immense Vielfalt relevanter Quellen zur Verfügung. Das macht die Sentimentanalyse zu einem immer wichtigeren Instrument im Assetmanagement! Machine Learning Modelle operieren allerdings ausschließlich auf numerischen Werten. Also müssen die Informationen zuerst in einer numerischen Form repräsentiert werden, damit sie überhaupt verarbeitet werden können. Wie das funktioniert? Hier kommt das Natural Language Processing ins Spiel. Wir stellen ihn die gängigsten Methoden vor!

Was ist NLP?

Natural Language Processing (NLP) ist ein Prozess zur maschinellen Analyse und Darstellung von Text und Sprache. Mittels NLP können unter anderem positive und negative Pole in Dokumenten identifiziert werden, um daraus Stimmungsindikatoren abzuleiten. Grundsätzlich kann man hierbei unterscheiden zwischen Methoden die lexikalische Strukturen und Methoden die semantische Merkmale untersuchen.

Lexikalische Merkmale

Bag of Words

Der simpelste NLP Ansatz ist die Bag of Words Methode. Nach einer initialen Aufbereitung des Textes wird bei diesem Ansatz die Häufigkeit jedes Wortes in einem Dokument erfasst.

n-gram

In diesem Ansatz kann nicht nur das spezifische Wort, sondern auch der Kontext in dem es steht berücksichtigt werden. So werden bei einem Bi-Gramm nicht ein Wort, sondern zwei Wörter analysiert. Das n in n-gram steht für die Anzahl der jeweiligen Wortpaare, die betrachtet werden. Wieso man hierdurch den Kontext besser verstehen kann? Betrachten wir ein einfaches Beispiel: Würde man in dem Satz “Ich gehe auf die Bank Geld einzahlen” nur das Wort “Bank” betrachten, könnte man schlecht auf die Bedeutung des Wortes schließen. Denn eine Bank kann, je nach Kontext, sowohl eine Sitzmöglichkeit als auch eine Finanzinstitution sein. Wenn man allerdings das Wort “Geld” mit einbezieht, kann man besser auf den eigentlichen Kontext schließen.

Wörterbücher

Eine weitere Möglichkeit besteht darin ein Wörterbuch mit Wörtern und deren zugrundeliegenden Assoziationen zu definieren. Hierdurch können Wörter mit positiven, neutralen oder negativen Assoziationen verknüpft werden. Für die Aufgabe kann man entweder ein eigenes Wörterbuch definieren oder auf vordefinierte, branchenspezifische Wörterbücher zurückgreifen.

Limitationen lexikalischer Merkmale

Ansätze, die auf lexikalischen Merkmalen basieren, können in bestimmten Anwendungsbereichen sehr hilfreich sein. Allerdings gehen durch die Reduzierung des Textes unweigerlich Informationen verloren. Wie im Beispiel erklärt, können gleiche Wörter unterschiedliche Bedeutungen haben. Das Wort “Bank” wird im Kontext des Finanzmarktes klar als Kreditinstitut definiert. Im Kontext der Freitzeitbeschäftigung wird das Wort „Bank“ jedoch eher als Sitzgelegenheit definiert. Um den Kontext noch besser zu verstehen, bedarf es Methoden, die semantische Merkmale erfassen.

Semantische Merkmale

Word Embedding

Gemäß der Distributionellen Hypothese in der Linguistik haben Wörter, die einen gemeinsamen Kontext haben, in der Regel auch eine ähnliche Bedeutung. So kann der Kontext von Wörtern durch semantische Ähnlichkeiten und Beziehungen zu anderen Wörtern identifiziert werden. Diese Vorgehensweise ähnelt dem Transfer Learning. Ein Modell wird auf verschiedene Textkorpora trainiert und lernt den Kontext der Wörter. Damit spezifische Kontexte definiert werden können, sind große Textkorpora aus der jeweiligen Domäne notwendig. Wird das Modell anschließend auf ein neues Textdokument angewendet, kann es den Kontext replizieren. In der Praxis wird dies über Methoden wie Word2Vec oder Global Vectors (GloVe) ermöglicht. Diese Algorithmen repräsentieren alle im Text-Korpus vorhanden Wörter als Vektoren und ordnen sie anhand ihrer Häufigkeit und der umgebenden Wörter in einem multidimensionalen Raum so an, dass Wörter die häufig in einem ähnlichen Kontext auftauchen, auch einen ähnlichen Vektor haben.

Mit den beschriebenen NLP Methoden können lexikalische und semantische Informationen in einer numerischen Repräsentation bereitgestellt werden. Machine Learning Modelle können anschließend auf diesen Daten trainiert und für ihre spezifischen Aufgabenstellungen, wie der Vorhersage der Preisbewegungen von Aktien, konzipiert werden.

Fazit

Die Sentimentanalyse beschäftigt sich im Assetmanagement mit der Auswertung der Stimmung von Investoren, um daraus Entscheidungen abzuleiten. Neben der fundamentalen oder der technischen Analyse bietet sie eine optimale Ergänzung zur Identifikation von Renditetreibern. Lange Zeit war die Sentimentanalyse geprägt von Marktindikatoren, die das Stimmungsbild von Investoren gegenüber einem gesamten Markt abbilden. Mittels KI ist es heutzutage allerdings möglich riesige Text- und Sprachdatensätze automatisiert auszuwerten und für die Vorhersage von Preisbewegungen von ganzen Märkten, einzelnen Sektoren oder expliziten Anlagewerte zu nutzen. Allerdings müssen die Informationen zuerst in eine numerische Repräsentation überführt werden, damit Machine Learning Modelle sie verarbeiten können. Hier kommt das Natural Language Processing ins Spiel. Mit den beschriebenen Methoden können z.B. tausende Textnachrichten aus Social Media- oder Forenbeiträgen, Geschäftsberichten oder weiteren Text- oder Sprachdaten automatisiert ausgelesen und genutzt werden, um Handelssignale von Aktien zu identifizieren. Durch den enormen Anstieg verfügbarer Daten (Big Data) und Rechenleistung sowie den neuen Analysemöglichkeiten mittels Natural Language Processing gewinnt die Sentimentanalyse immer mehr an Bedeutung!

Newsletter

Jetzt anmelden und Up to Date bleiben!