Geldpolitische Kommunikation aus Sicht von künstlicher Intelligenz Monatsbericht – März 2025

Zentralbanken kommunizieren durch Pressekonferenzen und andere öffentliche Äußerungen über ihre Geldpolitik und ihre Einschätzungen zur wirtschaftlichen Entwicklung. Dies beeinflusst die Erwartungen der Marktakteure über die zukünftige geldpolitische Ausrichtung. Kommunikation kann damit ähnlich zu traditionellen geldpolitischen Instrumenten auf die gesamtwirtschaftliche Nachfrage und die Inflationsdynamik wirken. Für die Signalwirkung der Kommunikation ist besonders wichtig, ob die Aussagen auf restriktive oder expansive Geldpolitik hinweisen, in populärer Terminologie also falkenhaft oder taubenhaft sind. Auch ein optimistischer oder pessimistischer Tonfall kann den Effekt beeinflussen. 

Aktuell werden zunehmend modernste Technologien wie künstliche Intelligenz (KI) eingesetzt, um geldpolitische Kommunikation effizient zu analysieren. In der Bundesbank wurde ein neuartiges KI-Modell namens MILA (Monetary-Intelligent Language Agent) entwickelt, das geldpolitische Texte detailliert, konsistent und transparent auswertet. MILA klassifiziert individuelle Sätze, berücksichtigt dabei den gesamtwirtschaftlichen Kontext und begründet die eigene Einschätzung. Auf Basis der satzweisen Einordnung berechnet das Modell eine nachvollziehbare Bewertung für den Gesamttext.  

Laut MILA entwickelte sich die Kommunikation des EZB-Rats von 2011 bis 2024 weitgehend im Einklang mit dem makroökonomischen Umfeld im Euroraum. Die geldpolitische Kommunikation war überwiegend taubenhaft, besonders zum Höhepunkt der Corona-Pandemie 2020. Im Jahr 2021 wurde das Inflationsnarrativ des EZB-Rats zunehmend balancierter, die Leitzinskommunikation blieb aber zunächst taubenhaft. Für die geldpolitische Straffungsphase zwischen 2022 und 2023 verzeichnet MILA eine deutliche Wende hin zu falkenhaften Pressekonferenzen und Reden. 2024 wurde die Kommunikation wieder balancierter.  

Die Analyse durch KI ersetzt menschliche Expertise nicht, verbessert aber das Verständnis über die geldpolitische Kommunikation und deren Wirkung. Die zunehmende Verbreitung von KI-Analysen könnte allerdings auch die Anreize für die unterschiedlichen Marktakteure reduzieren, sich eigene Informationen zu beschaffen und zu bewerten. Dies könnte mit einer geringeren Meinungsvielfalt einhergehen und die Kommunikation für Zentralbanken herausfordernder machen. Eine kritische Auseinandersetzung mit KI-gestützter Textanalyse und den damit verbundenen Risiken bleibt essenziell. 

1 Die Rolle von Kommunikation für die Geldpolitik

In den letzten Jahrzehnten nahm die Kommunikation durch Zentralbanken eine zunehmend wichtige Rolle in der Geldpolitik ein. Sie ist mittlerweile ein zentraler Bestandteil des etablierten Instrumentariums, mit dem Zentralbanken den geldpolitischen Kurs (synonym: geldpolitische Ausrichtung, siehe Exkurs zur Messung des geldpolitischen Kurses) steuern. Einige Ökonominnen und Ökonomen vertreten gar die Auffassung, dass Kommunikation das wichtigste geldpolitische Instrument sei. 1  Geldpolitische Kommunikation durch Pressekonferenzen, Reden und andere öffentliche Äußerungen vermittelt Botschaften über geldpolitische Entscheidungen und die wirtschaftliche Lage. 2 Diese Botschaften beeinflussen wiederum die Erwartungen von Marktakteuren und damit die Marktzinsen, welche für die Finanzierungsbedingungen und die geldpolitische Transmission von entscheidender Bedeutung sind. Damit ergänzt und unterstützt die Kommunikation die unmittelbare Wirkung von Leitzinsänderungen oder Anleihekaufprogrammen über weitere Signaleffekte.

Geldpolitische Kommunikation sendet direkte und indirekte Signale über die geldpolitische Ausrichtung, insbesondere den künftigen Verlauf der Leitzinsen. Direkte Informationen sind Aussagen der Zentralbank über geldpolitische Instrumente, hauptsächlich Erklärungen ihrer aktuellen Entscheidungen und Signale über die zukünftige Entwicklung der Leitzinsen. 3 Indirekte Informationen vermittelt die Notenbank über das wirtschaftliche Narrativ, welches insbesondere ihre Bewertung der aktuellen und zukünftigen Entwicklung von Inflation und der Realwirtschaft umfasst.

Direkte und indirekte Informationen können falken- oder taubenhaft sein, also auf steigende/hohe Leitzinsen oder fallende/niedrige Leitzinsen hinweisen. Falkenhaft (englisch: „hawkish“) beschreibt eine Position, die auf eine restriktive Geldpolitik abzielt, um Preisstabilität zu gewährleisten. Eine solche Kommunikation betont die Notwendigkeit, die Leitzinsen anzuheben oder weiter hoch zu halten, um zu hohe Inflationsraten zu bekämpfen. Im Gegensatz dazu steht eine taubenhafte (englisch: „dovish“) Haltung, welche eine expansive Geldpolitik befürwortet. In taubenhaften Aussagen wird dafür plädiert, die Leitzinsen niedrig zu halten oder zu senken, um die gesamtwirtschaftliche Nachfrage zu stimulieren und auf diese Weise zu niedrige Inflationsraten zu erhöhen. Wenn die Kommunikation aus Sicht der Marktteilnehmer unerwartet falken- oder taubenhaft ist, werden sie ihre Erwartungen über die zukünftige geldpolitische Ausrichtung anpassen. Eine überraschende Kommunikation kann so Wachstum sowie Inflation beeinflussen. 4

Darüber hinaus spielt für die geldpolitische Signalwirkung auch eine Rolle, ob die Kommunikation ein positives oder negatives Sentiment aufweist. Positive Äußerungen der Zentralbank über die wirtschaftliche Lage oder die Inflationsdynamik können den Optimismus an Märkten und in der Öffentlichkeit stärken. 5 Im Unterschied dazu können negative Aussagen – zum Beispiel über unerwünschte wirtschaftliche Entwicklungen, Unsicherheiten oder Risiken – zu Pessimismus führen. 6 Daher prägt auch die Stimmung des wirtschaftlichen Narrativs die Erwartungen von Marktteilnehmern über zukünftige geldpolitische Maßnahmen und die wirtschaftliche Entwicklung. 7 Dies kann ebenfalls tatsächliche Konsum- und Investitionsentscheidungen beeinflussen. Das Sentiment hängt dabei wesentlich vom Inflationskontext ab: Die hypothetische Aussage "der Preisdruck steigt" wäre bei Inflationsraten unter dem Zielwert positiv, aber negativ, wenn sich die Inflation über dem Zielwert befände. In beiden Fällen wäre sie aber falkenhaft. Die Dimensionen positiv-negativ und falken-/taubenhaft sind daher nicht äquivalent. Darüber hinaus sollten normative Aussagen aus den beiden Skalen nur im gesamtwirtschaftlichen Kontext abgeleitet werden. Ob eine bestimmte Kommunikation aus Sicht der geldpolitischen Entscheidungsträger die Zielerreichung unterstützt, muss stets mit Blick auf die aktuelle wirtschaftliche Lage und die dafür angemessene geldpolitische Ausrichtung abgeschätzt werden. 8

Im Eurosystem spielen Pressekonferenzen im Anschluss an Sitzungen des EZB-Rats eine zentrale Rolle für die Kommunikation mit der Öffentlichkeit. Nach geldpolitischen Sitzungen des EZB-Rats werden die getroffenen geldpolitischen Entscheidungen in einer Pressemitteilung (Geldpolitische Beschlüsse – Monetary Policy Decisions) veröffentlicht. Im Anschluss folgt eine Pressekonferenz, welche mit einem Vortrag (bis Juni 2021: Einleitende Bemerkungen – Introductory Statement; ab Juli 2021 mit der neuen geldpolitischen Strategie: Erklärung zur Geldpolitik – Monetary Policy Statement, MPS) der EZB-Präsidentin beziehungsweise des EZB-Präsidenten beginnt. 9 Neben einer Erläuterung der geldpolitischen Entscheidungen beinhaltet dies auch die Einschätzung des EZB-Rats zur aktuellen wirtschaftlichen Entwicklung. Die nachfolgend in diesem Aufsatz vorgestellte Analyse fokussiert sich auf den Text dieses ersten Teils der Pressekonferenz im Zeitraum von November 2011 (Beginn der Amtszeit von Mario Draghi als EZB-Präsident) bis Dezember 2024. Abstrahiert wird dabei vom zweiten Teil der Pressekonferenz, in dem Fragen der Presse durch die EZB-Präsidentin beziehungsweise den EZB-Präsidenten beantwortet werden. 10 Darüber hinaus werden geldpolitische Reden des EZB-Direktoriums von November 2011 bis August 2024 betrachtet. Öffentliche Äußerungen durch Zentralbankvertreter können vergangene Entscheidungen erklären oder individuelle Sichtweisen auf die wirtschaftliche Entwicklung darlegen. Damit senden Reden relevante geldpolitische Signale zwischen den offiziellen Sitzungen des EZB-Rats. Insgesamt umfasst die Analyse 119 MPS und 377 Reden. 11

Exkurs

Zur Messung des geldpolitischen Kurses

Die Ausrichtung der Geldpolitik ist aufgrund der Nutzung mehrerer geldpolitischer Instrumente multidimensional. Die verschiedenen geldpolitischen Instrumente wirken unterschiedlich stark auf die Laufzeitsegmente der Zinsstrukturkurve, Vermögenspreise und Wechselkurse. 1 Während die Höhe der Leitzinsen vor allem für sehr kurzfristige Marktzinsen entscheidend ist, spielt die Kommunikation eine wesentliche Rolle für mittelfristige Marktzinsen. Anleiheankäufe durch Notenbanken beeinflussen insbesondere längerfristige Laufzeiten. Dies ist von Bedeutung, da für die geldpolitische Transmission, das heißt die Wirkung der Geldpolitik auf Konsum- und Investitionsentscheidungen von privaten Haushalten und Unternehmen, die gesamte Zinsstrukturkurve entscheidend ist. 2 Zudem beeinflusst die Geldpolitik über ihren Instrumenteneinsatz die Risikoprämien in den unterschiedlichen Finanzmarktsegmenten, allen voran über einen variierenden Risikoappetit der Anleger. 3 Es kann daher unvollständig sein, den geldpolitischen Kurs ausschließlich auf Basis der Höhe der Leitzinsen zu bewerten. So lag beispielsweise der EZB-Leitzins sowohl im März 2024 als auch im August 2007 bei 4 %, der zehnjährige OIS-Zinssatz aber bei 2,5 % beziehungsweise 4,6 %. Gemessen am Niveau dieses Langfristzinses war der geldpolitische Kurs daher im März 2024 möglicherweise weniger restriktiv ausgerichtet als im August 2007. 

Eine umfassende Messgröße für den geldpolitischen Kurs ist die von der Bundesbank genutzte Proxy Monetary Policy Rate (PMPR), welche Informationen aus der risikofreien Zinsstrukturkurve und risikobehafteten Vermögenspreisen bündelt. Der Indikator basiert auf 11 Finanzmarktvariablen: risikofreie Zinssätze verschiedener Laufzeiten, Renditen von Staats- und Unternehmensanleihen, Spreads und effektiver Euro-Wechselkurs. Diese Finanzmarktpreise sind täglich verfügbar, sodass der Indikator für den geldpolitischen Kurs ebenfalls für diese Frequenz berechnet werden kann. Dafür wird ein statistischer Ansatz in Form einer Hauptkomponentenanalyse genutzt, um die gemeinsame Bewegung unter den finanziellen Variablen zu identifizieren. Zunächst werden zwei gemeinsame Faktoren extrahiert. 4 Diese werden dann in einer Regression als erklärende Variablen für den kurzfristigen Zinssatz (der OIS-Zinssatz mit einer Laufzeit von sieben Tagen) im Zeitraum 2005 bis 2012 (bevor der Leitzins die effektive Zinsuntergrenze erreichte) verwendet. Die geschätzten Werte aus dieser Regression über den gesamten Beobachtungszeitraum ergeben die PMPR.  

Die PMPR deutet darauf hin, dass der geldpolitische Kurs von 2012 bis 2021 erheblich expansiver war, als es der Leitzinssatz in isolierter Betrachtung signalisierte (Abbildung 4.1). Vor 2012 ist die Dynamik von PMPR und des Kurzfristzinses per Konstruktion weitgehend ähnlich – die Regression dient dazu, dass der Indikator in dieser Zeit weitgehend dem kurzfristigen Zinssatz entspricht, da der geldpolitische Kurs damals nahezu ausschließlich über den Leitzins gesteuert wurde. Nach 2012 reflektiert der Indikator aber die Auswirkungen weiterer geldpolitischer Instrumente, die nach Erreichen der effektiven Zinsuntergrenze eingeführt wurden. Die PMPR deutet darauf hin, dass Forward Guidance und geldpolitische Anleihekaufprogramme den geldpolitischen Kurs an der Zinsuntergrenze erheblich weiter lockerten. 5 Laut Indikator war der Effekt äquivalent zu einer weiteren Senkung der Leitzinsen um etwa 150 Basispunkte. 

Das Ausmaß der geldpolitischen Straffung war zwischen 2022 und 2023 laut PMPR mit dem tatsächlichen Anstieg der Leitzinsen vergleichbar. Gemäß PMPR begann die geldpolitische Straffung aber bereits Anfang 2022, ein halbes Jahr vor der ersten Zinserhöhung. Dies spiegelt wider, dass der PMPR frühzeitig die Antizipationseffekte zukünftiger Leitzinsänderungen über deren Einfluss auf die mittel- und langfristigen Zinssätze erfasst. 6 Den maximalen Straffungsimpuls zeigt der Indikator für September 2023 an, als die Leitzinssätze zuletzt erhöht wurden. In jüngster Zeit ist die Ausrichtung teils erheblich lockerer, als es die kurzfristigen Zinssätze vermuten lassen. Dies spiegelt im historischen Vergleich niedrigere mittel- und langfristige Zinssätze sowie eingeengte Renditeaufschläge von Staats- und Unternehmensanleihen wider. 7

Geldpolitischer Kurs im Euroraum
Geldpolitischer Kurs im Euroraum

 

2 Historie der Analyse geldpolitischer Kommunikation

Angesichts einer zunehmend transparenten Kommunikationsstrategie von Zentralbanken seit den 1990er Jahren rückte die Analyse von geldpolitischen Äußerungen verstärkt in den Fokus der Marktteilnehmer. Traditionell herrschte in Zentralbankkreisen die Überzeugung vor, dass geldpolitische Entscheidungsträger möglichst wenig und nur kryptisch mit der Öffentlichkeit kommunizieren sollten. In den letzten drei Jahrzehnten setzte sich aber die Auffassung durch, dass eine transparente Kommunikation die Erwartungen der Marktteilnehmer direkt beeinflussen und so die Effizienz der Geldpolitik steigern kann. 12 Mit diesem Paradigmenwechsel in der Art der Zentralbankkommunikation begannen Marktakteure auf Basis ihrer menschlichen Expertise, geldpolitische Äußerungen intensiv zu untersuchen. Insbesondere die Fähigkeit, Nuancen in der Kommunikation korrekt zu interpretieren und zu erkennen, wurde zu einem hohen Wert. Denn schon geringfügige Signale von Zentralbankvertretern können aus der Perspektive von Finanzmärkten bedeutende Information enthalten und damit zu starken Marktreaktionen führen. 13 So wertete der Euro im Oktober 2000 deutlich ab, als EZB-Präsident Wim Duisenberg andeutete, dass die EZB die Währung nicht weiter stützen würde. Auch die Äußerung von EZB-Präsident Mario Draghi im Juli 2012, dass "die EZB bereit [ist], alles Notwendige zu tun, um den Euro zu erhalten", hatte tiefgreifende Auswirkungen auf die Märkte. 

In der ökonomischen Forschung wurde traditionell auf menschliche Expertise zurückgegriffen, um die Merkmale von Zentralbankkommunikation zu bewerten und zu quantifizieren. Ökonominnen und Ökonomen bewerteten geldpolitische Texte manuell, wobei sie insbesondere die geldpolitische Ausrichtung und das Sentiment analysierten. Abhängig von der menschlichen Einschätzung werden dabei den Texten oder einzelnen Textabschnitten numerische Werte zugeordnet: - 1 für taubenhafte, 0 für neutrale und + 1 für falkenhafte Aussagen beziehungsweise - 1 für negatives, 0 für neutrales und + 1 für positives Sentiment. 14 Diese menschliche Klassifikation bietet zahlreiche Vorteile. Dank der vorhandenen Fachexpertise können kontextuelle Faktoren, die für die Interpretation der geldpolitischen Kommunikation entscheidend sind, umfassend berücksichtigt und quantitativ verdichtet werden. Zudem ermöglicht sie eine flexible Reaktion auf unterschiedliche oder nuancierte Formulierungen sowie eine sehr detaillierte Bewertung der Texte. Allerdings stehen diesen Vorteilen von menschlichen Klassifikationen bedeutsame Nachteile gegenüber. Die Einschätzungen sind naturgemäß subjektiv und können im Zeitablauf inkonsistent sein, was zu Fehlklassifikationen führen kann. Darüber hinaus ist diese Art der Analyse mit einem erheblichen Zeitaufwand verbunden.

Um den Einschränkungen menschlicher Klassifikationen zu begegnen, wurden computergestützte Algorithmen entwickelt, die auf Wortfrequenzen basieren. Bei dieser Methodik wird ein Lexikon von Begriffen oder Wortkombinationen erstellt, die typischerweise in geldpolitischen Texten auftreten. 15 Jeder Eintrag dieses Lexikons wird einer spezifischen Klassifikation zugeordnet – beispielsweise wird die Kombination von „Inflation“ und „steigt“ als falkenhaft eingestuft, während „Wachstum“ in Verbindung mit „sinkt“ als taubenhaft gilt. Anhand dieser Kategorisierungen ist es möglich, die Häufigkeit von taubenhaften oder falkenhaften (oder alternativ negativen und positiven) Wortkombinationen in einem Text zu ermitteln. Darauf basierend lässt sich eine Punktzahl auf einer Skala von - 1 bis + 1 für den gesamten Text berechnen. Für das Sentiment wird üblicherweise die Anzahl positiver und negativer Sätzen saldiert und durch die Gesamtzahl der nicht-neutralen Sätze geteilt: 

$$ Sentiment = \frac{\#positiv- \#negativ}{\#positiv + \#negativ} \tag{$1$} $$

Ein Gesamtwert für die geldpolitische Ausrichtung lässt sich auf ähnliche Art berechnen, wobei hierbei die Anzahl der falkenhaften beziehungsweise taubenhaften Sätze verwendet wird. Die Wortfrequenz-Methodologie bietet den wesentlichen Vorteil formeller Transparenz und ermöglicht eine konsistente, detaillierte sowie vergleichsweise schnelle Auswertung. Allerdings ist sie in ihrer Anwendung recht mechanisch und kann den Textkontext nicht berücksichtigen. Dieses Verfahren reagiert daher sensitiv auf sprachliche Nuancen oder geringfügige Variationen in der Terminologie und ist damit anfällig für Fehlklassifikationen.

In jüngster Zeit hat sich die Analyse durch künstliche Intelligenz – speziell durch große Sprachmodelle – als vielversprechender Ansatz etabliert. Sogenannte Large Language Models (LLMs) sind auf umfangreichen Textdaten trainiert. Dadurch sind sie in der Lage, natürliche Sprache zu verarbeiten und zu interpretieren (Natural Language Processing, NLP). Dies umfasst die computergestützte Aufbereitung des Textes (text mining) sowie die Identifikation und Auswertung statistischer Sprachmuster (machine learning). Zunächst wurden in der ökonomischen Forschung spezialisierte Sprachmodelle verwendet, um geldpolitische Kommunikation auszuwerten. 16 Diese Modelle wurden mithilfe großer Textdatenmengen trainiert und durch manuell klassifizierte Sätze aus dem Finanzmarkt- oder Zentralbankkontext optimiert. Im Unterschied zum Wortfrequenz-Ansatz kann diese erste Generation von Sprachmodellen den unmittelbaren Textkontext eingeschränkt berücksichtigen. Ihre Analyse ist allerdings weniger transparent und vernachlässigt weiterhin Informationen, die über den unmittelbaren Textabschnitt hinausgehen. Neueste LLMs (wie GPT, Llama oder Gemini) sind dagegen in der Lage, zusätzliche durch den Benutzer bereitgestellte Informationen zu berücksichtigen und ihre Einschätzungen zu begründen (siehe den Exkurs zur Funktionsweise von großen Sprachmodellen). Damit bieten sie das Potenzial, bei der Analyse von Zentralbankkommunikation die Vorteile der vorherigen Ansätze zu kombinieren, insbesondere die Flexibilität der menschlichen Analyse mit der Automatisierung der Wortfrequenz-Methodologie. 17 Eine wesentliche Herausforderung bei der Textanalyse mit LLMs ist es allerdings, eine granulare und transparente Einschätzung zu erhalten. Im nächsten Abschnitt wird ein neuartiges KI-Modell vorgestellt, das eine solche Analyse durchführen kann.

Exkurs

Zur Funktionsweise von großen Sprachmodellen

Große Sprachmodelle (Large Language Models, LLMs) sind eine Form der künstlichen Intelligenz (KI), die speziell darauf ausgelegt ist, natürliche Sprache zu verstehen und zu generieren. Diese Modelle basieren auf neuronalen Netzwerkmodellen, die aus mehreren miteinander verbundenen Schichten von Neuronen bestehen und komplexe Muster in Daten erkennen können. Jede Schicht verarbeitet die Eingabedaten und leitet die Ergebnisse an die nächste Schicht weiter, wodurch das Modell zunehmend abstrakte Merkmale der Daten erlernt. Die Verwendung von Aktivierungsfunktionen zwischen den Schichten ermöglicht die Modellierung von Nichtlinearitäten. 

Ein innovativer Typ dieser neuronalen Netze ist die Transformator-Architektur. Diese wurden durch Modelle wie BERT (Bidirectional Encoder Representations from Transformers) von Google AI und die GPT-Modelle (Generative Pre-trained Transformer) von OpenAI populär und basieren auf dem Aufmerksamkeitsmechanismus. Transformatoren können Wörter innerhalb eines Textabschnitts und unabhängig von ihrer Position durch selektives Gewichten erfassen, um den Kontext zu verstehen. Dadurch können sie die Beziehungen zwischen weit auseinanderliegenden Wörtern erkennen, was für die Verarbeitung natürlicher Sprache entscheidend ist. Dies stellt einen signifikanten Vorteil im Vergleich zu den Modellen der vorherigen Generation dar, die speziell für die Verarbeitung von sequenziellen Daten entwickelt wurden (rekurrente neuronale Netze, RNN). 

LLMs werden mit enormen Mengen an Textdaten aus verschiedensten Quellen wie Büchern, Artikeln und Webseiten trainiert und durch umfangreiche Evaluationsmaßnahmen in ihrer Antwortgenauigkeit optimiert. Durch das Training auf diesen umfangreichen Datensätzen erkennt das Modell komplexe Muster und semantische Zusammenhänge in der Sprache, was ihm erlaubt, kontextbezogene und oft kaum von menschlichen Texten zu unterscheidende Inhalte zu erstellen. Dabei nutzen LLMs Techniken wie selbstüberwachtes Lernen, bei dem der nächste Token (Wort oder Zeichen) basierend auf dem Kontext der vorherigen Tokens vorhergesagt wird. Dies führt zu einem tiefen Verständnis für Syntax, Grammatik und stilistische Nuancen, wodurch LLMs in vielfältigen Anwendungen eingesetzt werden können. Zusätzlich wird die Leistung der Modelle durch Reinforcement Learning from Human Feedback (RLHF) evaluiert und verbessert. Bei diesem Ansatz geben Menschen Feedback zu den generierten Texten, das dann verwendet wird, um das Modell weiter zu optimieren und seine Fähigkeit zur Erstellung qualitativ hochwertiger und relevanter Inhalte zu erhöhen.

Obwohl LLMs häufig als KI bezeichnet werden, besitzen sie kein echtes Bewusstsein oder Intelligenz. Sie generieren Antworten basierend auf den in den Trainingsdaten erlernten statistischen Mustern und können daher gelegentlich Fehler oder ungenaue Antworten (Halluzinationen) produzieren. Dennoch stellen die Entwicklung und der Einsatz von LLMs einen bedeutenden technologischen Fortschritt dar, der das Potenzial hat, viele Aspekte unseres täglichen Lebens zu transformieren und zu verbessern.

3 Monetary-Intelligent Language Agent (MILA)

Zur Analyse von Zentralbankkommunikation wurde in der Bundesbank ein neues Modell namens MILA  entwickelt. 18  MILA ist ein KI-Modell, das geldpolitische Texte automatisiert und regelgeleitet auswertet. Das Modell verfolgt einen granularen, transparenten und konsistenten Ansatz: Es bewertet individuelle Sätze unter Berücksichtigung von Kontextinformationen, begründet die Klassifikation und gibt eine Einschätzung für den Gesamttext unter Verwendung mathematischer Formeln ab. Die Zerlegung in einzelne Sätze erhöht die Transparenz der Analyse, da diese Texteinheit für Menschen verständlich und individuell bewertbar ist. So kann die menschliche Einschätzung eines Satzes direkt mit der Klassifikation und der dazugehörigen Begründung durch die KI verglichen und auf Plausibilität überprüft werden. Die Ergebnisse sind damit für Menschen nachvollziehbar.

MILA beruht auf modernsten Sprachmodellen, mehrstufigen Instruktionen und manuellen Beispielantworten. Als zentrales Element wird Llama 3.1 70B verwendet, ein sehr leistungsfähiges Sprachmodell. 19 Die Methodologie zur Analyse von Zentralbankkommunikation basiert auf etablierten Konzepten aus der Interaktion mit auf künstlicher Intelligenz basierenden Sprachmodellen (prompt engineering). Dabei wird dem Sprachmodell die Rolle einer Zentralbank-Ökonomin mit einer Spezialisierung auf die Analyse von Geldpolitik zugewiesen (role-based prompting). Für die Untersuchung eines geldpolitischen Textes erhält das Modell eine mehrstufige Anleitung (prompt chaining). 20 Neben der konkreten Aufgabe beinhaltet jeder Arbeitsschritt manuelle Textbeispiele samt aus Expertensicht richtiger Auswertung (few-shot prompting). 21 Durch die Beispiele wird auch spezifiziert, dass eine kurze Begründung vor der eigentlichen Klassifikation erfolgen soll, um das Risiko von Fehleinschätzungen durch das Sprachmodell zu reduzieren. 22 Nachfolgend wird die Vorgehensweise von MILA bei der Analyse von EZB-Pressekonferenzen beschrieben (siehe Abbildung 4.2). 23

Vorgehensweise von MILA bei EZB-Pressekonferenzen
Vorgehensweise von MILA bei EZB-Pressekonferenzen

In einem ersten Schritt leitet MILA aus EZB-Pressekonferenzen den Inflationskontext ab, der als Hintergrundinformation für die eigentliche Klassifikation dient. Informationen über die aktuelle Inflationsdynamik sind für die Einschätzung von vielen geldpolitischen Aussagen essenziell. So lässt sich beispielsweise die hypothetische Äußerung „Die Inflationsrate stieg im letzten Monat.“ nur dann eindeutig als positiv oder negativ einordnen, wenn die derzeitige Höhe der Inflation bekannt ist. 24 Liegt die Inflation über dem Zielwert von 2 %, wäre die Aussage als negativ zu bewerten, im umgekehrten Fall wäre sie positiv. Für viele andere Aussagen sind darüber hinaus die mittelfristigen Inflationserwartungen relevant, da der EZB-Rat eine mittelfristige Inflationsrate von 2 % anstrebt. MILA extrahiert den Inflationskontext aus denjenigen MPS, bei denen neue makroökonomische Projektionen von Fachleuten der EZB beziehungsweise des Eurosystems vorliegen (März, Juni, September, Dezember). 25  

Im Anschluss analysiert MILA die Kommunikation in EZB-Pressekonferenzen über geldpolitische Instrumente und bewertet, ob diese eher falkenhaft oder taubenhaft ist. Geldpolitische Entscheidungen des EZB-Rats werden üblicherweise im ersten Absatz des MPS aufgeführt, zusammen mit Begründungen und Erläuterungen zur beabsichtigten zukünftigen Ausrichtung. MILA analysiert diesen Textabschnitt entlang von vier Dimensionen: Leitzinsveränderung, Zinsausblick, Inflationsbild und Sprachton. Mithilfe eines vorgegebenen Punktesystems wird aus der Bewertung dieser Dimensionen ein „Zins-Hawk-O-Meter“ gebildet. 26 Dieser Indikator reflektiert, wie falkenhaft oder taubenhaft die direkte geldpolitische Kommunikation aus Sicht der digitalen Ökonomin ist. Die Skala reicht dabei von - 1 (taubenhaft) bis + 1 (falkenhaft definiert). 

In einem dritten Schritt untersucht MILA durch Klassifikation individueller Sätze aus der Pressekonferenz, wie falkenhaft oder taubenhaft das wirtschaftliche Narrativ ist. Das wirtschaftliche Narrativ wird in EZB-Pressekonferenzen nach den Ausführungen zu den geldpolitischen Entscheidungen detailliert ausgeführt. 27 Dies umfasst die Einschätzung des EZB-Rats der realwirtschaftlichen Entwicklung, der Inflationsdynamik und der finanziellen und monetären Bedingungen. Bei der Klassifikation wird jeder einzelne Satz einer der folgenden fünf Kategorien zugeordnet: Taubenhaft, moderat taubenhaft, neutral, moderat falkenhaft oder falkenhaft (siehe Klassifikationsbeispiele im Exkurs Beispiele für Klassifikationen von MILA). Bei der Bewertung berücksichtigt MILA das für das entsprechende Datum abgeleitete Inflationsbild aus Schritt 1, die geldpolitischen Entscheidungen, sowie vorangehende Sätze als zusätzlichen Kontext. Aus der Klassifikation auf Satzebene wird außerhalb des LLMs ein „Hawk-O-Meter“ für das gesamte wirtschaftliche Narrativ im entsprechenden Text mithilfe der folgenden Formel berechnet 28 :

$$ Hawk-O-Meter = \frac{\#falkenhaft + 0.5 * (\#moderat falkenhaft – \# moderat taubenhaft) – \#taubenhaft}{\#falkenhaft + \#moderat falkenhaft + \# moderat taubenhaft + \#taubenhaft} $$

Der resultierende Indikator ist ökonomisch interpretierbar: Das Hawk-O-Meter eines Textes hat den Wert - 1 (+ 1), wenn MILA alle Aussagen taubenhaft (falkenhaft) bewertet. Neben der Betrachtung des gesamten Narrativs ist auch eine Differenzierung nach thematischen Aspekten möglich. 29 So kann MILA beispielsweise das Hawk-O-Meter auch ausschließlich für Aussagen mit direktem Bezug zur Inflation oder zur Realwirtschaft berechnen. 

Zusätzlich analysiert MILA auf Satzebene das Sentiment der gesamten "Erklärung zur Geldpolitik" und bestimmt, ob diese eher positiv, neutral oder negativ ist. Wie im ersten Abschnitt diskutiert, ist die Sentiment-Dimension (Stimmung) nicht identisch zur Dimension falkenhaft-taubenhaft (geldpolitische Ausrichtung). Der EZB-Rat könnte in einer Pressekonferenz beispielsweise falkenhaft und positiv oder falkenhaft und negativ kommunizieren (siehe für Beispiele den Exkurs Beispiele für Klassifikationen von MILA). Die Sentiment-Klassifikation unterscheidet sich daher vom zuvor beschriebenen Hawk-O-Meter für das wirtschaftliche Narrativ. Zwar betrachtet MILA in diesem Schritt ebenso individuelle Sätze, diese werden nun aber in die Kategorien positiv, neutral oder negativ eingeordnet. Um hierbei einen Fokus auf das wirtschaftliche Narrativ sicherzustellen, wird das gesamte MPS berücksichtigt, Aussagen ohne direkten Bezug zu wirtschaftlichen Entwicklungen oder zu geldpolitischen Entscheidungen werden aber als neutral klassifiziert. Zur Berechnung des Sentiments für den Gesamttext wird Formel (1) verwendet: Der Indikator nimmt den Wert - 1 (+ 1) an, wenn der Text ausschließlich negative (positive) Sätze beinhaltet. 

MILA kann ebenfalls die Reden von Mitgliedern des EZB-Rats analysieren. In diesem Falle untersucht MILA zunächst, ob die Rede einen geldpolitischen Bezug aufweist und die Klassifikationsanalyse in falkenhaft oder taubenhaft daher sinnvoll ist. 30 Wenn eine Rede als geldpolitisch eingeschätzt wird, generiert MILA das Hawk-O-Meter und das Sentiment für das wirtschaftliche Narrativ analog zum oben beschriebenen Vorgehen. Die Klassifikation greift dabei auf den aus EZB-Pressekonferenzen abgeleiteten Inflationskontext zurück. Auch ein Zins-Hawk-O-Meter kann berechnet werden; hierzu werden alle Sätze mit direktem Bezug zu geldpolitischen Instrumenten einbezogen. 31

Exkurs

Beispiele für Klassifikationen von MILA

In Tabelle 4.1 werden verschiedene Beispiele ausgeführt, wie MILA geldpolitische Sätze klassifiziert und die eigene Einschätzung begründet.

Tabelle 4.1: Beispiele für Klassifikationen von MILA1)
SatzQuelleHawk-O-MeterBegründung Hawk-O-MeterSentimentBegründung Sentiment
Die Binneninflation ist immer noch erhöht, da der Lohndruck im Euroraum nach wie vor stark ist. EZB-Pressekonferenz 17. Oktober 2024FalkenhaftDer Satz wird als falkenhaft eingestuft, weil er explizit auf Aufwärtsrisiken für die Preisstabilität hinweist, insbesondere auf starken Lohndruck, der die Inflationsrate über das Ziel hinaus erhöhen könnte.NegativDer Satz wird als negativ eingestuft, weil er darauf hinweist, dass die inländische Inflation aufgrund steigender Löhne hoch bleibt, was darauf hindeutet, dass die Inflation trotz der Erwartung eines Rückgangs im Laufe des nächsten Jahres nicht auf das Zielniveau sinkt.
Die jährliche Inflationsrate fiel im September weiter auf 1,7 % und damit auf den niedrigsten Stand seit April 2021.EZB-Pressekonferenz 17. Oktober 2024TaubenhaftDer Satz wird als taubenhaft eingestuft, weil die Inflation unter dem Zielwert liegt, was auf die Notwendigkeit einer geldpolitischen Lockerung zur Unterstützung der Preisstabilität hinweisen könnte.NegativDer Satz wird als negativ eingestuft, weil er darauf hinweist, dass die aktuelle Inflationsrate unter dem Ziel der EZB liegt und weiter gesunken ist, wodurch sie sich noch weiter vom gewünschten Ziel von 2 % entfernt.
Der EZB-Rat bekundet dem ukrainischen Volk seine volle Unterstützung.EZB-Pressekonferenz 10. März 2022NeutralDer Satz wird als neutral eingestuft, da er keine Auswirkungen auf die Geldpolitik oder den wirtschaftlichen Kontext hat, was ihn nicht mit der Inflation oder dem Mandat der EZB in Verbindung bringt.NeutralDer Satz wird als neutral eingestuft, da er eine Erklärung der Unterstützung und Solidarität bietet, jedoch keine wirtschaftlichen Informationen oder Stimmungen in Bezug auf Inflation oder wirtschaftliche Bedingungen vermittelt.
Der Einmarsch Russlands in die Ukraine markiert einen Wendepunkt für Europa.EZB-Pressekonferenz 10. März 2022NeutralDer Satz wird als neutral eingestuft, da er keine Informationen in Bezug auf Inflation, Geldpolitik oder wirtschaftliche Entwicklungen liefert.NegativDer Satz wird als negativ eingestuft, da er auf ein bedeutendes und potenziell destabilisierendes Ereignis, der russische Angriffskrieg auf die Ukraine, verweist, das weitreichende und negative Folgen für die europäische Wirtschaft und Stabilität haben kann.
Der derzeitige Anstieg der Inflation dürfte im Wesentlichen vorübergehender Natur sein, und der zugrunde liegende Preisdruck baut sich nur langsam auf. EZB-Pressekonferenz  9. September 2021Moderat
taubenhaft
Der Satz wird als moderat taubenhaft eingestuft, weil er darauf hindeutet, dass der Inflationsdruck vorübergehend ist und sich nur allmählich aufbauen wird, was den Bedarf an sofortiger geldpolitischer Straffung verringert, aber nicht unbedingt eine Lockerung impliziert.PositivDer Satz wird als positiv eingestuft, da er andeutet, dass die derzeit über dem Zielwert liegende Inflationsrate voraussichtlich vorübergehend ist und der zugrunde liegende Preisdruck nur allmählich zunehmen wird, was auf einen Rückgang der Inflation in Richtung des Ziels hindeutet.
Mit Blick auf die Zukunft werden wir die Situation an den Finanzmärkten sowie die möglichen Auswirkungen auf den geldpolitischen Kurs und auf die Aussichten für die Preisstabilität genau beobachten.EZB-Pressekonferenz 16. Juli 2015NeutralDer Satz wird als neutral eingestuft, weil er nur die Absicht der EZB ausdrückt, die Situation zu beobachten, ohne spezifische Informationen über Inflation oder geldpolitische Implikationen zu liefern.NeutralDer Satz wird als neutral eingestuft, da er keine Informationen über Inflationsrisiken oder wirtschaftliche Entwicklungen liefert, die eine straffere oder lockerere Geldpolitik rechtfertigen würden.
1 Klassifikation durch MILA, ein KI-Modell basierend auf Llama 3.1. Hawk-O-Meter misst, ob Kommunikation auf restriktive (falkenhafte) oder expansive (taubenhafte) Geldpolitik hinweist. Sentiment misst, wie positiv oder negativ Kommunikation ist. 

4 Falken- oder taubenhaft? Ein Hawk-O-Meter für geldpolitische Kommunikation

Laut Einschätzung von MILA war das wirtschaftliche Narrativ des EZB-Rats seit Ende 2011 größtenteils taubenhaft (Abbildung 4.3). Die Pressekonferenzen unter der Leitung von Mario Draghi (November 2011 bis Oktober 2019) werden überwiegend als besonders taubenhaft eingeschätzt. Dieser Zeitraum umfasst die europäische Staatsschuldenkrise, in welcher der EZB-Rat eine Störung der geldpolitischen Transmission feststellte und den wirtschaftlichen Ausblick als schwach einschätzte. MILA verzeichnet im zeitlichen Umfeld der "Whatever it takes"-Aussage im Juli 2012 ein besonders taubenhaftes wirtschaftliches Narrativ. Auch die Pressekonferenzen in der ab 2014 beginnenden Phase negativer Leitzinsen und weiterer unkonventioneller geldpolitischer Maßnahmen werden als sehr taubenhaft eingeschätzt. 32 Der EZB-Rat betonte in dieser Zeit die sehr niedrigen und teils negativen Inflationsraten sowie das erhöhte Risiko, dass sich diese Dynamik verstetigen würde. Die Pressekonferenzen des EZB-Rats zu Beginn der Corona-Pandemie Anfang 2020, die unter der Präsidentschaft von Christine Lagarde stattfanden, bewertet MILA als hochgradig taubenhaft. Der EZB-Rat betonte damals, dass ein Konjunktureinbruch von einer in Friedenszeiten noch nie dagewesen Größenordnung und Geschwindigkeit vorläge. 33 Insgesamt ist für den Zeitraum 2011 bis 2021 besonders auffällig, dass die Hawk-O-Meter für Inflation und Realwirtschaft über weite Teile einen starken Gleichlauf aufweisen. Dies ist konsistent mit einem Narrativ einer lang anhaltenden Schwäche der aggregierten Nachfrage, damit verbundenem Abwärtsdruck auf die Inflationsdynamik und einer daraus resultierenden äußerst expansiven Geldpolitik.

Hawk-O-Meter des wirtschaftlichen Narratives in EZB-Pressekonferenzen
Hawk-O-Meter des wirtschaftlichen Narratives in EZB-Pressekonferenzen

Das wirtschaftliche Narrativ wurde 2021 weniger taubenhaft und war während der geldpolitischen Straffungsphase zwischen 2022 und 2023 falkenhaft. Laut MILA wurde das Inflationsnarrativ im Verlauf des Jahres 2021 weniger taubenhaft. Der EZB-Rat betonte damals die erhöhte Inflation, schätzte diesen Anstieg allerdings als temporär ein. Anfang 2022 revidierte er seine Einschätzung angesichts überraschend stark steigender Inflationsraten, sodass die Kommunikation über Inflation erstmals nach rund zehn Jahren merklich und länger anhaltend falkenhaft ausfiel. Der Höhepunkt des Hawk-O-Meters liegt im Juni 2022, als der EZB-Rat die erste Leitzinserhöhung für die darauffolgende Sitzung ankündigte. Das Inflationsnarrativ blieb höchst falkenhaft bis Ende 2022, als die Inflationsrate im Euroraum über 10 % erreichte. In den Jahren 2023 und 2024 wurde das Inflationsnarrativ dann graduell weniger falkenhaft. Zuletzt schätzte es MILA als balanciert ein. Im Gegensatz zum Inflationsnarrativ blieb die Kommunikation des EZB-Rats zur realwirtschaftlichen Entwicklung während dieses Zeitraums überwiegend taubenhaft oder höchstens balanciert. Eine solche Divergenz im Narrativ zwischen Inflation und Realwirtschaft weist darauf hin, dass der EZB-Rat in der Folge des russischen Angriffskrieges gegen die Ukraine im Februar 2022 vor allem angebotsseitige Störungen – mit inflationserhöhenden aber wachstumsdämpfenden Effekten – betonte. Die eher taubenhafte Kommunikation über die Realwirtschaft seit Mitte 2023 spiegelte darüber hinaus aber auch die strukturelle Wachstumsschwäche im Euroraum wider. 

Die Kommunikation des EZB-Rats über geldpolitische Entscheidungen war im Vorfeld der geldpolitischen Straffungsphase merklich taubenhafter als sein Inflationsnarrativ (Abbildung 4.4). Im Sommer 2021 schloss das Eurosystem seine Strategieüberprüfung ab. 34 In diesem Zuge änderte der EZB-Rat seine Kommunikation zum zukünftigen Verlauf der Leitzinsen, die sogenannte Forward Guidance. Er untermauerte seine Absicht, einen dauerhaft akkommodierenden geldpolitischen Kurs beizubehalten, um das Inflationsziel zu erreichen – auch wenn dies unter Umständen damit einherginge, „dass die Inflation vorübergehend moderat über dem Zielwert liegt“. MILA schätzt diese Kommunikation als sehr taubenhaft ein. Auch in der Folge blieb der EZB-Rat merklich taubenhaft in seiner direkten Kommunikation über geldpolitische Entscheidungen, insbesondere im Vergleich zu seinem Inflationsnarrativ. So betonte der EZB-Rat in der Pressekonferenz vom März 2022, dass Änderungen der Leitzinsen "einige Zeit" nach dem Ende der Nettoankäufe im APP vorgenommen würden. Im Juni beschloss der EZB-Rat dann, die APP-Nettoankäufe einzustellen und kündigte für seine folgende Sitzung die erste Zinserhöhung an. Dementsprechend verzeichnet MILA einen sprunghaften Anstieg des Zins-Hawk-O-Meters zwischen März und Juni 2022.  

Inflationsnarrativ und Leitzinskommunikation haben Signalcharakter für die geldpolitische Ausrichtung und zukünftige Leitzinsentscheidungen. Der geldpolitische Kurs im Euroraum (siehe den Exkurs zur Messung des geldpolitischen Kurses) wurde Ende 2021 nach und nach weniger expansiv (Abbildung 4.4). Zwar verharrte der Einlagesatz zu diesem Zeitpunkt weiterhin bei - 0,5 %. Unter anderem angesichts der falkenhaften Kommunikation über die Inflationsdynamik in Pressekonferenzen des EZB-Rats preisten Marktteilnehmer aber eine höhere Wahrscheinlichkeit für kommende Leitzinserhöhung ein, sodass längerfristige Marktzinsen stiegen. Die erste Leitzinserhöhung erfolgte dann im Juli 2022, ein halbes Jahr nachdem die Kommunikation den taubenhaften Bereich verlassen hatte, als der EZB-Rat den Einlagesatz von - 0,5 % um 50 Basispunkte auf 0 % anhob. Die Vorlaufeigenschaft der Kommunikation ist auch im weiteren Verlauf des geldpolitischen Straffungszyklus zu beobachten: der Höhepunkt der Hawk-O-Meter für Inflation und Leitzinsen liegt rund neun Monate vor der letzten Leitzinserhöhung im September 2023. Auch der Rückführung des geldpolitischen Restriktionsgrades im Jahr 2024 durch vier Leitzinssenkungen um jeweils 25 Basispunkte ging eine weniger falkenhafte Kommunikation voraus. Dies verdeutlicht, dass Zentralbanken durch ihre Kommunikation in Pressekonferenzen – sowohl über das wirtschaftliche Narrativ als auch über den Leitzinspfad – zukünftige geldpolitische Entscheidungen signalisieren. 

Hawk-O-Meter für EZB-Pressekonferenzen im Vergleich zur Leitzinsentwicklung
Hawk-O-Meter für EZB-Pressekonferenzen im Vergleich zur Leitzinsentwicklung

Der Tonfall in geldpolitischen Reden des EZB-Direktoriums entwickelte sich seit 2011 im Einklang mit den EZB-Pressekonferenzen und dem makroökomischen Umfeld im Euroraum. Dabei waren die öffentlichen Äußerungen des EZB-Direktoriums laut MILA von 2011 bis 2021 ebenfalls überwiegend taubenhaft, mit einer deutlichen Wende hin zu falkenhaften Reden Anfang 2022 (Abbildung 4.5, links). Die Veränderungen im Hawk-O-Meter für geldpolitische Reden lassen sich auf makroökonomische Entwicklungen im Euroraum zurückführen (Tabelle 4.2). Die Inflationsrate und die BIP-Wachstumsrate haben einen statistisch signifikanten Effekt auf den Tonfall von Reden des EZB-Direktoriums: Die Reden werden im Durchschnitt falkenhafter, wenn Inflation oder Wachstum steigen. Die geschätzten Koeffizienten sind konsistent mit einer konventionellen geldpolitischen Regel, in welcher der Leitzins stärker in Reaktion auf Inflation angepasst wird. Dies steht auch im Einklang mit dem Preisstabilitätsmandat der EZB. Die Ergebnisse weisen darauf hin, dass geldpolitische Entscheidungsträger auf aktuelle makroökonomische Entwicklungen reagieren und ihre Sichtweise auf zukünftige geldpolitische Entscheidungen signalisieren.

Hawk-O-Meter für geldpolitische Reden und EZB-Pressekonferenzen
Hawk-O-Meter für geldpolitische Reden und EZB-Pressekonferenzen
Tabelle 4.2: Geschätzter Einfluss makroökonomischer Variablen auf das Hawk-O-Meter für geldpolitische Reden des EZB-Direktoriums 
VariableHawk-O-Meter 1)
(1)(2)(3)(4)(5)
HVPI-Inflationsrate

0,0946***

0,1295***

0,0638***

0,0677***

0,0673***

(0,005)

(0,005)

(0,010)

(0,009)

(0,009)

BIP-Wachstumsrate

0,0147***

0,0024

0,0121***

0,0109***

0,0092**

(0,004)

(0,003)

(0,005)

(0,004)

(0,004)

Fixe Effekte

-

Redner

Jahr

Redner, Jahr

Redner, Jahr, Redner-Jahr

1 Geschätzte Koeffizienten aus einer Panelregression. Abhängige Variable ist das Hawk-O-Meter für individuelle geldpolitische Reden von Mitgliedern des EZB-Direktoriums von November 2011 bis August 2024. Inkludiert werden alle Mitglieder mit mindestens 16 geldpolitischen Reden, dies ergibt 350 Beobachtungen. Erklärende Variablen sind die Inflationsrate und das BIP-Wachstum im Euroraum (jeweils Dreimonats-Durchschnitte). In Spezifikationen (2)-(5) wird für jahresspezifische beziehungsweise Redner-spezifische fixe Effekte kontrolliert. Standardfehler in Klammern. Signifikanzniveaus: *** p < 0,01, ** p < 0,05, * p < 0,1. 

5 Positiv oder negativ? Ein Sentiment-Indikator für geldpolitische Kommunikation

Das Sentiment in EZB-Pressekonferenzen war laut Einschätzung von MILA seit 2011 überwiegend positiv (Abbildung 4.6, links). Nach der Senkung des Einlagesatzes auf 0 % im Juli 2012 verzeichnet MILA ein negatives Sentiment, das bis etwa Ende 2013 anhielt. Dies reflektiert in erster Linie ein pessimistisches Narrativ über die wirtschaftliche Dynamik im Kontext der europäischen Staatsschuldenkrise. Von 2014 bis zum Ende der Amtszeit von Mario Draghi als EZB-Präsident im November 2019 war das Sentiment hingegen weitgehend optimistisch. Die nachfolgende Corona-Pandemie spiegelte sich auch in EZB-Pressekonferenzen: Während die Lockdowns im Frühjahr 2020 und Winter 2020/21 mit negativem Sentiment einhergingen, führten die zunehmende Verbreitung von Impfstoffen und die Wiederöffnung der Wirtschaft 2021 zu Optimismus. Eine neuerliche pessimistische Phase verzeichnet MILA im zeitlichem Umfeld des russischen Angriffskrieges gegen die Ukraine und dem starken Anstieg der Inflation Anfang 2022. Besonders auffällig ist die EZB-Pressekonferenz im Oktober 2022, in welcher der Sentiment-Indikator einen Tiefstand erreicht. Damals reagierten Finanzmärkte stark taubenhaft, obwohl der EZB-Rat die Leitzinsen um 75 Basispunkte erhöhte und den Leitzinsausblick nicht änderte. MILA weist darauf hin, dass dies möglicherweise auf die äußerst pessimistische Kommunikation zurückzuführen ist. Seit der letzten Zinserhöhung im September 2023 wurde das Sentiment graduell positiver.

Ein historischer Vergleich von Sentiment und Hawk-O-Meter des wirtschaftlichen Narrativs verdeutlicht, dass die beiden Dimensionen nicht als äquivalent zu betrachten sind (Abbildung 4.6, rechts). Laut MILA war das wirtschaftliche Narrativ in den EZB-Pressekonferenzen unter Präsident Draghi während der Staatsschuldenkrise insgesamt taubenhaft und balanciert. Ab der Einführung der Forward Guidance im Juli 2013 war die Kommunikation bis zum Ende seiner Amtszeit dagegen taubenhaft und positiv. Insbesondere für 2014 bis 2018 weist die Einschätzung von MILA auf eine insgesamt zufriedenstellende makroökonomische Entwicklung hin, zu der die akkommodierende Geldpolitik beitrug. In der Amtszeit von Präsidentin Lagarde lassen sich drei verschiedene Phasen identifizieren. Für die Corona-Pandemie wird ein stark taubenhafter Tonfall und ein merklich negatives Sentiment verzeichnet. Das Sentiment in der anschließenden geldpolitischen Straffungsphase von 2022 bis 2023 war ebenfalls negativ, die Kommunikation aber insgesamt falkenhaft. In der 2024 begonnenen Phase der Rückführung des geldpolitischen Restriktionsgrades ist das wirtschaftliche Narrativ weitgehend balanciert und leicht taubenhaft. Eine Kombination von merklich falkenhafter und positiver Kommunikation trat laut MILA in den letzten 14 Jahren nur für kurze Zeit, nämlich in vier EZB-Pressekonferenzen in der zweiten Jahreshälfte 2018 auf. 

Sentiment des wirtschaftlichen Narratives in EZB-Pressekonferenzen
Sentiment des wirtschaftlichen Narratives in EZB-Pressekonferenzen

6 Diskussion und Ausblick

Künstliche Intelligenz bietet vielversprechende Möglichkeiten, die Analyse geldpolitischer Texte zu verbessern und damit das Verständnis der Eigenschaften von Zentralbankkommunikation erheblich zu fördern. Mithilfe von großen Sprachmodellen ist es möglich, unterschiedliche geldpolitische Texte von Zentralbanken automatisiert und regelgeleitet auszuwerten. Auf solchen Modellen basierende digitale Agenten – wie beispielsweise der in der Bundesbank entwickelte MILA – erlauben darüber hinaus eine detaillierte, transparente und multidimensionale Analyse, die die Flexibilität menschlicher Einschätzungen mit der Konsistenz formeller Methoden vereint. 

Diesen Fortschritten in der Analyse stehen Herausforderungen gegenüber. Die Interpretation und Bewertung geldpolitischer Aussagen bleibt komplex und kontextabhängig. Die Kommunikation muss daher im Kontext der aktuellen wirtschaftlichen Lage, der vorherigen Aussagen sowie der geldpolitischen Ausrichtung betrachtet werden, um eine akkurate Einschätzung zu treffen. Die Gefahr von Fehleinschätzungen durch automatisierte Systeme erfordert weiterhin eine sorgfältige Überprüfung und Validierung durch menschliche Fachleute. Darüber hinaus ist es essenziell, die eingesetzten Modelle kontinuierlich an neue technische und sprachliche Entwicklungen sowie ökonomische Erkenntnisse anzupassen. Nur so kann gewährleistet werden, dass die KI-Analyse nützlich und ausreichend präzise bleibt. 

Aus Zentralbanksicht bietet die Integration von KI in die Analyse geldpolitischer Texte das Potenzial, die eigene Kommunikation besser zu gestalten. KI-Analysen können die Eigenschaften geldpolitischer Kommunikation regelgeleitet entlang verschiedener Dimensionen quantifizieren. Auf Basis der quantitativen Indikatoren ist es möglich, beispielsweise den Einfluss dieser Merkmale auf die Finanzmarktreaktionen im unmittelbaren zeitlichen Umfeld der Kommunikation zu untersuchen. Eine systematische KI-basierte Analyse trägt somit zu einem tieferen Verständnis der Wahrnehmung und Wirkung geldpolitischer Äußerungen bei. So kann eine KI-gestützte Textanalyse Zentralbanken dabei helfen, ihre eigene Kommunikation besser zu gestalten. Insbesondere könnte durch den Einsatz von KI im Vorfeld überprüft werden, ob der Tonfall der Kommunikation die intendierten geldpolitischen Signale adäquat vermittelt. Dies könnte dazu beitragen, unerwünschte Marktreaktionen wie im Oktober 2022 zu vermeiden (siehe Kapitel: "Positiv oder negativ? Ein Sentiment-Indikator für geldpolitische Kommunikation"). Eine solche Verbesserung könnte die Wirksamkeit und Zielgenauigkeit eines der wichtigsten geldpolitischen Instrumente steigern. Eine daraus resultierende effektivere und transparentere geldpolitische Kommunikation kann letztlich dazu beitragen, das Vertrauen der Öffentlichkeit in die Zentralbank zu stärken, Inflationserwartungen zu verankern und damit dem Primärmandat der Preisstabilität gerecht zu werden.

Die zunehmende Verbreitung von KI-Analysen unter Finanzmarktakteuren ist allerdings auch mit Risiken verbunden. Wenn Marktteilnehmer vermehrt KI einsetzen, um geldpolitische Aussagen zu analysieren und künftige Entscheidungen vorherzusagen, könnten ihre Wahrnehmungen und Interpretationen von Zentralbankkommunikation zunehmend homogener werden. Dies wäre insbesondere dann der Fall, wenn Finanzmarktakteure sehr ähnliche KI-Modelle nutzen, sich aus Effizienzgründen vornehmlich auf die KI-Einschätzung verlassen und daher weniger in die Akquise von zusätzlichen Informationen investieren. Da an Finanzmärkten Anreize bestehen, die Einschätzungen anderer zu antizipieren, könnten sich Marktteilnehmer zunehmend an den KI-basierten Einschätzungen anderer Akteure orientieren. 35 Damit würde der Erwartungsbildungsprozess der Marktakteure und damit der Preisfindungsprozess weniger effizient erfolgen, und mit dem Risiko fragiler Marktstimmungen verbunden sein. 36 So könnte es zu einer erhöhten Volatilität kommen, wenn sich die Marktbedingungen unerwartet rasch ändern oder die Zentralbank eine nicht antizipierte Entscheidung trifft.

Die Verfügbarkeit von KI-Analysen kann zudem die geldpolitische Kommunikation für Zentralbanken herausfordernder machen. Für Zentralbanken kann es schwieriger werden, ihre Botschaften effektiv an ihr menschliches Zielpublikum zu senden, wenn dieses zunehmend KI zur Interpretation einsetzt. Falls Zentralbanken zudem KI zur Gestaltung ihrer Kommunikation einsetzen, könnte ein Szenario entstehen, in dem am Ende nur noch Maschinen mit Maschinen kommunizieren. Dies wirft Bedenken hinsichtlich der Wirksamkeit der geldpolitischen Kommunikation und des Potenzials für Rückkopplungsschleifen auf, die Marktbewegungen verstärken oder zu sich selbst erfüllenden Erwartungen führen könnten. 37 Es ist entscheidend, dass sowohl Marktteilnehmer als auch Zentralbanken sich dieser möglichen Implikationen bewusst sind. Eine kritische Auseinandersetzung mit KI-gestützter Analyse ist unerlässlich, um diese Risiken zu adressieren und sicherzustellen, dass Zentralbanken die Kontrolle über die Wirkung ihrer geldpolitischen Kommunikation bewahren.

Literaturverzeichnis

Angeletos, G.-M. und A. Pavan (2007), Efficient Use of Information and Social Value of Information, Econometrica, 75, S. 1103 – 1142. 

Altavilla, C., L. Brugnolini, R. S. Gürkaynak, R. Motto und G. Ragusa (2019), Measuring Euro Area Monetary Policy, Journal of Monetary Economics, Vol. 108, S. 162 – 179.

Apel, M. und M. Blix Grimaldi (2014), How Informative Are Central Bank Minutes?, Review of Economics, Vol. 65 (1), 2014, S. 53 – 76.

Auroba, S. B. und T. Drechsel (2024), Identifying Monetary Policy Shocks: A Natural Language Approach, NBER Working Paper, 32417, Mai 2024. 

Beretta, E., V. Dianova, G. Pankratz und U. Schollmeyer (2025), AI-based forecasting and market expectations: a self-fulfilling prophecy?, mimeo. 

Bernanke, B. S. und A. S. Blinder (1992), The Federal Funds Rate and the Channels of Monetary Transmission, The American Economic Review, Vol. 82 (4) (September), S. 901 – 921.

Bernanke, B. S. (2022), The Fed from the Great Inflation to COVID-19, Brookings Webinar am 23. Mai 2022. 

Bikhchandani, S., D. Hirshleifer, O. Tamuz und I. Welch (2024), Information Cascades and Social Learning, Journal of Economic Literature, Vol. 62 (3), S. 1040 – 1093.

Blinder, A. S., M. Ehrmann, M. Fratzscher, J. De Haan und D.-J. Jansen (2008), Central Bank Communication and Monetary Policy: A Survey of Theory and Evidence, Journal of Economic Literature, Vol. 46 (4), S. 910 – 945.

Blinder, A. S., M. Ehrmann, J. De Haan und D.-J. Jansen (2024), Central Bank Communication with the General Public: Promise or False Hope, Journal of Economic Literature, Vol. 62 (2), S. 425 – 457.

Bohl, M. T., D. Kanelis und P. L. Siklos (2023), Central Bank Mandates: How Differences Can Influence the Content and Tone of Central Bank Communication, Journal of International Money and Finance, Vol. 130. 

Brown et al. (2020), Language models are few-shot learners, NIPS’20: Proceedings of the 34th International Conference on Neural Information Processing Systems.

Caballero, R. J., T. E. Caravello und A. Simsek (2024), Financial Conditions Targeting, NBER Working Paper, No. 33206, November 2024.

Choi, J., T. Doh, A. Foerster und Z. Martinez (2022), Monetary Policy Stance Is Tighter than Federal Funds Rate, FRBSF Economic Letter, No 2022‑30.

Christiano, L. J., M. Eichenbaum und C. L. Evans (1999), Monetary policy shocks: What have we learned and to what end, Kapitel 2 in Handbook of Macroeconomics, Vol. 1, Part A, Elsevier.

Cieslak, A. und A. Schrimpf (2019), Non-monetary news in central bank communication, Journal of International Economics, Vol. 118, Mai 2019, S. 293 – 315.

Clarida, R., J. Galí und M. Gertler (1999), The Science of Monetary Policy: A New Keynesian Perspective, Journal of Economic Literature, Vol. 37 (4), S. 1661 – 1707.

Curti, F. und S. Kazinnik (2023), Let's face it: Quantifying the impact of nonverbal communication in FOMC press conferences, Journal of Monetary Economics, Vol. 139, S. 110 – 125.

Deutsche Bundesbank (2025), Der Risikoappetit auf den Finanzmärkten und Geldpolitik, Monatsbericht, Januar 2025.

Deutsche Bundesbank (2024a), Entwicklung der Unternehmenskredite in Deutschland seit Beginn der geldpolitischen Straffung, Monatsbericht, Juli 2024.

Deutsche Bundesbank (2024b), Die Finanzierungskosten der Banken in Deutschland im geldpolitischen Zinszyklus, Monatsbericht, Dezember 2024.

Deutsche Bundesbank (2023), Zinsstrukturkurven in der volkswirtschaftlichen Analyse , Monatsbericht, Januar 2023.

Deutsche Bundesbank (2021a), Die geldpolitische Strategie des Eurosystems , Monatsbericht, September 2021.

Deutsche Bundesbank (2021b), Der Einfluss der Geldpolitik des Eurosystems auf Bitcoin und andere Krypto-Token , Monatsbericht, September 2021.

Deutsche Bundesbank (2020), Der Einfluss der Geldpolitik auf den Wechselkurs des Euro , Monatsbericht, September 2020.

Deutsche Bundesbank (2017), Geldpolitische Indikatoren an der Zinsuntergrenze auf Basis von Zinsstrukturmodellen , Monatsbericht, September 2017.

Deutsche Bundesbank (2013), "Forward Guidance" – Orientierung über die zukünftige Ausrichtung der Geldpolitik , Monatsbericht, August 2013, S. 31 ff.

Deutsche Bundesbank (2004), Geldpolitik unter Unsicherheit , Monatsbericht, Juni 2004.

Deutsche Bundesbank (2000), Transparenz in der Geldpolitik , Monatsbericht, März 2000.

Devlin, J., M. W. Chang, K. Lee und K. Toutanova (2019), BERT: Pre-training of deep bidirectional transformers for language understanding, in: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language.

Doh, T. und J. Choi (2016), Measuring the Stance of Monetary Policy on and off the Zero Lower Bound, FRB Kansas City Economic Review, Vol. 101 (3), S. 5 – 21.

Ehrmann, M. und J. Talmi (2020), Starting from a blank page? Semantic similarity in central bank communication and market volatility, Journal of Monetary Economics, Elsevier, Vol. 111 (C), S. 48 – 62.

Ehrmann, M. und M. Fratzscher (2007), Communication by Central Bank Committee Members: Different Strategies, Same Effectiveness?, Journal of Money, Credit and Banking, Vol. 39, Issue 2‑3, S. 509 – 541.

Europäische Zentralbank (2021), An overview of the ECB's monetary policy strategy, July 2021.

Europäische Zentralbank (2019), Speeches dataset.

Gambacorta, L., B. Kwon, T. Park, P. Patelli und S. Zhu (2024), CB-LMs: language models for central banking, Bank for International Settlements, Working Papers, No 1215.

Gao, M. und J. Huang (2020), Informing the Market: The Effect of Modern Information Technologies on Information Production, The Review of Financial Studies, Vol. 33 (4), April 2020, S. 1367 – 1411. 

Geiger, F. und F. Schupp (2018), With a Little Help from My Friends: Survey-Based Derivation of Euro Area Short Rate Expectations at the Effective Lower Bound, Diskussionspapier der Deutschen Bundesbank, Nr. 27/2018.

Geiger, F., D. Kanelis, P. Lieberknecht und D. Sola (2025), Monetary-Intelligent Language Agent, Deutsche Bundesbank, Technical Paper, im Erscheinen. 

Gorodnichenko, Y., T. Pham und O. Talavera (2023), The Voice of Monetary Policy, American Economic Review, Vol. 113 (2).

Grattafiori, A. et al. (2024), The Llama 3 Herd of Models, arXiv preprint 2407.21783.

Hansen, A. L. und S. Kazinnik (2024), Can ChatGPT Decipher Fedspeak?, mimeo.

Hansen, S. und M. McMahon (2016), Shocking language: Understanding the macroeconomic effects of central bank communication, Journal of International Money and Finance, Vol. 99.

Hartmann, P. und F. Smets (2018), The European Central Bank’s monetary policy during its first 20 years, Brookings Papers on Economic Activity, Fall, S. 1 – 118.

Hayo, B., K. Henseler, M. S. Rapp und J. Zahner (2022), Complexity of ECB communication and financial market trading, Journal of International Money and Finance, Vol. 128.

Istrefi, K., F. Odendahl und G. Sestieri, ECB communication and its impact on financial markets, CEPR Discussion Paper, No. 19242. 

Jansen, D.-J. und J. De Haan (2005), Talking heads: the effects of ECB statements on the euro-dollar exchange rate, Journal of International Money and Finance, Vol. 24 (2), S. 343 – 361. 

Jarociński, M. und P. Karadi (2020), Deconstructing Monetary Policy Surprises – The Role of Information Shocks, American Economic Journal: Macroeconomics, Vol. 12 (2).

Jude, C. und G. Levieuge (2024), The Pass-Through of Monetary Policy Tightening to Financing Conditions in the Euro Area and the US. Is This Time Different?, SUERF Policy Note, Issue No 342, 8. März 2024.

Kanelis, D. und P. L. Siklos (2025), The ECB press conference statement: deriving a new sentiment indicator for the euro area, International Journal of Finance & Economics, Vol. 30 (1), S. 652 – 664.

Kanelis, D. und P. L. Siklos (2022), Emotion in Euro Area Monetary Policy Communication and Bond Yields: The Draghi Era, mimeo.

Kerssenfischer, M. (2022), Information effects of euro area monetary policy, Economics Letters, Vol. 2016, July 2022.

Lombardi, D., P. L. Siklos und S. St. Amand (2019), Asset Price Spillovers from Unconventional Monetary Policy: A Global Empirical Perspective, International Journal of Central Banking, Vol. 15 (2).

Morris, S. und H. S. Shin (2002), Social Value of Public Information, American Economic Review, Vol. 92 (5), S. 1521 – 1534. 

Nitoi, M., M.-M. Pochea und S.-C. Radu (2023), Unveiling the sentiment behind central bank narratives: A novel deep learning index, Journal of Behavioral and Experimental Finance, Vol. 38.

Odendahl, F., M. S. Pagliari, A. Penalver, B. Rossi und G. Sestieri (2024), Euro area monetary policy effects. Does the shape of the yield curve matter?, Journal of Monetary Economics, Vol. 147, Supplement, Oktober 2024.

Picault, M. und T. Renault (2017), Words are not all created equal: A new measure of ECB communication, Journal of International Money and Finance, Vol. 79, S. 136 – 156.

Pfeifer, M. und V. P. Marohl (2023), CentralBankRoBERTa: a fine-tuned large language model for central bank communications, The Journal of Finance and Data Science, Vol. 9.

Rostagno, M., C. Altavilla, G. Carboni, W. Lemke, R. Motto, A. Saint Guilhem und J. Yiangou (2019), A tale of two decades: The ECB’s monetary policy at 20, ECB Working Paper, No 2346.

Sun, S., R. Yuan, Z. Cao, W. Li und P. Liu (2024), Prompt Chaining or Stepwise Prompt? Refinement in Text Summarization, arXiv 2406.00507.

Taskforce on Rate Forward Guidance and Reinvestment (2022), Rate forward guidance in an environment of large central bank balance sheets: A Eurosystem stock-taking assessment, ECB Occasional Paper, No. 290.

Weidmann, J. (2021), Kommunikation der Notenbanken im Wandel, Rede bei der virtuellen Jubiläumsveranstaltung anlässlich 50 Jahre Reuters am 30. November2021.

Weidmann, J. (2019), What the future holds – Benefits and limitations of forward guidance, Rede auf dem Europäischen Bankenkongress am 22. November 2019.

Weidmann, J. (2018), Notenbankkommunikation als geldpolitisches Instrument, Vortrag beim Zentrum für Europäische Wirtschaftsforschung am 2. Mai 2018.

Woodford, M. (2005), Central-Bank Communication and Policy Effectiveness, Präsentation beim Symposium der Federal Reserve Bank of Kansas City, Jackson Hole.

Wu, T., E. Jiang, A. Donsbach, J. Gray, A. Molina, M. Terry und C. J. Cai (2022), PromptChainer: Chaining Large Language Model Prompts through Visual Programming, arXiv 2203.06566.

Zitieren