Options
Essays in Causal Machine Learning
Type
doctoral thesis
Date Issued
2021-09-20
Author(s)
Abstract
The thesis comprises three essays in the field of causal econometrics. Each of the single essays is dedicated to the question how supervised machine learning algorithms can be integrated in standard causal designs. A first, introductory chapter puts the three following main chapters into perspective. The second chapter studies the link between semiparametric efficiency theory and causal machine learning in semiparametric difference-in-differences estimation. The third chapter investigates nonparametric and machine learning methods for estimating heterogeneous treatment effects. The last chapter analyses the implications of a parental leave reform in Germany using semiparametric difference-in-differences. A major finding from Chapter 2 is that the variance lower bound that is asymptotically attainable for semiparametric difference-in-differences estimators crucially depends on the assumptions imposed on the statistical model. It turns out that lower efficiency bounds can be achieved under more restrictive assumptions. This implies a robustness-efficiency trade-off. Further, the derived efficiency results are useful for integrating machine learning methods in semiparametric difference-in-differences estimation. In particular, it is shown that moment conditions implied by the efficient influence functions lead to plug-in estimators that maintain desirable statistical properties like asymptotic normality and efficiency even when machine learning algorithms are used to estimate first stage nuisance parameters. Chapter 3 studies nonparametric heterogeneous treatment effect estimation when the researcher is interested in effect heterogeneity with respect to a limited number of covariates. However, it turns out that estimation of first stage nuisance parameters with machine learning methods remains feasible even if the dimension of the covariates needed to account for confounding is high. In particular, coupled convergence conditions between the machine learning first stage and the nonparametric second stage are derived. Additionally, it is shown that averaging over the heterogeneous treatment effects estimators leads to an estimator for the average treatment effect that attains the semiparametric efficiency bound. The finite sample performance of the different estimators is compared in various Empirical Monte Carlo experiments. Chapter finds that a parental leave reform in Germany encourages mothers to return to the labour market earlier. As intended by the reform, mothers are mostly encouraged to return in part-time. The semiparametric difference-in-differences approach used allows to estimate first stage nuisance parameters with an ensemble learner. The empirical results are robust against the inclusion of a large number of covariates that are available from administrative data. Additionally, an identification result for heterogeneous treatment effects in semiparametric difference-in-differences is derived. It turns out that mothers with higher opportunity costs of working part-time have lower incentives to return to the labour market earlier.
Abstract (De)
Die vorliegende Thesis umfasst drei Essays aus dem Bereich der kausalen Ökonometrie. Jedes der einzelnen Kapitel ist der Frage gewidmet wie maschinelles Lernen für Standardprobleme der Kausalanalyse verwendet werden kann. Ein erstes, einführendes Kapitel veranschaulicht die Zusammenhänge zwischen den drei folgenden Hauptkapiteln. Das zweite Kapitel untersucht die Verknüpfung zwischen semiparametrischer Effizienztheorie und kausalem maschinellem Lernen in Bezug auf semiparametrische Differenzen-von-Differenzen Schätzung. Das dritte Kapitel beleuchtet Methoden aus dem Bereich der Nichtparametrik und des maschinellen Lernens zur Schätzung heterogener Treatment-Effekte. Das letzte Kapitel analysiert, unter Verwendung eines semiparametrischen Differenzen-von-Differenzen Ansatzes, die Implikationen einer Elterngeldreform in Deutschland. Die Abhängigkeit der niedrigst möglichen asymptotischen Varianz, die in semiparametrischen Differenzen-von-Differenzen Ansätzen erreicht werden kann, von den Annahmen des statistischen Modells ist eine wesentliche Erkenntnis aus Kapitel 2. Es stellt sich heraus, dass niedrigere Effizienzgrenzen mit restriktiveren Annahmen einhergehen. Dies impliziert einen Zielkonflikt zwischen der Robustheit des Modells und der niedrigst möglichen, asymptotisch erreichbaren Varianz. Desweiteren können die hergeleiteten Effizienzergebnisse zur Integration von Methoden des maschinellen Lernens in semiparametrische Differenzen-von-Differenzen Ansätze benutzt werden. Insbesondere wird gezeigt, dass Momentenbedingungen, die durch effiziente Influence-Funktionen impliziert werden, zu mehrstufigen Schätzverfahren führen, die wünschenswerte statistische Eigenschaften wie asymptotische
Normalität und Effizienz behalten – selbst wenn maschinelles Lernen zur Schätzung der ersten Stufe benutzt wird.
Kapitel 3 betrachtet die nichtparametrische Schätzung heterogener Treatment-Effekte in Situationen wo Effekt-heterogenität nur für eine begrenzte Anzahl von Kovariaten von Interesse ist. Jedoch stellt sich heraus, dass die Schätzung von Parametern mit Methoden des maschinellen Lernens auf der ersten Stufe selbst dann möglich
bleibt, wenn die Dimension derjenigen Kovariaten, die nötig sind um für Selbstselektion zu kontrollieren, hoch ist. Insbesondere werden kombinierte Konvergenzraten zwischen den Methoden des maschinellen Lernerns auf der ersten Stufe und der nichtparametrischen zweiten Stufe hergeleitet. Zusätzlich wird gezeigt, dass die Mittelwertbildung über die Effektheterogenitätsschätzer zu Schätzern für mittlere Effekte führt, die asymptotisch die niedrigst mögliche Varianz erreichen. Die Eigenschaften der verschiedenen Schätzer in kleinen Stichproben werden mittels empirischer Monte Carlo-Simulation verglichen.
Kapitel 4 zeigt, dass eine Elterngeldreform in Deutschland Mütter dazu bewegt frühzeitig auf den Arbeitsmarkt
zurückzukehren. Wie durch die Reform intendiert, werden Mütter hauptsächlich dazu bewegt in Teilzeit zurückzukehren. Der verwendete semiparametrische Differenzen-von-Differenzen Ansatz ermöglicht die Schätzung von Parametern auf der ersten Stufe mittels eines Ensembleverfahrens. Die empirischen Ergebnisse sind gegenüber
einer Vielzahl von verwendeten Kovariaten, die aus administrativen Daten verfügbar sind, robust. Zusätzlich wird ein Identifikationsergebnis für heterogene Treatment-Effekte in semiparametrischen Differenzen-von-Differenzen Ansätzen hergeleitet. Es stellt sich heraus, dass Mütter mit höheren Opportunitätskosten in Teilzeit zu arbeiten weniger starke Anreize haben früher auf den Arbeitsmarkt zurückzukehren.
Normalität und Effizienz behalten – selbst wenn maschinelles Lernen zur Schätzung der ersten Stufe benutzt wird.
Kapitel 3 betrachtet die nichtparametrische Schätzung heterogener Treatment-Effekte in Situationen wo Effekt-heterogenität nur für eine begrenzte Anzahl von Kovariaten von Interesse ist. Jedoch stellt sich heraus, dass die Schätzung von Parametern mit Methoden des maschinellen Lernens auf der ersten Stufe selbst dann möglich
bleibt, wenn die Dimension derjenigen Kovariaten, die nötig sind um für Selbstselektion zu kontrollieren, hoch ist. Insbesondere werden kombinierte Konvergenzraten zwischen den Methoden des maschinellen Lernerns auf der ersten Stufe und der nichtparametrischen zweiten Stufe hergeleitet. Zusätzlich wird gezeigt, dass die Mittelwertbildung über die Effektheterogenitätsschätzer zu Schätzern für mittlere Effekte führt, die asymptotisch die niedrigst mögliche Varianz erreichen. Die Eigenschaften der verschiedenen Schätzer in kleinen Stichproben werden mittels empirischer Monte Carlo-Simulation verglichen.
Kapitel 4 zeigt, dass eine Elterngeldreform in Deutschland Mütter dazu bewegt frühzeitig auf den Arbeitsmarkt
zurückzukehren. Wie durch die Reform intendiert, werden Mütter hauptsächlich dazu bewegt in Teilzeit zurückzukehren. Der verwendete semiparametrische Differenzen-von-Differenzen Ansatz ermöglicht die Schätzung von Parametern auf der ersten Stufe mittels eines Ensembleverfahrens. Die empirischen Ergebnisse sind gegenüber
einer Vielzahl von verwendeten Kovariaten, die aus administrativen Daten verfügbar sind, robust. Zusätzlich wird ein Identifikationsergebnis für heterogene Treatment-Effekte in semiparametrischen Differenzen-von-Differenzen Ansätzen hergeleitet. Es stellt sich heraus, dass Mütter mit höheren Opportunitätskosten in Teilzeit zu arbeiten weniger starke Anreize haben früher auf den Arbeitsmarkt zurückzukehren.
Language
English
Keywords
Ökonometrisches Modell
Maschinelles Lernen
Ökonometrie
EDIS-5162
HSG Classification
not classified
HSG Profile Area
None
Publisher
Universität St. Gallen
Publisher place
St.Gallen
Official URL
Subject(s)
Division(s)
Eprints ID
264389
File(s)
Loading...
open access
Name
Dis5162.pdf
Size
8.92 MB
Format
Adobe PDF
Checksum (MD5)
139eff041518da2fc3ec5827c43cc133