Tobit-Modell - Tobit model

In der Statistik ist ein Tobit-Modell eine Klasse von Regressionsmodellen, bei denen der beobachtete Bereich der abhängigen Variablen in irgendeiner Weise zensiert ist . Der Begriff wurde von Arthur Goldberger in Anlehnung an James Tobin geprägt , der das Modell 1958 entwickelte, um das Problem der Null-Inflation- Daten für die Beobachtung der Haushaltsausgaben für langlebige Güter zu mildern . Da Tobins Methode leicht erweitert werden kann, um abgeschnittene und andere nicht zufällig ausgewählte Stichproben zu behandeln, verwenden einige Autoren eine breitere Definition des Tobit-Modells, die diese Fälle einschließt.

Tobins Idee war, die Likelihood-Funktion so zu modifizieren , dass sie die ungleiche Stichprobenwahrscheinlichkeit für jede Beobachtung widerspiegelt, je nachdem, ob die latente abhängige Variable über oder unter den bestimmten Schwellenwert gefallen ist. Bei einer Stichprobe, die, wie in Tobins ursprünglichem Fall, von unten bei Null zensiert wurde, ist die Stichprobenwahrscheinlichkeit für jede nicht limitierte Beobachtung einfach die Höhe der entsprechenden Dichtefunktion . Für jede Grenzbeobachtung ist es die kumulative Verteilung, dh das Integral unter Null der entsprechenden Dichtefunktion. Die Tobit-Likelihood-Funktion ist somit eine Mischung aus Dichten und kumulativen Verteilungsfunktionen.

Die Likelihood-Funktion

Unten sind die Likelihood- und Log-Likelihood-Funktionen für ein Tobit vom Typ I. Dies ist ein Tobit, der bei der latenten Variable von unten zensiert wird . Beim Ausschreiben der Likelihood-Funktion definieren wir zunächst eine Indikatorfunktion : $y_{L}$ $y_{j}^{*}\leq y_{L}$ $I$

I(y)={\begin{cases}0&{\text{if }}y\leq y_{L},\\1&{\text{if }}y>y_{L}.\end{ Fälle}}

Als nächstes wollen wir die Standard normal kumulative Verteilungsfunktion und die Standard normal sein Wahrscheinlichkeitsdichtefunktion . Für einen Datensatz mit N Beobachtungen ist die Likelihood-Funktion für ein Typ-I-Tobit $\Phi$ ${\displaystyle\varphi}$

{\mathcal{L}}(\beta,\sigma)=\prod_{j=1}^{N}\left({\frac {1}{\sigma}}\varphi \left({ \frac {y_{j}-X_{j}\beta}{\sigma}}\right)\right)^{I(y_{j})}\left(1-\Phi \left({\frac { X_{j}\beta -y_{L}}{\sigma}}\right)\right)^{1-I(y_{j})}

und die Log-Likelihood ist gegeben durch

{\begin{ausgerichtet}\log {\mathcal {L}}(\beta,\sigma)&=\sum_{j=1}^{n}I(y_{j})\log \left ({\frac {1}{\sigma}}\varphi \left({\frac {y_{j}-X_{j}\beta }{\sigma}}\right)\right)+(1-I( y_{j}))\log \left(1-\Phi \left({\frac {X_{j}\beta -y_{L}}{\sigma}}\right)\right)\\&=\ Summe _{y_{j}>y_{L}}\log \left({\frac {1}{\sigma }}\varphi \left({\frac {y_{j}-X_{j}\beta } {\sigma}}\right)\right)+\sum_{y_{j}=y_{L}}\log \left(\Phi\left({\frac {y_{L}-X_{j}\ beta }{\sigma }}\right)\right)\end{ausgerichtet}}

Umparametrierung

Die oben angegebene Log-Likelihood ist nicht global konkav, was die Maximum-Likelihood-Schätzung erschwert . Olsen schlug die einfache Reparametrisierung vor und , was zu einer transformierten Log-Likelihood führte, $\beta =\delta /\gamma$ $\sigma^{2}=\gamma^{-2}$

\log{\mathcal{L}}(\delta,\gamma)=\sum _{y_{j}>y_{L}}\left\{\log\gamma +\log\left[\varphi \left(\gamma y_{j}-X_{j}\delta \right)\right]\right\}+\sum _{y_{j}=y_{L}}\log\left[\Phi\left (\gamma y_{L}-X_{j}\delta\right)\right]

die hinsichtlich der transformierten Parameter global konkav ist.

Für das abgeschnittene (Tobit II) Modell zeigte Orme, dass die Log-Likelihood zwar nicht global konkav, aber an jedem stationären Punkt unter der obigen Transformation konkav ist .

Konsistenz

Wenn die Beziehung Parameter durch Regression des beobachtete geschätzt wird auf dem resultierenden gewöhnlichen kleinsten Quadrate Regressionsschätzer ist inkonsistent . Es ergibt eine nach unten gerichtete Schätzung des Steigungskoeffizienten und eine nach oben gerichtete Schätzung des Achsenabschnitts. Takeshi Amemiya (1973) hat bewiesen, dass der von Tobin für dieses Modell vorgeschlagene Maximum-Likelihood-Schätzer konsistent ist. $\beta$ $y_{i}$ $x_{i}$

Interpretation

Der Koeffizient sollte nicht als Effekt von auf interpretiert werden , wie dies bei einem linearen Regressionsmodell der Fall wäre ; Dies ist ein häufiger Fehler. Stattdessen sollte es als Kombination interpretiert werden aus (1) der Änderung der Werte über dem Grenzwert, gewichtet mit der Wahrscheinlichkeit, über dem Grenzwert zu liegen; und (2) die Änderung der Wahrscheinlichkeit, über dem Grenzwert zu liegen, gewichtet mit dem erwarteten Wert von if über. $\beta$ $x_{i}$ $y_{i}$ $y_{i}$ $y_{i}$

Variationen des Tobit-Modells

Variationen des Tobit-Modells können erzeugt werden, indem geändert wird, wo und wann eine Zensur stattfindet. Amemiya (1985 , S. 384) teilt diese Variationen in fünf Kategorien ein (Tobit-Typ I – Tobit-Typ V), wobei Tobit-Typ I für das oben beschriebene erste Modell steht. Schnedler (2005) liefert eine allgemeine Formel, um konsistente Likelihood-Schätzer für diese und andere Variationen des Tobit-Modells zu erhalten.

Tippe I

Das Tobit-Modell ist ein Sonderfall eines zensierten Regressionsmodells , da die latente Variable nicht immer beobachtet werden kann, während die unabhängige Variable beobachtbar ist. Eine gängige Variante des Tobit-Modells ist die Zensierung bei einem von Null verschiedenen Wert : $y_{i}^{*}$ $x_{i}$ $y_{L}$

y_{i}={\begin{cases}y_{i}^{*}&{\text{if }}y_{i}^{*}>y_{L},\\y_{L} &{\text{if }}y_{i}^{*}\leq y_{L}.\end{cases}}

Ein weiteres Beispiel ist die Zensierung der obigen Werte . $y_{U}$

y_{i}={\begin{cases}y_{i}^{*}&{\text{if }}y_{i}^{*}<y_{U},\\y_{U} &{\text{if }}y_{i}^{*}\geq y_{U}.\end{cases}}

Ein weiteres Modell ergibt sich, wenn gleichzeitig von oben und unten zensiert wird. $y_{i}$

y_{i}={\begin{cases}y_{i}^{*}&{\text{if }}y_{L}<y_{i}^{*}<y_{U},\ \y_{L}&{\text{if }}y_{i}^{*}\leq y_{L},\\y_{U}&{\text{if }}y_{i}^{*} \geq y_{U}.\end{cases}}

Der Rest der Modelle wird als von unten bei 0 begrenzt dargestellt, obwohl dies wie für Typ I verallgemeinert werden kann.

Typ II

Tobit-Modelle vom Typ II führen eine zweite latente Variable ein.

y_{2i}={\begin{cases}y_{2i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

Beim Tobit Typ I absorbiert die latente Variable sowohl den Prozess der Beteiligung als auch das Ergebnis des Interesses. Tobit vom Typ II ermöglicht die Unabhängigkeit des Beteiligungsprozesses (Auswahl) und des Ergebnisses von Interesse, abhängig von beobachtbaren Daten.

Das Heckman-Auswahlmodell fällt in den Typ-II-Tobit, der manchmal nach James Heckman Heckit genannt wird .

Typ III

Typ III führt eine zweite beobachtete abhängige Variable ein.

y_{1i}={\begin{cases}y_{1i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

y_{2i}={\begin{cases}y_{2i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

Das Heckman- Modell fällt in diesen Typ.

Typ IV

Typ IV führt eine dritte beobachtete abhängige Variable und eine dritte latente Variable ein.

y_{1i}={\begin{cases}y_{1i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

y_{2i}={\begin{cases}y_{2i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

y_{3i}={\begin{cases}y_{3i}^{*}&{\text{if }}y_{1i}^{*}\leq 0,\\0&{\text{if }}y_{1i}^{*}<0.\end{cases}}

Typ V

Ähnlich wie bei Typ II wird bei Typ V nur das Vorzeichen von beobachtet. $y_{1i}^{*}$

y_{2i}={\begin{cases}y_{2i}^{*}&{\text{if }}y_{1i}^{*}>0,\\0&{\text{if} }y_{1i}^{*}\leq 0.\end{cases}}

y_{3i}={\begin{cases}y_{3i}^{*}&{\text{if }}y_{1i}^{*}\leq 0,\\0&{\text{if }}y_{1i}^{*}>0.\end{cases}}

Nicht parametrische Version

Wenn die zugrunde liegende latente Variable nicht normalverteilt ist, muss man Quantile anstelle von Momenten verwenden, um die beobachtbare Variable zu analysieren . Der CLAD-Schätzer von Powell bietet eine Möglichkeit, dies zu erreichen. $y_{i}^{*}$ $y_{i}$

Anwendungen

Tobit-Modelle wurden beispielsweise verwendet, um Faktoren zu schätzen, die sich auf den Erhalt von Zuschüssen auswirken, einschließlich finanzieller Transfers, die an subnationale Regierungen verteilt werden, die diese Zuschüsse beantragen können. In diesen Fällen können die Stipendiaten keine negativen Beträge erhalten und die Daten werden somit linkszensiert. Dahlberg und Johansson (2002) analysieren beispielsweise eine Stichprobe von 115 Gemeinden (von denen 42 einen Zuschuss erhielten). Dubois und Fattore (2011) verwenden ein Tobit-Modell, um die Rolle verschiedener Faktoren beim Erhalt von Mitteln der Europäischen Union unter Anwendung polnischer subnationaler Regierungen zu untersuchen. Die Daten können jedoch an einem Punkt über Null linkszensiert sein, mit dem Risiko einer Fehlspezifikation. Beide Studien wenden Probit und andere Modelle an, um die Robustheit zu überprüfen. Tobit-Modelle wurden auch in der Nachfrageanalyse verwendet, um Beobachtungen mit Nullausgaben für einige Güter zu berücksichtigen. In einer verwandten Anwendung von Tobit-Modellen wurde ein System von nichtlinearen Tobit-Regressionsmodellen verwendet, um gemeinsam ein Markennachfragesystem mit homoskedastischen, heteroskedastischen und generalisierten heteroskedastischen Varianten zu schätzen.

Siehe auch

Abgeschnittenes normales Hürdenmodell
Begrenzte abhängige Variable
Gleichrichter (neuronale Netze)
Abgeschnittenes Regressionsmodell
Modell für dynamische unbeobachtete Effekte § Zensierte abhängige Variable
Probit-Modell , der Name Tobit ist ein Wortspiel sowohl auf Tobin, ihrem Schöpfer, als auch auf ihre Ähnlichkeiten mit Probit-Modellen.

Anmerkungen

Verweise

Weiterlesen

Amemiya, Takeshi (1985). "Tobit-Modelle" . Erweiterte Ökonometrie . Oxford: Basil Blackwell. S. 360–411. ISBN 0-631-13345-3.
Breen, Richard (1996). „Das Tobit-Modell für zensierte Daten“. Regressionsmodelle: Zensierte, Stichproben ausgewählte oder abgeschnittene Daten . Tausend Eichen: Salbei. S. 12–33. ISBN 0-8039-5710-6.
Gouriéroux, Christian (2000). "Das Tobit-Modell" . Ökonometrie qualitativ abhängiger Variablen . New York: Cambridge University Press. S. 170–207. ISBN 0-521-58985-1.
König, Gary (1989). "Modelle mit nicht zufälliger Auswahl" . Vereinheitlichende politische Methodik: die Likehood-Theorie der statistischen Inferenz . Cambridge University Press. S. 208–230. ISBN 0-521-36697-6.
Maddala, GS (1983). „Zensierte und abgeschnittene Regressionsmodelle“. Begrenzt-abhängige und qualitative Variablen in der Ökonometrie . New York: Cambridge University Press. S. 149 –196. ISBN 0-521-24143-X.

Languages

In other projects