Diskrete Wahl - Discrete choice

In Wirtschaft , Discrete - Choice - Modelle oder qualitative Entscheidungsmodelle , zu beschreiben, zu erklären und vorhersagen Auswahl zwischen zwei oder mehreren diskreten Alternativen, wie zum Beispiel die Eingabe oder nicht die Eingabe von Arbeitsmarkt , oder zwischen den Modi zu wählen Transport . Solche Entscheidungen stehen im Gegensatz zu Standardverbrauchsmodellen, bei denen die Menge jedes konsumierten Gutes als kontinuierliche Variable angenommen wird . Im kontinuierlichen Fall können Berechnungsmethoden (z. B. Bedingungen erster Ordnung) verwendet werden, um den gewählten optimalen Betrag zu bestimmen, und der Bedarf kann unter Verwendung einer Regressionsanalyse empirisch modelliert werden . Andererseits untersucht die Analyse der diskreten Auswahl Situationen, in denen die potenziellen Ergebnisse diskret sind, so dass das Optimum nicht durch Standardbedingungen erster Ordnung gekennzeichnet ist. Anstatt zu untersuchen, wie viel wie bei Problemen mit Variablen für die kontinuierliche Auswahl, wird bei der Analyse der diskreten Auswahl untersucht, welche. Eine diskrete Auswahlanalyse kann jedoch auch verwendet werden, um die ausgewählte Menge zu untersuchen, wenn nur wenige unterschiedliche Mengen ausgewählt werden müssen, z. B. die Anzahl der Fahrzeuge, die ein Haushalt besitzt, und die Anzahl der Minuten Telekommunikationsdienst, die ein Kunde kauft. Techniken wie logistische Regression und Probit-Regression können zur empirischen Analyse diskreter Entscheidungen verwendet werden.

Diskrete Auswahlmodelle modellieren theoretisch oder empirisch Entscheidungen, die von Menschen aus einer endlichen Menge von Alternativen getroffen werden. Die Modelle wurden verwendet, um beispielsweise die Wahl des zu kaufenden Autos, den Ort des Studiums und das Transportmittel (Auto, Bus, Bahn) zu untersuchen, das unter zahlreichen anderen Anwendungen zur Arbeit gebracht werden soll. Diskrete Auswahlmodelle werden auch verwendet, um Entscheidungen von Organisationen wie Unternehmen oder Regierungsbehörden zu untersuchen. In der folgenden Diskussion wird angenommen, dass die Entscheidungseinheit eine Person ist, obwohl die Konzepte allgemeiner anwendbar sind. Daniel McFadden erhielt den Nobelpreis im Jahr 2000 für seine Pionierarbeit bei der Entwicklung der theoretischen Grundlage für diskrete Entscheidungen.

Diskrete Auswahlmodelle beziehen die von jeder Person getroffene Auswahl statistisch auf die Attribute der Person und die Attribute der Alternativen, die der Person zur Verfügung stehen. Zum Beispiel hängt die Wahl, welches Auto eine Person kauft, statistisch mit dem Einkommen und Alter der Person sowie mit dem Preis, der Kraftstoffeffizienz, der Größe und anderen Attributen jedes verfügbaren Autos zusammen. Die Modelle schätzen die Wahrscheinlichkeit, dass eine Person eine bestimmte Alternative wählt. Die Modelle werden häufig verwendet, um vorherzusagen, wie sich die Entscheidungen der Menschen bei Änderungen der Demografie und / oder der Attribute der Alternativen ändern werden.

Diskrete Auswahlmodelle geben die Wahrscheinlichkeit an, mit der eine Person eine Option aus einer Reihe von Alternativen auswählt. Die probabilistische Beschreibung des diskreten Auswahlverhaltens wird nicht verwendet, um individuelles Verhalten widerzuspiegeln, das als intrinsisch probabilistisch angesehen wird. Es ist vielmehr der Mangel an Informationen, der uns dazu bringt, die Wahl auf probabilistische Weise zu beschreiben. In der Praxis können wir nicht alle Faktoren kennen, die individuelle Auswahlentscheidungen beeinflussen, da ihre Determinanten teilweise beobachtet oder unvollständig gemessen werden. Daher stützen sich diskrete Auswahlmodelle auf stochastische Annahmen und Spezifikationen, um unbeobachtete Faktoren zu berücksichtigen, die sich auf a) Auswahlalternativen, b) Geschmacksunterschiede zwischen Menschen (zwischenmenschliche Heterogenität) und Zeit (intraindividuelle Auswahldynamik) und c) heterogene Auswahlsätze beziehen . Die verschiedenen Formulierungen wurden zusammengefasst und in Gruppen von Modellen eingeteilt.

Anwendungen

  • Marketingforscher verwenden diskrete Auswahlmodelle, um die Verbrauchernachfrage zu untersuchen und wettbewerbsfähige Geschäftsreaktionen vorherzusagen. So können Auswahlmodellierer eine Reihe von Geschäftsproblemen wie Preisgestaltung , Produktentwicklung und Nachfrageschätzungsprobleme lösen. In der Marktforschung wird dies üblicherweise als Conjoint-Analyse bezeichnet .
  • Transportplaner verwenden diskrete Auswahlmodelle, um die Nachfrage nach geplanten Transportsystemen vorherzusagen , z. B. welche Route ein Fahrer nehmen wird und ob jemand schnelle Transitsysteme nehmen wird. Die ersten Anwendungen von Discrete-Choice-Modellen waren in der Transportplanung, und ein Großteil der fortschrittlichsten Forschung zu Discrete-Choice-Modellen wird von Transportforschern durchgeführt.
  • Energieprognostiker und politische Entscheidungsträger verwenden diskrete Auswahlmodelle für die Wahl des Heizsystems, der Geräteeffizienz und der Kraftstoffeffizienz von Fahrzeugen durch Haushalte und Unternehmen.
  • Umweltstudien verwenden diskrete Auswahlmodelle, um die Wahl der Erholer zu untersuchen, z. B. zum Angeln oder Skifahren, und um den Wert von Einrichtungen wie Campingplätzen, Fischbeständen und Wärmehütten abzuleiten und um den Wert von Verbesserungen der Wasserqualität abzuschätzen.
  • Arbeitsökonomen verwenden diskrete Wahlmodelle, um die Teilnahme an der Erwerbsbevölkerung, die Berufswahl und die Wahl der Hochschul- und Ausbildungsprogramme zu untersuchen.
  • Ökologische Studien verwenden diskrete Auswahlmodelle, um Parameter zu untersuchen, die die Auswahl von Lebensräumen bei Tieren beeinflussen.

Gemeinsame Merkmale von Modellen mit diskreter Auswahl

Diskrete Auswahlmodelle haben viele Formen, einschließlich: Binäres Logit, Binäres Probit, Multinomiales Logit, Bedingtes Logit, Multinomiales Probit, Verschachteltes Logit, Verallgemeinerte Extremwertmodelle, Gemischtes Logit und Explodiertes Logit. Alle diese Modelle haben die unten beschriebenen Merkmale gemeinsam.

Auswahlset

Der Auswahlsatz ist der Satz von Alternativen, die der Person zur Verfügung stehen. Für ein diskretes Auswahlmodell muss der Auswahlsatz drei Anforderungen erfüllen:

  1. Die Menge der Alternativen muss insgesamt erschöpfend sein , was bedeutet, dass die Menge alle möglichen Alternativen enthält. Diese Anforderung impliziert, dass die Person notwendigerweise eine Alternative aus dem Satz auswählt.
  2. Die Alternativen müssen sich gegenseitig ausschließen , was bedeutet, dass die Auswahl einer Alternative bedeutet, dass keine anderen Alternativen ausgewählt werden. Diese Anforderung impliziert, dass die Person nur eine Alternative aus dem Satz auswählt.
  3. Die Menge muss eine endliche Anzahl von Alternativen enthalten. Diese dritte Anforderung unterscheidet die diskrete Auswahlanalyse von Formen der Regressionsanalyse, bei denen die abhängige Variable (theoretisch) eine unendliche Anzahl von Werten annehmen kann.

Zum Beispiel umfasst die Auswahlmenge für eine Person, die entscheidet, welches Transportmittel zur Arbeit gebracht werden soll, das Fahren allein, Fahrgemeinschaften, Busfahrten usw. Die Auswahlmenge wird durch die Tatsache erschwert, dass eine Person für eine bestimmte Reise mehrere Verkehrsträger verwenden kann. B. mit dem Auto zum Bahnhof fahren und dann mit dem Zug zur Arbeit fahren. In diesem Fall kann der Auswahlsatz jede mögliche Kombination von Modi enthalten. Alternativ kann die Auswahl als Auswahl des „primären“ Modus definiert werden, wobei das Set aus Auto, Bus, Schiene und anderen (z. B. Gehen, Fahrräder usw.) besteht. Beachten Sie, dass die Alternative „Sonstige“ enthalten ist, um die Auswahl erschöpfend zu machen.

Unterschiedliche Personen können je nach ihren Umständen unterschiedliche Auswahlmöglichkeiten haben. Zum Beispiel wurde das Scion- Automobil ab 2009 nicht in Kanada verkauft, sodass Neuwagenkäufer in Kanada andere Auswahlmöglichkeiten hatten als die amerikanischen Verbraucher. Solche Überlegungen werden bei der Formulierung diskreter Auswahlmodelle berücksichtigt.

Auswahlwahrscheinlichkeiten definieren

Ein diskretes Auswahlmodell gibt die Wahrscheinlichkeit an, mit der eine Person eine bestimmte Alternative auswählt, wobei die Wahrscheinlichkeit als Funktion der beobachteten Variablen ausgedrückt wird, die sich auf die Alternativen und die Person beziehen. In seiner allgemeinen Form wird die Wahrscheinlichkeit, dass Person n die Alternative i wählt, ausgedrückt als:

wo

ist ein Vektor von Attributen der Alternative i gegenüber Person n ,
ist ein Vektor von Attributen der anderen Alternativen (außer i ), denen die Person n gegenübersteht ,
ist ein Vektor von Merkmalen der Person n , und
ist eine Reihe von Parametern, die die Auswirkungen von Variablen auf Wahrscheinlichkeiten angeben, die statistisch geschätzt werden.

Im obigen Beispiel für den Verkehrsträger können die Attribute der Verkehrsträger ( x ni ) wie Reisezeit und -kosten sowie die Merkmale des Verbrauchers ( s n ) wie Jahreseinkommen, Alter und Geschlecht zur Berechnung der Auswahl verwendet werden Wahrscheinlichkeiten. Die Attribute der Alternativen können sich je nach Person unterscheiden. z. B. sind Kosten und Zeit für die Fahrt zur Arbeit mit dem Auto, Bus und Bahn für jede Person unterschiedlich, abhängig vom Wohnort und der Arbeit dieser Person.

Eigenschaften:

  • P ni liegt zwischen 0 und 1
  • Dabei ist J die Gesamtzahl der Alternativen.
  • (Erwarteter Anteil der Personen, die i wählen ) wobei N die Anzahl der Personen ist, die die Wahl treffen.

Unterschiedliche Modelle (dh Modelle mit einer anderen Funktion G) haben unterschiedliche Eigenschaften. Prominente Modelle werden unten vorgestellt.

Verbraucherversorgungsunternehmen

Diskrete Auswahlmodelle können aus der Gebrauchstheorie abgeleitet werden . Diese Ableitung ist aus drei Gründen nützlich:

  1. Es gibt den Wahrscheinlichkeiten P ni eine genaue Bedeutung
  2. Es motiviert und unterscheidet alternative Modellspezifikationen, beispielsweise die Wahl einer funktionalen Form für G .
  3. Es liefert die theoretische Grundlage für die Berechnung von Änderungen des Verbraucherüberschusses (Ausgleich von Abweichungen) aus Änderungen der Attribute der Alternativen.

U ni ist der Nutzen (oder der Nettonutzen oder das Wohlbefinden), den die Person n durch die Wahl der Alternative i erhält . Das Verhalten der Person ist nutzungsmaximierend: Person n wählt die Alternative, die den höchsten Nutzen bietet. Die Wahl der Person wird für jede Alternative durch Dummy-Variablen y ni bezeichnet :

Betrachten Sie nun den Forscher, der die Wahl prüft. Die Wahl der Person hängt von vielen Faktoren ab, von denen einige vom Forscher beobachtet werden und einige vom Forscher nicht. Der Nutzen, den die Person durch die Auswahl einer Alternative erhält, wird in einen Teil zerlegt, der von Variablen abhängt, die der Forscher beobachtet, und in einen Teil, der von Variablen abhängt, die der Forscher nicht beobachtet. In einer linearen Form wird diese Zerlegung ausgedrückt als

wo

  • ist ein Vektor von beobachteten Variablen, die sich auf die Alternative i für die Person n beziehen und von den Attributen der Alternative x ni abhängen , die möglicherweise mit den Attributen der Person s n interagieren , so dass sie wie für eine numerische Funktion z ausgedrückt werden können.
  • ist ein entsprechender Koeffizientenvektor der beobachteten Variablen und
  • erfasst die Auswirkungen aller nicht beobachteten Faktoren, die die Wahl der Person beeinflussen.

Die Auswahlwahrscheinlichkeit ist dann

Bei β ist die Auswahlwahrscheinlichkeit die Wahrscheinlichkeit, dass die zufälligen Terme ε nj - ε ni (die aus Sicht des Forschers zufällig sind, da der Forscher sie nicht beobachtet) unter den jeweiligen Größen liegen. Unterschiedliche Auswahlmodelle (dh unterschiedliche Spezifikationen von G. ) ergeben sich aus unterschiedlichen Verteilungen von ε ni für alle i und unterschiedlichen Behandlungen von β .

Eigenschaften diskreter Auswahlmodelle, die durch die Gebrauchstheorie impliziert werden

Nur Unterschiede sind wichtig

Die Wahrscheinlichkeit, dass eine Person eine bestimmte Alternative wählt, wird bestimmt, indem der Nutzen der Wahl dieser Alternative mit dem Nutzen der Wahl anderer Alternativen verglichen wird:

Wie der letzte Begriff zeigt, hängt die Auswahlwahrscheinlichkeit nur von der Differenz der Versorgungsunternehmen zwischen Alternativen ab, nicht vom absoluten Niveau der Versorgungsunternehmen. Entsprechend ändert das Hinzufügen einer Konstante zu den Dienstprogrammen aller Alternativen die Auswahlwahrscheinlichkeiten nicht.

Die Skala muss normalisiert werden

Da das Dienstprogramm keine Einheiten hat, muss der Umfang der Dienstprogramme normalisiert werden. Der Nutzen wird häufig durch die Varianz des Fehlerterms in diskreten Auswahlmodellen definiert. Diese Abweichung kann je nach den Merkmalen des Datensatzes unterschiedlich sein, z. B. wann oder wo die Daten erfasst werden. Die Normalisierung der Varianz beeinflusst daher die Interpretation von Parametern, die über verschiedene Datensätze geschätzt werden.

Prominente Arten von Modellen mit diskreter Auswahl

Diskrete Auswahlmodelle können zunächst nach der Anzahl der verfügbaren Alternativen klassifiziert werden.

* Binomial Choice-Modelle (dichotom): 2 verfügbare Alternativen
* Multinomial Choice-Modelle ( polytom ): 3 oder mehr verfügbare Alternativen

Multinomial Choice-Modelle können gemäß der Modellspezifikation weiter klassifiziert werden:

* Modelle wie das Standardprotokoll, bei denen keine Korrelation zwischen nicht beobachteten Faktoren und Alternativen angenommen wird
* Modelle, die eine Korrelation in nicht beobachteten Faktoren zwischen Alternativen ermöglichen

Darüber hinaus stehen spezifische Formen der Modelle zur Verfügung, um die Rangfolge von Alternativen (dh erste Wahl, zweite Wahl, dritte Wahl usw.) und Bewertungsdaten zu untersuchen.

Details zu jedem Modell finden Sie in den folgenden Abschnitten.

Binäre Wahl

A. Melden Sie sich mit Attributen der Person, aber ohne Attribute der Alternativen an

U n ist der Nutzen (oder Nettonutzen), den die Person n durch das Ergreifen einer Maßnahme erhält (im Gegensatz dazu, dass sie die Maßnahme nicht ergreift). Der Nutzen, den die Person durch das Ergreifen der Maßnahme erhält, hängt von den Merkmalen der Person ab, von denen einige vom Forscher beobachtet werden und andere nicht. Die Person ergreift die Aktion y n = 1 , wenn U n > 0 ist. Es wird angenommen, dass der nicht beobachtete Term ε n eine logistische Verteilung aufweist . Die Spezifikation ist kurz und bündig geschrieben als:

B. Probit mit Attributen der Person, aber ohne Attribute der Alternativen

Die Beschreibung des Modells ist dieselbe wie bei Modell A , außer dass die nicht beobachteten Begriffe standardmäßig normal anstatt logistisch verteilt werden .

wo ist kumulative Verteilungsfunktion des Standardnormal .

C. Melden Sie sich mit Variablen an, die je nach Alternative variieren

U ni ist der Versorger, den n aus der Wahl der Alternative i erhält . Der Nutzen jeder Alternative hängt von den Attributen der Alternativen ab, die möglicherweise mit den Attributen der Person interagieren. Es wird angenommen, dass die nicht beobachteten Begriffe eine Extremwertverteilung aufweisen.

Wir können diese Spezifikation auf das obige Modell A beziehen , das auch binär logit ist. Insbesondere kann P n 1 auch ausgedrückt werden als

Beachten Sie, dass wenn zwei Fehlerterme einen Extremwert haben , ihre Differenz logistisch verteilt ist , was die Grundlage für die Äquivalenz der beiden Spezifikationen ist.

D. Probit mit Variablen, die über Alternativen variieren

Die Beschreibung des Modells ist dieselbe wie bei Modell C , außer dass der Unterschied zwischen den beiden nicht beobachteten Begriffen standardmäßig normal statt logistisch verteilt ist .

Dann ist die Wahrscheinlichkeit, die Aktion zu ergreifen,

Dabei ist Φ die kumulative Verteilungsfunktion der Standardnormalen .

Multinomiale Wahl ohne Korrelation zwischen Alternativen

E. Logit mit Attributen der Person, aber ohne Attribute der Alternativen

Der Nutzen für alle Alternativen hängt von denselben Variablen ab, s n , aber die Koeffizienten sind für verschiedene Alternativen unterschiedlich:

  • U ni = β i s n + ε ni ,
  • Da nur Unterschiede in der Nützlichkeit von Bedeutung sind, muss für eine Alternative normalisiert werden . Vorausgesetzt ,
  • ε ni sind iid Extremwerte

Die Auswahlwahrscheinlichkeit hat die Form

Dabei ist J die Gesamtzahl der Alternativen.

F. Logit mit Variablen, die je nach Alternative variieren (auch als bedingte Logit bezeichnet)

Der Nutzen für jede Alternative hängt von den Attributen dieser Alternative ab, die möglicherweise mit den Attributen der Person interagieren:

Dabei ist J die Gesamtzahl der Alternativen.

Es ist zu beachten, dass Modell E durch geeignete Neuspezifikation von Variablen in derselben Form wie Modell F ausgedrückt werden kann. Definieren Sie, wo sich das Kronecker-Delta befindet und s n vom Modell E stammen . Dann wird Modell F unter Verwendung von erhalten

Dabei ist J die Gesamtzahl der Alternativen.

Multinomiale Wahl mit Korrelation zwischen Alternativen

Ein Standard-Logit-Modell ist nicht immer geeignet, da davon ausgegangen wird, dass keine Korrelation zwischen nicht beobachteten Faktoren und Alternativen besteht. Dieser Mangel an Korrelation führt zu einem bestimmten Substitutionsmuster zwischen Alternativen, die in einer bestimmten Situation möglicherweise nicht immer realistisch sind. Dieses Substitutionsmuster wird häufig als IIA-Eigenschaft (Independence of Irrelevant Alternatives) von Standard-Logit-Modellen bezeichnet. Siehe das Beispiel für den roten / blauen Bus, in dem dieses Muster nicht gilt, oder das Beispiel für die Pfadauswahl. Eine Reihe von Modellen wurde vorgeschlagen, um eine Korrelation über Alternativen und allgemeinere Substitutionsmuster zu ermöglichen:

  • Verschachteltes Logit-Modell - Erfasst Korrelationen zwischen Alternativen, indem die Auswahl in "Nester" unterteilt wird.
    • Cross-Nested Logit-Modell (CNL) - Alternativen können zu mehr als einem Nest gehören
    • C-Logit-Modell - Erfasst Korrelationen zwischen Alternativen mithilfe des Gemeinsamkeitsfaktors.
    • Gepaartes kombinatorisches Logit-Modell - Geeignet für Probleme bei der Routenwahl.
  • Verallgemeinertes Extremwertmodell - Allgemeine Modellklasse, abgeleitet aus dem Zufallsnutzungsmodell, zu dem multinomiales Logit und verschachteltes Logit gehören
  • Bedingter Probit - Ermöglicht die vollständige Kovarianz zwischen Alternativen unter Verwendung einer gemeinsamen Normalverteilung.
  • Mixed Logit - Ermöglicht jede Form von Korrelations- und Substitutionsmustern. Wenn ein gemischtes Logit mit gemeinsam normalen zufälligen Begriffen vorliegt, werden die Modelle manchmal als "multinomiales Probit-Modell mit Logit-Kernel" bezeichnet. Kann auf die Routenwahl angewendet werden.

In den folgenden Abschnitten werden Nested Logit-, GEV-, Probit- und Mixed Logit-Modelle ausführlich beschrieben.

G. Verschachtelte Logit- und GEV-Modelle (Generalized Extreme Value)

Das Modell ist das gleiche wie Modell F, außer dass die nicht beobachtete Komponente des Nutzens über Alternativen korreliert und nicht über Alternativen unabhängig ist.

  • U ni = βz ni + ε ni ,
  • Die Randverteilung jedes ε ni ist ein Extremwert , aber ihre gemeinsame Verteilung ermöglicht eine Korrelation zwischen ihnen.
  • Die Wahrscheinlichkeit nimmt abhängig vom angegebenen Korrelationsmuster viele Formen an. Siehe Generalisierter Extremwert .

H. Multinomiales Probit

Das Modell ist das gleiche wie Modell G, außer dass die nicht beobachteten Terme gemeinsam normal verteilt sind , was jedes Muster von Korrelation und Heteroskedastizität zulässt :

wo ist die gemeinsame Normaldichte mit Mittelwert Null und Kovarianz .

Das Integral für diese Auswahlwahrscheinlichkeit hat keine geschlossene Form, daher wird die Wahrscheinlichkeit durch Quadratur oder Simulation angenähert .

Wann ist die Identitätsmatrix (so dass es keine Korrelation oder Heteroskedastizität gibt ), wird das Modell als unabhängiger Probit bezeichnet.

I. Gemischter Logit

Mixed-Logit-Modelle sind in den letzten Jahren aus mehreren Gründen immer beliebter geworden. Erstens erlaubt das Modell , zusätzlich zu zufällig zu sein . Die Zufälligkeit berücksichtigt zufällige Geschmacksschwankungen zwischen Menschen und Korrelationen zwischen Alternativen, die flexible Substitutionsmuster erzeugen. Zweitens haben Fortschritte in der Simulation die Annäherung an das Modell ziemlich einfach gemacht. Darüber hinaus haben McFadden und Train gezeigt, dass jedes True-Choice-Modell durch ein gemischtes Logit mit entsprechender Spezifikation der erklärenden Variablen und Verteilung der Koeffizienten auf jeden Grad der Genauigkeit angenähert werden kann.

  • U ni = βz ni + ε ni ,
  • für jede Verteilung , wo die Menge des Verteilungsparameters (zB Mittelwert und Varianz) zu schätz
  • ε ni iid Extremwert ,

Die Wahlwahrscheinlichkeit ist

wo

wird die Logit-Wahrscheinlichkeit mit der Gesamtzahl der Alternativen bewertet .

Das Integral für diese Auswahlwahrscheinlichkeit hat keine geschlossene Form, daher wird die Wahrscheinlichkeit durch Simulation angenähert.

Schätzung aus Entscheidungen

Diskrete Auswahlmodelle werden häufig unter Verwendung der Maximum-Likelihood-Schätzung geschätzt . Logit-Modelle können durch logistische Regression geschätzt werden , und Probit-Modelle können durch Probit-Regression geschätzt werden . Es wurden nichtparametrische Methoden wie der Maximum-Score-Schätzer vorgeschlagen. Die Schätzung solcher Modelle erfolgt normalerweise über parametrische, semiparametrische und nichtparametrische Maximum-Likelihood-Methoden, kann jedoch auch mit dem Pfadmodellierungsansatz für kleinste Quadrate durchgeführt werden .

Schätzung aus Rankings

In vielen Situationen wird die Rangfolge der Alternativen einer Person beobachtet und nicht nur die von ihnen gewählte Alternative. Beispielsweise könnte eine Person, die ein neues Auto gekauft hat, gefragt werden, was sie gekauft hätte, wenn dieses Auto nicht angeboten worden wäre. Dies gibt Informationen über die zweite Wahl der Person zusätzlich zu ihrer ersten Wahl. In einer Umfrage könnte ein Befragter gefragt werden:

Beispiel : Ordnen Sie die folgenden Handy-Anrufpläne von Ihren am meisten bevorzugten zu Ihren am wenigsten bevorzugten.
* 60 USD pro Monat für unbegrenzte Minuten, Zweijahresvertrag mit 100 USD Gebühr für vorzeitige Kündigung
* 30 USD pro Monat für 400 Minuten zu jeder Zeit, 3 Cent pro Minute nach 400 Minuten, Einjahresvertrag mit einer Gebühr von 125 USD für die vorzeitige Kündigung
* 35 USD pro Monat für 500 Minuten zu jeder Zeit, 3 Cent pro Minute nach 500 Minuten, keine Vertrags- oder vorzeitige Kündigungsgebühr
* 50 USD pro Monat für 1000 Minuten zu jeder Zeit, 5 Cent pro Minute nach 1000 Minuten, Zweijahresvertrag mit einer Gebühr von 75 USD für die vorzeitige Kündigung

Die oben beschriebenen Modelle können angepasst werden, um Rangfolgen zu berücksichtigen, die über die erste Wahl hinausgehen. Das bekannteste Modell für Ranking-Daten ist das explodierte Logit und seine gemischte Version.

J. Explodiertes Logit

Unter den gleichen Annahmen wie bei einem Standardprotokoll ( Modell F ) ist die Wahrscheinlichkeit für eine Rangfolge der Alternativen ein Produkt von Standardprotokollen. Das Modell wird als "explodiertes Logit" bezeichnet, da die Auswahlsituation, die normalerweise als eine Logit-Formel für die ausgewählte Alternative dargestellt wird, erweitert wird ("explodiert"), um für jede eingestufte Alternative eine separate Logit-Formel zu erhalten. Das explodierte Logit-Modell ist das Produkt von Standard-Logit-Modellen, wobei die Auswahlmenge abnimmt, wenn jede Alternative eingestuft wird, und die Menge der verfügbaren Auswahlmöglichkeiten in der nachfolgenden Auswahl belässt.

Ohne Verlust der Allgemeinheit können die Alternativen neu gekennzeichnet werden, um die Rangfolge der Person darzustellen, so dass Alternative 1 die erste Wahl, 2 die zweite Wahl usw. ist. Die Wahlwahrscheinlichkeit, J Alternativen als 1, 2, ..., J einzustufen, ist dann

Wie bei der Standardprotokollierung geht das Explosionsprotokollmodell von keiner Korrelation zwischen nicht beobachteten Faktoren und Alternativen aus. Das explodierte Logit kann auf die gleiche Weise verallgemeinert werden wie das Standardlogit, um Korrelationen zwischen Alternativen und zufälligen Geschmacksvariationen zu berücksichtigen. Das "gemischte explodierte Logit" -Modell wird durch die Wahrscheinlichkeit der oben angegebenen Rangfolge für L ni im gemischten Logit-Modell ( Modell I ) erhalten.

Dieses Modell ist in der Ökonometrie auch als Rangordnungs-Logit-Modell bekannt und wurde 1981 von Beggs, Cardell und Hausman in diesem Bereich eingeführt . Eine Anwendung ist das von Combes et al. Papier, das die Rangfolge der Kandidaten erklärt, um Professor zu werden. In der biomedizinischen Literatur ist es auch als Plackett-Luce-Modell bekannt .

Bestellte Modelle

In Umfragen werden die Befragten häufig gebeten, Bewertungen abzugeben, z.

Beispiel : Bitte geben Sie an, wie gut es dem Präsidenten geht.
1: Sehr schlecht
2: Schlecht
3: Okay
4: Nun
5: Sehr gut

Oder,

Beispiel : Auf einer Skala von 1 bis 5, auf der 1 bedeutet, dass Sie überhaupt nicht zustimmen und 5 bedeutet, dass Sie vollständig zustimmen, wie sehr stimmen Sie der folgenden Aussage zu? "Die Bundesregierung sollte mehr tun, um Menschen zu helfen, die vor einer Zwangsvollstreckung ihrer Häuser stehen."

Ein multinomiales Modell mit diskreter Auswahl kann die Antworten auf diese Fragen untersuchen ( Modell G , Modell H , Modell I ). Diese Modelle werden jedoch unter dem Konzept abgeleitet, dass der Befragte für jede mögliche Antwort einen Nutzen erhält und die Antwort gibt, die den größten Nutzen bietet. Es könnte natürlicher sein zu glauben, dass der Befragte ein latentes Maß oder einen latenten Index mit der Frage und den Antworten verknüpft hat, um zu beantworten, wie hoch dieses Maß ist. Nach diesem Konzept werden geordnete Logit- und geordnete Probit-Modelle abgeleitet.

K. Bestellte Logit

Lassen U n die Stärke der Umfrageteilnehmer repräsentieren n ‚s Gefühle oder Meinungen über die Umfrage Thema. Angenommen, es gibt Grenzwerte für die Ebene der Meinung bei der Auswahl einer bestimmten Antwort. Zum Beispiel wählt die Person im Beispiel der Hilfe für Menschen, die vor einer Zwangsvollstreckung stehen

  • 1, wenn U n <a
  • 2, wenn a < U n <b
  • 3, wenn b < U n <c
  • 4, wenn c < U n <d
  • 5, wenn U n > d,

für einige reelle Zahlen a , b , c , d .

Wenn Sie Logistik definieren , ist die Wahrscheinlichkeit jeder möglichen Antwort:

Die Parameter des Modells sind die Koeffizienten β und die Grenzpunkte a - d , von denen einer zur Identifizierung normalisiert werden muss. Wenn es nur zwei mögliche Antworten gibt, ist das geordnete Logit dasselbe wie ein binäres Logit ( Modell A ), wobei ein Grenzwert auf Null normiert ist.

L. Bestellter Probit

Die Beschreibung des Modells ist dieselbe wie bei Modell K , außer dass die nicht beobachteten Begriffe eine normale Verteilung anstelle einer logistischen haben .

Die Auswahlwahrscheinlichkeiten sind ( ist die kumulative Verteilungsfunktion der Standardnormalverteilung):

Siehe auch

Anmerkungen

Verweise

Weiterführende Literatur

  • Anderson, S., A. de Palma und J.-F. Thisse (1992), Discrete Choice Theory of Product Differentiation , MIT Press,
  • Ben-Akiva, M.; Lerman, S. (1985). Discrete Choice Analysis: Theorie und Anwendung auf die Reiseanforderung . MIT Press.
  • Greene, William H. (2012). Ökonometrische Analyse (7. Aufl.). Upper Saddle River: Pearson Prentice-Hall. pp.  770 -862. ISBN   978-0-13-600383-0 .
  • Hensher, D.; Rose, J.; Greene, W. (2005). Angewandte Auswahlanalyse: Eine Grundierung . Cambridge University Press.
  • Maddala, G. (1983). Begrenzte abhängige und qualitative Variablen in der Ökonometrie . Cambridge University Press.
  • McFadden, Daniel L. (1984). Ökonometrische Analyse qualitativer Antwortmodelle . Handbuch der Ökonometrie, Band II. Kapitel 24. Elsevier Science Publishers BV.
  • Train, K. (2009) [2003]. Diskrete Auswahlmethoden mit Simulation . Cambridge University Press.