Mehrzieloptimierung - Multi-objective optimization

Mehrzieloptimierung (auch bekannt als Mehrzielprogrammierung , Vektor - Optimierung , Multikriterienoptimierung , multiattributiven Optimierung oder Pareto - Optimierung ) ist ein Bereich von mehreren Kriterien Entscheidungsfindung , die mit betreffen mathematische Optimierungsprobleme mit mehr als eine Zielfunktion gleichzeitig zu optimier . Die Mehrzieloptimierung wurde in vielen Wissenschaftsbereichen angewendet, einschließlich Ingenieurwesen, Wirtschaft und Logistik, wo optimale Entscheidungen getroffen werden müssen, wenn Kompromisse zwischen zwei oder mehr widersprüchlichen Zielen bestehen. Die Kostenminimierung bei gleichzeitiger Komfortmaximierung beim Autokauf und die Leistungsmaximierung bei gleichzeitiger Minimierung des Kraftstoffverbrauchs und der Schadstoffemissionen eines Fahrzeugs sind Beispiele für Mehrzieloptimierungsprobleme mit zwei bzw. drei Zielen. Bei praktischen Problemen kann es mehr als drei Ziele geben.

Für ein nichttriviales Mehrzieloptimierungsproblem existiert keine einzelne Lösung, die jedes Ziel gleichzeitig optimiert. In diesem Fall werden die Zielfunktionen als widersprüchlich bezeichnet. Eine Lösung heißt nicht dominiert , Pareto optimal, Pareto effizient oder nicht inferior, wenn keine der Zielfunktionen im Wert verbessert werden kann, ohne einige der anderen Zielwerte zu verschlechtern. Ohne zusätzliche subjektive Präferenzinformationen kann es eine (möglicherweise unendliche) Anzahl von Pareto-optimalen Lösungen geben, die alle als gleich gut angesehen werden. Forscher untersuchen multiobjektive Optimierungsprobleme aus verschiedenen Blickwinkeln und es gibt daher unterschiedliche Lösungsphilosophien und -ziele bei deren Festlegung und Lösung. Das Ziel kann sein, einen repräsentativen Satz von Pareto-optimalen Lösungen zu finden und/oder die Kompromisse bei der Erfüllung der verschiedenen Ziele zu quantifizieren und/oder eine einzelne Lösung zu finden, die die subjektiven Präferenzen eines menschlichen Entscheidungsträgers (DM) erfüllt.

Bikriterielle Optimierung bezeichnet den Spezialfall, bei dem es zwei Zielfunktionen gibt.

Einführung

Ein Mehrzieloptimierungsproblem ist ein Optimierungsproblem , das mehrere Zielfunktionen umfasst. Mathematisch lässt sich ein Mehrzieloptimierungsproblem formulieren als

wobei die ganze Zahl die Anzahl der Ziele ist und die Menge die zulässige Menge von Entscheidungsvektoren ist, was typischerweise der Fall ist, aber von der -dimensionalen Anwendungsdomäne abhängt . Die zulässige Menge wird typischerweise durch einige Beschränkungsfunktionen definiert. Darüber hinaus wird die vektorwertige Zielfunktion oft definiert als

. Wenn eine Zielfunktion maximiert werden soll, ist es äquivalent, ihr Negativ zu minimieren. Das Bild von wird bezeichnet mit
Beispiel für eine Pareto-Grenze (in Rot), die Menge der Pareto-optimalen Lösungen (die nicht von anderen zulässigen Lösungen dominiert werden). Die eingerahmten Punkte stellen mögliche Auswahlmöglichkeiten dar, und kleinere Werte werden größeren vorgezogen. Punkt C liegt nicht an der Pareto-Grenze, da er sowohl von Punkt A als auch von Punkt B dominiert wird . Die Punkte A und B werden von keinem anderen strikt dominiert und liegen daher an der Grenze.

Ein Element heißt zulässige Lösung oder zulässige Entscheidung . Ein Vektor für eine zulässige Lösung heißt objektiver Vektor oder Ergebnis . Bei der Mehrzieloptimierung existiert typischerweise keine zulässige Lösung, die alle Zielfunktionen gleichzeitig minimiert. Daher wird auf optimale Pareto- Lösungen geachtet ; dh Lösungen, die in keinem der Ziele verbessert werden können, ohne mindestens eines der anderen Ziele zu verschlechtern. Mathematisch sagt man , dass eine zulässige Lösung (Pareto) eine andere Lösung dominiert , wenn

  1. , für alle Indizes , und
  2. , für mindestens einen Index .

Eine Lösung (und das dazugehörige Ergebnis ) heißt Pareto optimal, wenn es keine andere Lösung gibt, die sie dominiert. Die Menge der optimalen Pareto-Ergebnisse wird oft als Pareto-Front , Pareto-Grenze oder Pareto-Grenze bezeichnet.

Die Pareto-Front eines multiobjektiven Optimierungsproblems wird durch einen sogenannten Nadir-Objektivvektor und einen idealen Objektivvektor begrenzt , wenn diese endlich sind. Der Nadir-Zielvektor ist definiert als

und der ideale Zielvektor als

Mit anderen Worten, die Komponenten eines Nadirs und eines idealen Zielvektors definieren jeweils obere und untere Schranken für die Zielfunktionswerte von Pareto-optimalen Lösungen. In der Praxis kann der Nadir-Objektivvektor nur angenähert werden, da typischerweise der gesamte Pareto-Optimum-Satz unbekannt ist. Außerdem ist ein utopischer Zielvektor mit

wobei eine kleine Konstante ist, wird oft aus numerischen Gründen definiert.

Anwendungsbeispiele

Wirtschaft

In der Ökonomie beinhalten viele Probleme mehrere Ziele zusammen mit Einschränkungen, welche Kombinationen dieser Ziele erreichbar sind. Zum Beispiel wird die Nachfrage der Verbraucher nach verschiedenen Gütern durch den Prozess der Maximierung des Nutzens bestimmt, der sich aus diesen Gütern ergibt, vorbehaltlich einer Beschränkung, die darauf basiert, wie viel Einkommen für diese Güter und den Preisen dieser Güter zur Verfügung steht. Diese Beschränkung erlaubt es, mehr von einem Gut zu kaufen, nur auf Kosten des geringeren Verbrauchs eines anderen Gutes; Daher stehen die verschiedenen Ziele (mehr Konsum jedes Gutes wird bevorzugt) in Konflikt miteinander. Ein übliches Verfahren zum Analysieren eines solchen Problems besteht darin, einen Graphen von Indifferenzkurven zu verwenden , die Präferenzen darstellen, und eine Budgetbeschränkung, die die Kompromisse darstellt, mit denen der Verbraucher konfrontiert ist.

Ein weiteres Beispiel betrifft die Produktionsmöglichkeitengrenze , die angibt, welche Kombinationen verschiedener Arten von Gütern von einer Gesellschaft mit bestimmten Mengen an verschiedenen Ressourcen hergestellt werden können. Die Grenze spezifiziert die Kompromisse, mit denen die Gesellschaft konfrontiert ist – wenn die Gesellschaft ihre Ressourcen voll ausnutzt, kann mehr von einem Gut nur auf Kosten einer geringeren Produktion eines anderen Gutes produziert werden. Eine Gesellschaft muss dann einen Prozess anwenden, um zwischen den Möglichkeiten an der Grenze zu wählen.

Die makroökonomische Politikgestaltung ist ein Kontext, der eine Optimierung mit mehreren Zielen erfordert. Typischerweise muss eine Zentralbank eine Haltung für die Geldpolitik wählen , die konkurrierende Ziele ausbalanciert – niedrige Inflation , niedrige Arbeitslosigkeit , niedriges Handelsbilanzdefizit usw. Dazu verwendet die Zentralbank ein Wirtschaftsmodell , das die verschiedenen kausalen Zusammenhänge quantitativ beschreibt in der Wirtschaft; es simuliert das Modell wiederholt unter verschiedenen möglichen geldpolitischen Haltungen, um eine Auswahl möglicher prognostizierter Ergebnisse für die verschiedenen interessierenden Variablen zu erhalten. Dann kann sie im Prinzip eine aggregierte Zielfunktion verwenden, um die alternativen Sätze vorhergesagter Ergebnisse zu bewerten, obwohl die Zentralbanken in der Praxis einen nicht quantitativen, urteilsbasierten Prozess verwenden, um die Alternativen einzustufen und die politische Entscheidung zu treffen.

Finanzen

Im Finanzbereich besteht ein häufiges Problem darin, ein Portfolio auszuwählen, wenn zwei gegensätzliche Ziele bestehen – der Wunsch nach einem möglichst hohen erwarteten Wert der Portfoliorenditen und der Wunsch nach einem Risiko , das oft an der Standardabweichung der Portfoliorenditen gemessen wird , so niedrig wie möglich sein. Dieses Problem wird oft durch eine Grafik dargestellt, in der die Effizienzgrenze die besten verfügbaren Kombinationen aus Risiko und erwarteter Rendite zeigt und in der Indifferenzkurven die Präferenzen des Anlegers für verschiedene Kombinationen aus Risiko und erwarteter Rendite zeigen. Das Problem der Optimierung einer Funktion des Erwartungswerts (erster Moment ) und der Standardabweichung (Quadratwurzel des zweiten zentralen Moments) der Portfoliorendite wird als Zwei-Momenten-Entscheidungsmodell bezeichnet .

Optimale Kontrolle

In den Ingenieurwissenschaften und den Wirtschaftswissenschaften beinhalten viele Probleme mehrere Ziele, die nicht als je mehr desto besser oder je weniger desto besser beschrieben werden können; Stattdessen gibt es für jedes Ziel einen idealen Zielwert, und der Wunsch ist es, dem gewünschten Wert jedes Ziels so nahe wie möglich zu kommen. Beispielsweise müssen Energiesysteme typischerweise einen Kompromiss zwischen Leistung und Kosten eingehen, oder man möchte den Treibstoffverbrauch und die Ausrichtung einer Rakete so anpassen, dass sie sowohl an einem bestimmten Ort als auch zu einer bestimmten Zeit ankommt; oder man möchte Offenmarktgeschäfte durchführen, damit sowohl die Inflationsrate als auch die Arbeitslosenquote ihren gewünschten Werten möglichst nahe kommen.

Häufig unterliegen solche Probleme linearen Gleichheitsbeschränkungen, die verhindern, dass alle Ziele gleichzeitig perfekt erreicht werden, insbesondere wenn die Anzahl der kontrollierbaren Variablen geringer ist als die Anzahl der Ziele und wenn zufällige Schocks Unsicherheit erzeugen. Üblicherweise wird eine multiobjektive quadratische Objektivfunktion verwendet, wobei die mit einem Objektiv verbundenen Kosten quadratisch mit der Entfernung des Objektivs von seinem Idealwert steigen. Da es sich bei diesen Problemen typischerweise um die Anpassung der gesteuerten Variablen zu verschiedenen Zeitpunkten und/oder die Bewertung der Ziele zu verschiedenen Zeitpunkten handelt, werden intertemporale Optimierungstechniken verwendet.

Optimales Design

Durch moderne Modellierungs-, Simulations- und Optimierungstechniken kann die Produkt- und Prozessgestaltung weitgehend verbessert werden. Die Schlüsselfrage beim optimalen Design ist das Maß dafür, was an einem Design gut oder wünschenswert ist. Bevor Sie nach optimalen Designs suchen, ist es wichtig, die Merkmale zu identifizieren, die am meisten zum Gesamtwert des Designs beitragen. Ein gutes Design beinhaltet in der Regel mehrere Kriterien/Ziele wie Kapitalkosten/Investitionen, Betriebskosten, Gewinn, Qualität und/oder Rückgewinnung des Produkts, Effizienz, Prozesssicherheit, Betriebszeit usw. Daher ist in praktischen Anwendungen die Leistung von Prozessen und Produktdesign wird oft an mehreren Zielen gemessen. Diese Ziele sind typischerweise widersprüchlich, dh das Erreichen des optimalen Wertes für ein Ziel erfordert einen gewissen Kompromiss bei einem oder mehreren anderen Zielen.

Wenn man beispielsweise eine Papierfabrik entwirft, kann man versuchen, das in eine Papierfabrik investierte Kapital zu verringern und gleichzeitig die Papierqualität zu verbessern. Wenn das Design einer Papierfabrik durch große Lagervolumina und die Papierqualität durch Qualitätsparameter definiert wird, dann kann das Problem des optimalen Designs einer Papierfabrik Ziele beinhalten wie: i) Minimierung der erwarteten Abweichung dieser Qualitätsparameter von ihren Nennwerte, ii) Minimierung der erwarteten Pausenzeiten und iii) Minimierung der Investitionskosten von Speichervolumen. Hier sind das maximale Volumen der Türme Designvariablen. Dieses Beispiel für die optimale Auslegung einer Papierfabrik ist eine Vereinfachung des Modells, das in verwendet wird. Mehrzielige Designoptimierungen wurden auch in Engineering-Systemen unter Umständen implementiert, z. CMOS- Halbleiter, System-on-Chip- Design, Design von solarbetriebenen Bewässerungssystemen, Optimierung von Sandformsystemen, Motordesign, optimaler Sensoreinsatz und optimales Controller-Design.

Prozessoptimierung

Die Mehrzieloptimierung wird zunehmend in der Chemietechnik und in der Fertigung eingesetzt . 2009 verwendeten Fiandaca und Fraga den multi-objektiven genetischen Algorithmus (MOGA), um den Druckwechseladsorptionsprozess (zyklisches Trennverfahren) zu optimieren. Das Konstruktionsproblem beinhaltete die doppelte Maximierung der Stickstoffrückgewinnung und der Stickstoffreinheit. Die Ergebnisse lieferten eine gute Annäherung an die Pareto-Grenze mit akzeptablen Kompromissen zwischen den Zielen.

Im Jahr 2010 haben Sendín et al. ein Mehrzielproblem bei der thermischen Verarbeitung von Lebensmitteln gelöst. Sie bearbeiteten zwei Fallstudien (bi- und dreifach-objektive Probleme) mit nichtlinearen dynamischen Modellen und verwendeten einen hybriden Ansatz, bestehend aus dem gewichteten Tchebycheff- und dem Normal Boundary Intersection-Ansatz. Durch den neuartigen Hybridansatz konnte ein Pareto-optimales Set für die thermische Verarbeitung von Lebensmitteln konstruiert werden.

2013 haben Ganesan et al. führte die Mehrzieloptimierung der kombinierten Kohlendioxidreformierung und partiellen Oxidation von Methan durch. Die Zielfunktionen waren Methanumwandlung, Kohlenmonoxidselektivität und das Verhältnis von Wasserstoff zu Kohlenmonoxid. Ganesan verwendete die Normal Boundary Intersection (NBI)-Methode in Verbindung mit zwei schwarmbasierten Techniken (Gravitational Search Algorithm (GSA) und Particle Swarm Optimization (PSO)), um das Problem anzugehen. Anwendungen mit chemischen Extraktions- und Bioethanolproduktionsprozessen haben ähnliche Mehrzweckprobleme aufgeworfen.

Im Jahr 2013 schlugen Abakarov et al. eine alternative Technik vor, um multi-objektive Optimierungsprobleme zu lösen, die in der Lebensmitteltechnik auftreten. Der Aggregationsfunktionsansatz, der adaptive Zufallssuchalgorithmus und der Straffunktionsansatz wurden verwendet, um den Anfangssatz der nicht dominierten oder Pareto-optimalen Lösungen zu berechnen. Der analytische Hierarchieprozess und die tabellarische Methode wurden gleichzeitig verwendet, um die beste Alternative aus der berechneten Untermenge nicht dominierter Lösungen für osmotische Dehydratisierungsprozesse auszuwählen.

Im Jahr 2018 haben Pearce et al. formulierte die Aufgabenverteilung an menschliche und robotische Arbeiter als multizielorientiertes Optimierungsproblem, wobei die Produktionszeit und die ergonomischen Auswirkungen auf den menschlichen Arbeiter als die beiden in der Formulierung berücksichtigten Ziele berücksichtigt wurden. Ihr Ansatz verwendete ein gemischt-ganzzahliges lineares Programm , um das Optimierungsproblem für eine gewichtete Summe der beiden Ziele zu lösen, um einen Satz von Pareto-optimalen Lösungen zu berechnen . Die Anwendung des Ansatzes auf mehrere Fertigungsaufgaben zeigte bei den meisten Aufgaben Verbesserungen bei mindestens einem Ziel und bei einigen Prozessen bei beiden Zielen.

Verwaltung von Funkressourcen

Der Zweck der Funkressourcenverwaltung besteht darin, die Datenraten zu erfüllen, die von den Benutzern eines zellularen Netzwerks angefordert werden. Die Hauptressourcen sind Zeitintervalle, Frequenzblöcke und Sendeleistungen. Jeder Benutzer hat seine eigene Zielfunktion, die beispielsweise eine Kombination aus Datenrate, Latenz und Energieeffizienz darstellen kann. Diese Ziele stehen im Widerspruch, da die Frequenzressourcen sehr knapp sind, daher besteht ein Bedarf an einer engen Wiederverwendung der Raumfrequenz, die eine immense Inter-Benutzer-Interferenz verursacht, wenn sie nicht richtig gesteuert wird. Heutzutage werden Mehrbenutzer-MIMO- Techniken verwendet, um die Interferenz durch adaptive Vorcodierung zu reduzieren . Der Netzbetreiber möchte sowohl eine große Abdeckung als auch hohe Datenraten mitbringen, daher möchte der Betreiber eine Pareto-optimale Lösung finden, die den gesamten Netzwerkdatendurchsatz und die Benutzergerechtigkeit in angemessener subjektiver Weise ausgleicht.

Die Verwaltung von Funkressourcen wird oft durch Skalarisierung gelöst; das heißt, Auswahl einer Netzwerkdienstprogrammfunktion, die versucht, Durchsatz und Benutzergerechtigkeit auszugleichen. Die Wahl der Nutzenfunktion hat einen großen Einfluss auf die Rechenkomplexität des resultierenden Einzelzieloptimierungsproblems. Zum Beispiel ergibt der gemeinsame Nutzen der gewichteten Summenrate ein NP-schweres Problem mit einer Komplexität, die exponentiell mit der Anzahl der Benutzer skaliert, während der gewichtete max-min-Fairness-Nutzen zu einem quasi-konvexen Optimierungsproblem mit nur einer polynomiellen Skalierung mit . führt die Anzahl der Benutzer.

Elektrische Energiesysteme

Die Rekonfiguration durch den Austausch der funktionalen Verbindungen zwischen den Elementen des Systems stellt eine der wichtigsten Maßnahmen dar, die die Betriebsleistung eines Verteilungssystems verbessern können. Das Problem der Optimierung durch die Neukonfiguration eines Stromverteilungssystems ist im Sinne seiner Definition ein historisches Einzelzielproblem mit Einschränkungen. Seit 1975, als Merlin und Back die Idee der Rekonfiguration von Verteilungssystemen zur Reduzierung der aktiven Verlustleistung einführten, bis heute haben viele Forscher verschiedene Methoden und Algorithmen vorgeschlagen, um das Rekonfigurationsproblem als ein einziges Zielproblem zu lösen. Einige Autoren haben Pareto-Optimalitäts-basierte Ansätze vorgeschlagen (einschließlich Wirkleistungsverluste und Zuverlässigkeitsindizes als Ziele). Zu diesem Zweck wurden verschiedene auf künstlicher Intelligenz basierende Methoden verwendet: Mikrogenetik, Zweigstellenaustausch, Partikelschwarmoptimierung und nicht-dominierte Sortierung von genetischen Algorithmen.

Inspektion der Infrastruktur

Die autonome Inspektion der Infrastruktur hat das Potenzial, Kosten, Risiken und Umweltauswirkungen zu reduzieren und eine bessere regelmäßige Wartung der inspizierten Anlagen zu gewährleisten. Typischerweise wurde die Planung solcher Missionen als ein Optimierungsproblem mit einem einzigen Ziel angesehen, bei dem man darauf abzielt, den Energie- oder Zeitaufwand für die Inspektion einer gesamten Zielstruktur zu minimieren. Bei komplexen, realen Strukturen ist es jedoch nicht möglich, ein Inspektionsziel zu 100 % abzudecken, und die Erstellung eines Inspektionsplans kann besser als ein Mehrzieloptimierungsproblem angesehen werden, bei dem sowohl die Inspektionsabdeckung maximiert als auch Zeit und Kosten minimiert werden sollen. Eine aktuelle Studie hat gezeigt, dass die multiobjektive Inspektionsplanung tatsächlich das Potenzial hat, herkömmliche Methoden bei komplexen Strukturen zu übertreffen

Lösung

Da es normalerweise mehrere Pareto-optimale Lösungen für Mehrzieloptimierungsprobleme gibt, ist die Lösung eines solchen Problems nicht so einfach wie bei einem herkömmlichen Einzieloptimierungsproblem. Daher haben verschiedene Forscher den Begriff „Lösung eines multi-objektiven Optimierungsproblems“ auf verschiedene Weise definiert. In diesem Abschnitt werden einige von ihnen und die Kontexte, in denen sie verwendet werden, zusammengefasst. Viele Methoden wandeln das ursprüngliche Problem mit mehreren Zielen in ein Optimierungsproblem mit einem einzigen Ziel um . Dies wird als skalarisiertes Problem bezeichnet. Wenn die Pareto-Optimalität der erhaltenen Einzelziellösungen garantiert werden kann, wird die Skalarisierung als sauber ausgeführt charakterisiert.

Das Lösen eines Mehrzieloptimierungsproblems wird manchmal als Annäherung oder Berechnung aller oder einer repräsentativen Menge von Pareto-optimalen Lösungen verstanden.

Wenn die Entscheidungsfindung betont wird, bezieht sich das Ziel der Lösung eines multiobjektiven Optimierungsproblems darauf, einen Entscheidungsträger dabei zu unterstützen, die am meisten bevorzugte Pareto-optimale Lösung gemäß seinen subjektiven Präferenzen zu finden. Die zugrunde liegende Annahme ist, dass eine Lösung für das Problem identifiziert werden muss, um in die Praxis umgesetzt zu werden. Hier spielt ein menschlicher Entscheidungsträger (DM) eine wichtige Rolle. Es wird erwartet, dass der DM ein Experte in der Problemdomäne ist.

Die am meisten bevorzugten Ergebnisse können unter Verwendung verschiedener Philosophien gefunden werden. Multiziel-Optimierungsmethoden lassen sich in vier Klassen einteilen.

  1. Bei sogenannten Nicht-Präferenz-Methoden wird erwartet, dass kein DM verfügbar ist, sondern eine neutrale Kompromisslösung ohne Präferenzinformationen identifiziert wird. Bei den anderen Klassen handelt es sich um sogenannte a priori, a posteriori und interaktive Methoden, die alle auf unterschiedliche Weise Präferenzinformationen aus dem DM einbeziehen.
  2. Bei a-priori-Verfahren werden zuerst Präferenzinformationen vom DM abgefragt und dann wird eine Lösung gefunden, die diese Präferenzen am besten erfüllt.
  3. Bei a posteriori-Methoden wird zuerst ein repräsentativer Satz von Pareto-Optimalen Lösungen gefunden und dann muss der DM eine davon auswählen.
  4. Bei interaktiven Verfahren kann der Entscheidungsträger iterativ nach der am meisten bevorzugten Lösung suchen. In jeder Iteration des interaktiven Verfahrens wird dem DM Pareto-optimale Lösung(en) gezeigt und beschrieben, wie die Lösung(en) verbessert werden könnten. Die vom Entscheidungsträger gegebenen Informationen werden dann bei der Generierung neuer Pareto-optimaler Lösung(en) für den DM zur Untersuchung in der nächsten Iteration berücksichtigt. Auf diese Weise lernt der DM die Umsetzbarkeit seiner Wünsche kennen und kann sich auf für ihn interessante Lösungen konzentrieren. Der DM kann die Suche jederzeit beenden.

Weitere Informationen und Beispiele für verschiedene Methoden in den vier Klassen finden Sie in den folgenden Abschnitten.

Keine Präferenzmethoden

Wenn ein Entscheidungsträger keine Präferenzinformationen explizit artikuliert, kann das Verfahren zur Optimierung mit mehreren Zielen als Verfahren ohne Präferenz klassifiziert werden. Ein bekanntes Beispiel ist die Methode des globalen Kriteriums, bei der ein skalarisiertes Problem der Form

ist gelöst. In dem obigen Problem kann jede Norm sein , mit allgemeinen Auswahlmöglichkeiten einschließlich , und . Die Methode des globalen Kriteriums reagiert empfindlich auf die Skalierung der Zielfunktionen, und daher wird empfohlen, die Ziele in eine einheitliche, dimensionslose Skala zu normieren.

A-priori-Methoden

A-priori-Verfahren erfordern, dass vor dem Lösungsprozess ausreichende Präferenzinformationen ausgedrückt werden. Bekannte Beispiele für a-priori-Verfahren sind die Nutzenfunktionsmethode , die lexikographische Methode und die Zielprogrammierung .

Bei der Nutzenfunktionsmethode wird davon ausgegangen, dass die Nutzenfunktion des Entscheiders verfügbar ist. Eine Zuordnung ist eine Utility - Funktion , wenn für alle , wenn es gilt , wenn der Entscheider lieber zu , und wenn der Entscheider ist indifferent zwischen und . Die Nutzenfunktion spezifiziert eine Ordnung der Entscheidungsvektoren (denken Sie daran, dass Vektoren auf viele verschiedene Arten geordnet werden können). Einmal erhalten, genügt es zu lösen

In der Praxis ist es jedoch sehr schwierig, eine Nutzenfunktion zu konstruieren, die die Präferenzen des Entscheidungsträgers genau wiedergibt – insbesondere, da die Pareto-Front vor Beginn der Optimierung unbekannt ist.

Die lexikographische Methode geht davon aus, dass die Ziele nach Wichtigkeit geordnet werden können. Wir können ohne Einschränkung der Allgemeinheit davon ausgehen, dass die Zielfunktionen in der Reihenfolge ihrer Wichtigkeit liegen, die für den Entscheidungsträger am wichtigsten und am wenigsten wichtig ist. Die lexikographische Methode besteht in der Lösung einer Folge von Einzelzieloptimierungsproblemen der Form

wo ist der optimale Wert des obigen Problems mit . Somit fügt jedes neue Problem der Form des obigen Problems in der Folge eine neue Einschränkung von bis hinzu . Beachten Sie, dass ein Ziel oder Zielwert ist hier nicht für jedes Ziel festgelegt, die es unterscheidet sich von der Lexikographische macht Goal Programming Methode.

Skalarisieren

Das Skalarisieren eines Mehrzieloptimierungsproblems ist ein a-priori-Verfahren, was bedeutet, ein Einzieloptimierungsproblem so zu formulieren, dass optimale Lösungen des Einzieloptimierungsproblems Pareto-optimale Lösungen des Mehrzieloptimierungsproblems sind. Außerdem wird oft gefordert, dass mit einigen Parametern der Skalarisierung jede Pareto-optimale Lösung erreicht werden kann. Mit unterschiedlichen Parametern für die Skalarisierung werden unterschiedliche Pareto-optimale Lösungen hergestellt. Eine allgemeine Formulierung für eine Skalarisierung einer Mehrzieloptimierung ist somit

wobei ein Vektorparameter ist, ist die Menge eine vom Parameter abhängige Menge und eine Funktion.

Sehr bekannte Beispiele sind die sogenannten

  • lineare Skalarisierung
wobei die Gewichte der Ziele die Parameter der Skalarisierung sind und die
  • -Einschränkungsmethode (siehe z. B.)
wobei obere Schranken Parameter wie oben sind und das zu minimierende Ziel ist.

Etwas fortgeschrittenere Beispiele sind die:

  • leistungsskalarisierende Probleme von Wierzbicki . Ein Beispiel für die leistungsskalarisierenden Probleme kann formuliert werden als
wobei der Term Augmentationsterm genannt wird, eine kleine Konstante ist und und der Nadir- bzw. der utopische Vektor sind. Bei dem obigen Problem ist der Parameter der sogenannte Referenzpunkt, der vom Entscheidungsträger bevorzugte objektive Funktionswerte darstellt.
  • Multi-Ziel-Programmierung von Sen

wo ist individuelles Optima (absolut) für Maximierungs- und Minimierungsziele zu .

Beispielsweise wird die Portfoliooptimierung häufig im Sinne einer Mittelwert-Varianz-Analyse durchgeführt . In diesem Zusammenhang ist die effiziente Menge eine Teilmenge der Portfolios, die durch die mittlere Portfoliorendite parametrisiert ist, bei dem Problem der Auswahl von Portfolioanteilen, um die Renditevarianz des Portfolios bei einem gegebenen Wert von zu minimieren ; siehe Mutual Fonds Trennungssatz für weitere Einzelheiten. Alternativ kann die effiziente Menge durch die Wahl der Portfolioanteile so spezifiziert werden, dass die Funktion maximiert wird ; die Menge der effizienten Portfolios besteht aus den Lösungen, da b von null bis unendlich reicht.

A-posteriori-Methoden

A-posteriori-Methoden zielen darauf ab, alle Pareto-optimalen Lösungen oder eine repräsentative Teilmenge der Pareto-Optimalen Lösungen zu erzeugen. Die meisten A-posteriori-Methoden fallen in eine der folgenden beiden Klassen:

Bekannte Beispiele für auf mathematischer Programmierung basierende A-posteriori-Methoden sind die Normal Boundary Intersection (NBI), Modified Normal Boundary Intersection (NBIm), Normal Constraint (NC), Successive Pareto Optimization (SPO) und Directed Search Domain (DSD) Methoden, die das Mehrzieloptimierungsproblem durch Konstruktion mehrerer Skalarisierungen. Die Lösung jeder Skalarisierung ergibt eine Pareto-optimale Lösung, sei es lokal oder global. Die Skalarisierungen der NBI-, NBIm-, NC- und DSD-Methoden werden mit dem Ziel konstruiert, gleichmäßig verteilte Pareto-Punkte zu erhalten, die eine gute gleichmäßig verteilte Approximation der realen Menge von Pareto-Punkten ergeben.

Evolutionäre Algorithmen sind beliebte Ansätze zur Generierung von Pareto-optimalen Lösungen für ein Mehrzieloptimierungsproblem. Derzeit verwenden die meisten evolutionären Multi-Objective-Optimierungs-(EMO)-Algorithmen Pareto-basierte Ranking-Schemata. Evolutionäre Algorithmen wie der Non-dominierte Sorting Genetic Algorithm-II (NSGA-II) und Strength Pareto Evolutionary Algorithm 2 (SPEA-2) haben sich zu Standardansätzen entwickelt, obwohl einige Schemata, die auf Partikelschwarmoptimierung und simuliertem Annealing basieren, von Bedeutung sind. Der Hauptvorteil evolutionärer Algorithmen, wenn sie zur Lösung von Optimierungsproblemen mit mehreren Zielen angewendet werden, besteht darin, dass sie typischerweise Lösungssätze erzeugen, die die Berechnung einer Approximation der gesamten Pareto-Front ermöglichen. Der Hauptnachteil evolutionärer Algorithmen ist ihre geringere Geschwindigkeit und die Pareto-Optimalität der Lösungen kann nicht garantiert werden. Es ist nur bekannt, dass keine der generierten Lösungen die anderen dominiert.

Ein weiteres Paradigma für die Mehrzieloptimierung basierend auf Neuheit unter Verwendung evolutionärer Algorithmen wurde kürzlich verbessert. Dieses Paradigma sucht nach neuen Lösungen im objektiven Raum (dh Neuheitssuche im objektiven Raum) zusätzlich zur Suche nach nicht dominierten Lösungen. Die Suche nach Neuheiten ist wie Trittsteine, die die Suche zu bisher unerforschten Orten führen. Es ist besonders nützlich, um Verzerrungen und Plateaus zu überwinden und die Suche bei Optimierungsproblemen mit vielen Zielen zu leiten.

Im Folgenden sind allgemein bekannte a posteriori-Methoden aufgeführt:

  • ε-Einschränkungsmethode
  • Branch-and-Bound mit mehreren Zielen
  • Normale Grenzkreuzung (NBI)
  • Modifizierter normaler Boundary Intersection (NBIm) Normal Constraint (NC),
  • Sukzessive Pareto-Optimierung (SPO)
  • Domain für die gezielte Suche (DSD)
  • NSGA-II
  • PGEN (Pareto-Oberflächengenerierung für konvexe Multi-Objektiv-Instanzen)
  • IOSO (Indirekte Optimierung auf Basis der Selbstorganisation)
  • SMS-EMOA (S-metrischer Auswahl-Evolutionärer Mehrzielalgorithmus)
  • Approximation-Guided Evolution (erster Algorithmus zur direkten Umsetzung und Optimierung des formalen Konzepts der Approximation aus der theoretischen Informatik)
  • Reaktive Suchoptimierung (mit maschinellem Lernen zur Anpassung von Strategien und Zielen), implementiert in LIONsolver
  • Benson-Algorithmus für lineare Programme mit mehreren Zielen und für konvexe Programme mit mehreren Zielen
  • Multiziel-Partikelschwarmoptimierung
  • Subpopulationsalgorithmus basierend auf Neuheit

Interaktive Methoden

Bei interaktiven Methoden zur Optimierung mehrerer objektiver Probleme ist der Lösungsprozess iterativ und der Entscheidungsträger interagiert bei der Suche nach der am meisten bevorzugten Lösung kontinuierlich mit der Methode (siehe zB Miettinen 1999, Miettinen 2008). Mit anderen Worten, vom Entscheidungsträger wird erwartet, dass er bei jeder Iteration Präferenzen ausdrückt, um optimale Pareto-Lösungen zu erhalten , die für den Entscheidungsträger von Interesse sind, und um zu erfahren, welche Art von Lösungen erreichbar sind.

Die folgenden Schritte sind bei interaktiven Optimierungsmethoden üblich:

  1. initialisieren (zB ideale und angenäherte Nadir-Zielvektoren berechnen und dem Entscheider zeigen)
  2. einen Pareto-optimalen Ausgangspunkt generieren (indem Sie z. B. eine No-Preference-Methode oder eine vom Entscheidungsträger vorgegebene Lösung verwenden)
  3. Bitten Sie den Entscheidungsträger um Präferenzinformationen (z. B. Anspruchsniveaus oder Anzahl der zu generierenden neuen Lösungen)
  4. neue Pareto-Optimallösung(en) entsprechend den Präferenzen generieren und dem Entscheidungsträger diese und eventuell andere Informationen über das Problem zeigen
  5. Wenn mehrere Lösungen generiert wurden, bitten Sie den Entscheidungsträger, die bisher beste Lösung auszuwählen
  6. stoppen (wenn der Entscheidungsträger möchte; andernfalls gehen Sie zu Schritt 3).

Die obigen Aspirationsniveaus beziehen sich auf wünschenswerte Zielfunktionswerte, die einen Referenzpunkt bilden. Anstelle der mathematischen Konvergenz, die bei mathematischen Optimierungsverfahren häufig als Abbruchkriterium verwendet wird, wird bei interaktiven Verfahren häufig eine psychologische Konvergenz betont. Im Allgemeinen wird eine Methode beendet, wenn der Entscheidungsträger sicher ist, die am meisten bevorzugte verfügbare Lösung gefunden zu haben .

Arten von Präferenzinformationen

Es gibt verschiedene interaktive Methoden, die verschiedene Arten von Präferenzinformationen beinhalten. Drei dieser Typen können basierend auf identifiziert werden

  1. Informationen zum Tausch,
  2. Referenzpunkte und
  3. Klassifizierung objektiver Funktionen.

Andererseits ist eine vierte Art der Generierung einer kleinen Stichprobe von Lösungen enthalten: Ein Beispiel für ein interaktives Verfahren, das Kompromissinformationen verwendet, ist die Zionts-Wallenius-Methode , bei der dem Entscheidungsträger bei jeder Iteration mehrere objektive Kompromisse gezeigt werden. und (s) von ihm wird erwartet, dass er sagt, ob (s) er jeden Kompromiss mag, nicht mag oder gleichgültig ist. Bei referenzpunktbasierten Verfahren (siehe z. B.) wird vom Entscheidungsträger erwartet, dass er bei jeder Iteration einen Referenzpunkt bestehend aus Sollwerten für jedes Ziel vorgibt, und eine entsprechende Pareto-Optimallösung(en) wird dann berechnet und ihm/ihr zur Analyse angezeigt . Bei klassifikationsbasierten interaktiven Verfahren wird angenommen, dass der Entscheidungsträger Präferenzen in Form von Klassifikationszielen bei der aktuellen Pareto-optimalen Lösung in verschiedene Klassen gibt, die angeben, wie die Werte der Ziele geändert werden sollten, um eine bevorzugtere Lösung zu erhalten. Dann werden die gegebenen Klassifizierungsinformationen berücksichtigt, wenn neue (bevorzugtere) Pareto-optimale Lösungen berechnet werden. Bei der Satisficing Trade-Off-Methode (STOM) werden drei Klassen verwendet: Ziele, deren Werte 1) verbessert werden sollten, 2) gelockert werden können und 3) als solche akzeptabel sind. Bei der NIMBUS-Methode werden auch zwei zusätzliche Klassen verwendet: Ziele, deren Werte 4) bis zu einer bestimmten Grenze verbessert werden sollen und 5) bis zu einer bestimmten Grenze gelockert werden können.

Hybride Methoden

Es gibt verschiedene hybride Methoden, aber hier betrachten wir die Hybridisierung von MCDM (Multicriteria Decision Making ) und EMO (Evolutionary Multi-Objective Optimization). Ein hybrider Algorithmus im Kontext der Mehrzieloptimierung ist eine Kombination von Algorithmen/Ansätzen aus diesen beiden Bereichen (siehe zB). Hybridalgorithmen von EMO und MCDM werden hauptsächlich verwendet, um Schwächen durch Ausnutzung von Stärken zu überwinden. In der Literatur wurden verschiedene Arten von Hybridalgorithmen vorgeschlagen, z. B. die Integration von MCDM-Ansätzen in EMO-Algorithmen als lokaler Suchoperator und um einen DM zu der/den am meisten bevorzugten Lösung(en) zu führen usw. Ein lokaler Suchoperator wird hauptsächlich verwendet, um die Rate zu erhöhen der Konvergenz von EMO-Algorithmen.

Die Wurzeln der hybriden Mehrzieloptimierung lassen sich auf das erste Dagstuhl-Seminar im November 2004 zurückverfolgen (siehe hier ). Hier erkannten einige der besten Köpfe der EMO (Professor Kalyanmoy Deb, Professor Jürgen Branke etc.) und MCDM (Professor Kaisa Miettinen, Professor Ralph E. Steuer etc.) das Potenzial in der Kombination von Ideen und Ansätzen aus MCDM- und EMO-Bereichen zur Vorbereitung von Hybriden von ihnen. In der Folge wurden viele weitere Dagstuhl-Seminare arrangiert, um die Zusammenarbeit zu fördern. In letzter Zeit ist die hybride Mehrzieloptimierung ein wichtiges Thema auf mehreren internationalen Konferenzen im Bereich EMO und MCDM (siehe zB)

Visualisierung der Pareto-Front

Die Visualisierung der Pareto-Front ist eine der A-posteriori-Präferenztechniken der Mehrzieloptimierung. Die A-posteriori-Präferenztechniken stellen eine wichtige Klasse von Mehrzieloptimierungstechniken bereit. Üblicherweise umfassen die A-posteriori-Präferenztechniken vier Schritte: (1) Computer approximiert die Pareto-Front, dh den Pareto-Optimum-Satz im Objektivraum; (2) der Entscheidungsträger untersucht die Pareto-Front-Approximation; (3) der Entscheidungsträger identifiziert den bevorzugten Punkt an der Pareto-Front; (4) Computer liefert die optimale Pareto-Entscheidung, deren Ausgabe mit dem vom Entscheidungsträger identifizierten Zielpunkt übereinstimmt. Aus Sicht des Entscheidungsträgers ist der zweite Schritt der A-posteriori-Präferenztechniken der komplizierteste. Es gibt zwei Hauptansätze, um den Entscheidungsträger zu informieren. Zunächst können einige Punkte der Pareto-Front in Form einer Liste (interessante Diskussionen und Referenzen sind in) oder mittels Heatmaps bereitgestellt werden.

Visualisierung bei bi-objektiven Problemen: Tradeoff-Kurve

Bei biobjektiven Problemen erfolgt die Information des Entscheiders über die Pareto-Front meist durch deren Visualisierung: Die Pareto-Front, in diesem Fall oft als Tradeoff-Kurve bezeichnet, kann auf der Objektivebene gezeichnet werden. Die Tradeoff-Kurve gibt vollständige Informationen zu objektiven Werten und zu objektiven Kompromissen, die Auskunft darüber geben, wie die Verbesserung eines Ziels mit der Verschlechterung des zweiten verbunden ist, während Sie sich entlang der Kompromisskurve bewegen. Der Entscheidungsträger berücksichtigt diese Informationen bei der Festlegung des bevorzugten optimalen Pareto-Zielpunkts. Die Idee, die Pareto-Front zu approximieren und zu visualisieren, wurde für lineare bi-objektive Entscheidungsprobleme von S.Gass und T.Saaty eingeführt. Diese Idee wurde von JL Cohon entwickelt und bei Umweltproblemen angewendet. Eine Übersicht über Methoden zur Approximation der Pareto-Front für verschiedene Entscheidungsprobleme mit einer kleinen Anzahl von Zielen (hauptsächlich zwei) wird in gegeben.

Visualisierung in Mehrzieloptimierungsproblemen höherer Ordnung

Es gibt zwei allgemeine Ideen, wie man die Pareto-Front in Entscheidungsproblemen mit mehreren Zielen höherer Ordnung (Probleme mit mehr als zwei Zielen) visualisiert. Eine davon, die auf eine relativ kleine Anzahl von Zielpunkten anwendbar ist, die die Pareto-Front darstellen, basiert auf der Verwendung der in der Statistik entwickelten Visualisierungstechniken (verschiedene Diagramme usw. – siehe den entsprechenden Unterabschnitt weiter unten). Die zweite Idee schlägt die Darstellung von biobjektiven Querschnitten (Scheiben) der Pareto-Front vor. Es wurde 1973 von WS Meisel eingeführt, der argumentierte, dass solche Slices den Entscheidungsträger über objektive Kompromisse informieren. Die Abbildungen, die eine Reihe von bi-objektiven Schnitten der Pareto-Front für Drei-Objektive-Probleme darstellen, werden als Entscheidungskarten bezeichnet. Sie geben ein klares Bild von Kompromissen zwischen drei Kriterien. Nachteile eines solchen Ansatzes hängen mit zwei folgenden Tatsachen zusammen. Erstens sind die Rechenverfahren zum Konstruieren der biobjektiven Schichten der Pareto-Front nicht stabil, da die Pareto-Front normalerweise nicht stabil ist. Zweitens ist sie nur bei drei Zielen anwendbar. In den 1980er Jahren wurde die Idee von WS Meisel in anderer Form umgesetzt – in Form der Interactive Decision Maps (IDM)-Technik. Vor kurzem schlug N. Wesner vor, eine Kombination aus einem Venn-Diagramm und mehreren Scatterplot-Ansichten des objektiven Raums für die Erkundung der Pareto-Grenze und die Auswahl optimaler Lösungen zu verwenden.

Siehe auch

Verweise

Externe Links