Mittelwertsatz - Mean value theorem
Teil einer Artikelserie über |
Infinitesimalrechnung |
---|
In der Mathematik besagt der Mittelwertsatz grob, dass es für einen gegebenen planaren Bogen zwischen zwei Endpunkten mindestens einen Punkt gibt, an dem die Tangente an den Bogen durch seine Endpunkte parallel zur Sekante verläuft . Es ist eines der wichtigsten Ergebnisse in der realen Analyse . Dieser Satz wird verwendet, um Aussagen über eine Funktion auf einem Intervall ausgehend von lokalen Hypothesen über Ableitungen an Punkten des Intervalls zu beweisen.
Genauer gesagt besagt das Theorem, dass wenn eine stetige Funktion auf dem geschlossenen Intervall und differenzierbar auf dem offenen Intervall ist , dann gibt es einen Punkt, in dem die Tangente an parallel zur Sekantenlinie durch die Endpunkte und ist , d.h.
Geschichte
Ein Sonderfall dieses Theorems wurde erstmals von Parameshvara (1370–1460) von der Kerala School of Astronomy and Mathematics in India in seinen Kommentaren zu Govindasvāmi und Bhāskara II beschrieben . Eine eingeschränkte Form des Satzes wurde 1691 von Michel Rolle bewiesen ; das Ergebnis war das, was heute als der Satz von Rolle bekannt ist , und wurde nur für Polynome ohne die Techniken der Infinitesimalrechnung bewiesen. Der Mittelwertsatz in seiner modernen Form wurde 1823 von Augustin Louis Cauchy aufgestellt und bewiesen. Seitdem wurden viele Variationen dieses Satzes bewiesen.
Formale Aussage
Let sein , kontinuierliche Funktion auf dem geschlossenen Intervall , und differenzierbar auf dem offenen Intervall , wo . Dann gibt es einige in solchen, dass
Der Mittelwertsatz ist eine Verallgemeinerung des Satzes von Rolle , der davon ausgeht , dass die rechte Seite darüber Null ist.
Der Mittelwertsatz ist in einer etwas allgemeineren Umgebung immer noch gültig. Man braucht nur anzunehmen , dass ist kontinuierlich auf , und das für jeden in der Grenze
existiert als endliche Zahl oder ist gleich oder . Wenn sie endlich ist, ist diese Grenze gleich . Ein Beispiel , wo diese Version des Satzes gilt durch das reellwertige gegeben Kubikwurzelfunktion Mapping , dessen Derivat gegen Unendlich am Ursprung.
Beachten Sie, dass der Satz, wie gesagt, falsch ist, wenn eine differenzierbare Funktion komplexwertig und nicht reellwertig ist. Definieren Sie beispielsweise für alle realen . Dann
während für jede reale .
Diese formalen Aussagen werden auch als Mittelwertsatz von Lagrange bezeichnet.
Nachweisen
Der Ausdruck gibt die Steigung der Linie an, die die Punkte und verbindet , die eine Sehne des Graphen von ist , während die Steigung der Tangente an die Kurve an dem Punkt angibt . Der Mittelwertsatz besagt also, dass wir bei jeder Sehne einer glatten Kurve einen Punkt auf der Kurve finden können, der zwischen den Endpunkten der Sehne liegt, so dass die Tangente der Kurve an diesem Punkt parallel zur Sehne ist. Der folgende Beweis illustriert diese Idee.
Definiere , wobei eine Konstante ist. Da auf stetig und auf differenzierbar ist , gilt das Gleiche für . Wir wollen nun so wählen , dass die Bedingungen des Satzes von Rolle erfüllt sind . Nämlich
Nach dem Satz von Rolle , da differenzierbar ist und , gibt es einige in denen , und aus der Gleichheit folgt, dass
Auswirkungen
Satz 1: Nehmen Sie an, dass f eine stetige reellwertige Funktion ist, die auf einem beliebigen Intervall I der reellen Geraden definiert ist. Wenn die Ableitung von f an jedem inneren Punkt des Intervalls I vorhanden ist, und Null ist , dann F ist konstant in dem Innenraum.
Beweis: Angenommen, die Ableitung von f an jedem inneren Punkt des Intervalls I existiert und ist null. Sei ( a , b ) ein beliebiges offenes Intervall in I . Nach dem Mittelwertsatz gibt es einen Punkt c in ( a , b ) mit
Dies impliziert, dass f ( a ) = f ( b ) . Also ist f im Inneren von I konstant und somit auf I durch Stetigkeit konstant . (Siehe unten für eine multivariable Version dieses Ergebnisses.)
Bemerkungen:
- An den Endpunkten des Intervalls I wird nur die Stetigkeit von f benötigt , nicht die Differenzierbarkeit . Wenn I ein offenes Intervall ist , muss keine Stetigkeitshypothese aufgestellt werden , da die Existenz einer Ableitung an einem Punkt die Stetigkeit an diesem Punkt impliziert. (Siehe den Abschnitt Stetigkeit und Differenzierbarkeit des Artikels Derivat .)
- Die Differenzierbarkeit von f kann auf einseitige Differenzierbarkeit gelockert werden , ein Beweis, der im Artikel über Semidifferenzierbarkeit gegeben wird .
Satz 2: Wenn f' ( x ) = g' ( x ) für alle x in einem Intervall ( a , b ) des Definitionsbereichs dieser Funktionen, dann ist f - g konstant oder f = g + c wobei c eine Konstante ist auf ( a , b ).
Beweis: Sei F = f − g , dann ist F' = f' − g' = 0 auf dem Intervall ( a , b ), also besagt der obige Satz 1, dass F = f − g eine Konstante c oder f = g + . ist c .
Theorem 3: Wenn F eine Stammfunktion von f auf einem Intervall I , dann ist die allgemeinste antiderivative von f auf I ist F (x) + c wobei c eine Konstante ist .
Beweis: Er leitet sich direkt aus obigem Satz 2 ab.
Mittelwertsatz von Cauchyy
Der Mittelwertsatz von Cauchy , auch als erweiterter Mittelwertsatz bekannt , ist eine Verallgemeinerung des Mittelwertsatzes. Sie besagt: Wenn die Funktionen und sowohl auf dem geschlossenen Intervall stetig als auch auf dem offenen Intervall differenzierbar sind , dann gibt es einige , so dass
Wenn und ist dies natürlich gleichbedeutend mit:
Geometrisch bedeutet dies, dass es eine Tangente an den Kurvenverlauf gibt
die parallel zu der durch die Punkte und definierten Linie verläuft . Der Satz von Cauchy behauptet jedoch nicht die Existenz einer solchen Tangente in allen Fällen, in denen und verschiedene Punkte sind, da sie nur für einen Wert mit erfüllt sein könnte, mit anderen Worten, für einen Wert, für den die erwähnte Kurve stationär ist ; in solchen Punkten ist wahrscheinlich überhaupt keine Tangente an die Kurve definiert. Ein Beispiel für diese Situation ist die Kurve von
die auf dem Intervall vom Punkt nach geht , aber nie eine horizontale Tangente hat; es hat jedoch einen stationären Punkt (eigentlich eine Spitze ) bei .
Der Mittelwertsatz von Cauchy kann verwendet werden, um die Regel von L'Hôpital zu beweisen . Der Mittelwertsatz ist der Spezialfall des Cauchyschen Mittelwertsatzes, wenn .
Beweis des Mittelwertsatzes von Cauchy
Der Beweis des Mittelwertsatzes von Cauchy basiert auf derselben Idee wie der Beweis des Mittelwertsatzes.
-
Angenommen . Definieren Sie , wobei so festgelegt ist, dass , nämlich
- Wendet man den Satz von Rolle auf an , folgt daraus, dass es in für gibt . Mit dieser Wahl von gilt (trivialerweise) der Mittelwertsatz von Cauchy.
Verallgemeinerung für Determinanten
Nehmen Sie an, dass und differenzierbare Funktionen auf sind , die auf stetig sind . Definieren
Es gibt solche .
Beachte das
und wenn wir setzen , erhalten wir den Mittelwertsatz von Cauchy. Wenn wir platzieren und erhalten wir den Mittelwertsatz von Lagrange .
Der Beweis der Verallgemeinerung ist recht einfach: Jedes von und ist Determinanten mit zwei identischen Zeilen, also . Der Satz von Rolle impliziert, dass es solche gibt, dass .
Mittelwertsatz in mehreren Variablen
Der Mittelwertsatz verallgemeinert sich auf reelle Funktionen mehrerer Variablen. Der Trick besteht darin, mit Parametrisierung eine reelle Funktion einer Variablen zu erstellen und dann den Satz über eine Variable anzuwenden.
Sei eine offene konvexe Teilmenge von , und sei eine differenzierbare Funktion. Fixpunkte und definieren . Da es sich um eine differenzierbare Funktion in einer Variablen handelt, liefert der Mittelwertsatz:
für einige zwischen 0 und 1. Aber da und explizit berechnend gilt:
wobei bezeichnet einen Gradienten und ein Punktprodukt . Beachten Sie, dass dies eine genaue Analogon des Satzes in einer Variablen (im Fall dieses ist der Satz in einer Variable). Durch die Cauchy-Schwarz-Ungleichung ergibt die Gleichung den Schätzwert:
Insbesondere wenn die partiellen Ableitungen von beschränkt sind, ist Lipschitz stetig (und daher gleichmäßig stetig ).
Als Anwendung des Obigen beweisen wir, dass konstant ist, wenn offen und zusammenhängend ist und jede partielle Ableitung von 0 ist. Wählen Sie einen Punkt aus und lassen Sie . Wir wollen für jeden zeigen . Lassen Sie dazu . Dann ist E abgeschlossen und nicht leer. Es ist auch geöffnet: für jeden ,
für jeden in einer Nachbarschaft von . (Hier ist es entscheidend, dass und ausreichend nahe beieinander liegen.) Da verbunden ist, schließen wir .
Die obigen Argumente erfolgen koordinatenfrei; daher verallgemeinern sie auf den Fall, wenn eine Teilmenge eines Banach-Raums ist.
Mittelwertsatz für vektorwertige Funktionen
Es gibt kein genaues Analogon des Mittelwertsatzes für vektorwertige Funktionen.
In Principles of Mathematical Analysis gibt Rudin eine Ungleichung an, die auf viele der gleichen Situationen angewendet werden kann, auf die der Mittelwertsatz im eindimensionalen Fall anwendbar ist:
Satz — Für eine stetige vektorwertige Funktion, die auf differenzierbar ist , gibt es so dass .
Jean Dieudonné verwirft in seiner klassischen Abhandlung Foundations of Modern Analysis den Mittelwertsatz und ersetzt ihn durch die mittlere Ungleichung, da der Beweis nicht konstruktiv ist und man den Mittelwert nicht finden kann und in Anwendungen nur die mittlere Ungleichung benötigt wird. Serge Lang verwendet in Analysis I den Mittelwertsatz in integraler Form als sofortigen Reflex, aber dieser Gebrauch erfordert die Stetigkeit der Ableitung. Wenn man das Henstock–Kurzweil-Integral verwendet , kann man den Mittelwertsatz in Integralform haben, ohne die zusätzliche Annahme, dass die Ableitung stetig sein sollte, da jede Ableitung Henstock–Kurzweil-integrierbar ist. Das Problem spricht etwa die folgende: Wenn f : U → R m ist eine differenzierbare Funktion (wobei U ⊂ R n offen ist ) , und wenn x + th , x , h ∈ R n , t ∈ [0, 1] ist die fraglichen Liniensegment (innerhalb von U liegend ), dann kann man das obige Parametrisierungsverfahren auf jede der Komponentenfunktionen f i ( i = 1, …, m ) von f (in der obigen Notationsmenge y = x + h ) anwenden . Dabei findet man Punkte x + t i h auf der Strecke, die
Aber im Allgemeinen wird es keinen einzigen Punkt x + t * h auf dem Streckenabschnitt geben, der
für alle ich gleichzeitig . Definieren Sie beispielsweise:
Dann aber und nie gleichzeitig Null als Reichweiten über .
Eine gewisse Verallgemeinerung des Mittelwertsatzes auf vektorwertige Funktionen ergibt sich jedoch wie folgt: Sei f eine stetig differenzierbare reellwertige Funktion definiert auf einem offenen Intervall I , und seien x sowie x + h Punkte von ich . Der Mittelwertsatz in einer Variablen sagt uns, dass es ein t * zwischen 0 und 1 gibt, so dass
Andererseits haben wir nach dem Fundamentalsatz der Infinitesimalrechnung gefolgt von einer Variablenänderung
Somit wurde der Wert f′ ( x + t * h ) an der jeweiligen Stelle t * durch den Mittelwert . ersetzt
Diese letzte Version kann auf vektorwertige Funktionen verallgemeinert werden:
Lemma 1 — Sei U ⊂ R n offen, f : U → R m stetig differenzierbar, und x ∈ U , h ∈ R n Vektoren, so dass das Liniensegment x + th , 0 ≤ t ≤ 1 in U bleibt . Dann haben wir:
wobei Df die Jacobi-Matrix von f bezeichnet und das Integral einer Matrix komponentenweise zu verstehen ist.
Nachweisen. Seien f 1 , …, f m die Komponenten von f und definieren Sie:
Dann haben wir
Die Behauptung folgt, da Df die aus den Komponenten bestehende Matrix ist .
Lemma 2 — Sei v : [ a , b ] → R m eine stetige Funktion definiert auf dem Intervall [ a , b ] R . Dann haben wir
Nachweisen. Sei u in R m der Wert des Integrals
Nun haben wir (unter Verwendung der Cauchy-Schwarz-Ungleichung ):
Wenn wir nun die Norm von u von beiden Enden aufheben, erhalten wir die gewünschte Ungleichung.
Mittelwertungleichung — Wenn die Norm von Df ( x + th ) durch eine Konstante M für t in [0, 1] beschränkt ist , dann
Nachweisen. Aus Lemma 1 und 2 folgt, dass
Mittelwertsätze für bestimmte Integrale
Erster Mittelwertsatz für bestimmte Integrale
Sei f : [ a , b ] → R eine stetige Funktion. Dann existiert c in [ a , b ] so dass
Da der Mittelwert von f auf [ a , b ] definiert ist als
wir können die Schlussfolgerung so interpretieren, dass f seinen Mittelwert bei einem c in ( a , b ) erreicht.
Allgemein gilt, wenn f : [ a , b ] → R stetig und g eine integrierbare Funktion ist, die auf [ a , b ] kein Vorzeichen ändert , dann existiert c in ( a , b ) mit
Beweis des ersten Mittelwertsatzes für bestimmte Integrale
Angenommen f : [ a , b ] → R ist stetig und g ist eine nicht negative integrierbare Funktion auf [ a , b ]. Nach dem Extremwertsatz gibt es m und M derart, dass für jedes x in [ a , b ], und . Da g nichtnegativ ist,
Nun lass
Wenn , wir sind fertig seit
meint
also für jedes c in ( a , b ),
Wenn ich 0 bin , dann
Durch den Zwischenwertsatz , f Attalus jeden Wert des Intervalls [ m , M ], so für einige c in [ a , b ]
das ist,
Schließlich, wenn g negativ auf [ a , b ] ist, dann
und wir erhalten immer noch das gleiche Ergebnis wie oben.
QED
Zweiter Mittelwertsatz für bestimmte Integrale
Es gibt verschiedene leicht unterschiedliche Sätze, die als zweiter Mittelwertsatz für bestimmte Integrale bezeichnet werden . Eine häufig vorkommende Version ist wie folgt:
- Ist G : [ a , b ] → R eine positiv monoton fallende Funktion und φ : [ a , b ] → R eine integrierbare Funktion, dann existiert eine Zahl x in ( a , b ] mit
Hier steht für , dessen Existenz sich aus den Bedingungen ergibt. Beachten Sie, dass es wichtig ist , dass das Intervall ( a , b ] enthält b Eine Variante dieser Anforderung nicht mit ist.:
- Wenn G : [ a , b ] → R eine monotone (nicht notwendigerweise fallende und positive) Funktion und φ : [ a , b ] → R eine integrierbare Funktion ist, dann existiert eine Zahl x in ( a , b ) mit
Mittelwertsatz für Integration versagt für vektorwertige Funktionen
Wenn die Funktion einen mehrdimensionalen Vektor zurückgibt, ist die MVT für die Integration nicht wahr, selbst wenn die Domäne von ebenfalls mehrdimensional ist.
Betrachten Sie beispielsweise die folgende zweidimensionale Funktion, die auf einem -dimensionalen Würfel definiert ist:
Dann ist durch Symmetrie leicht zu erkennen, dass der Mittelwert von über seinem Bereich (0,0) ist:
Es gibt jedoch keinen Punkt, an dem , denn überall.
Ein probabilistisches Analogon des Mittelwertsatzes
Seien X und Y nicht negative Zufallsvariablen mit E[ X ] < E[ Y ] < ∞ und (dh X ist in der üblichen stochastischen Ordnung kleiner als Y ). Dann existiert eine absolut stetige nicht negative Zufallsvariable Z mit Wahrscheinlichkeitsdichtefunktion
Sei g eine messbare und differenzierbare Funktion mit E[ g ( X )], E[ g ( Y )] < ∞, und sei ihre Ableitung g′ messbar und Riemann-integrierbar auf dem Intervall [ x , y ] für alle y ≥ x ≥ 0. Dann ist E[ g′ ( Z )] endlich und
Generalisierung in der komplexen Analyse
Wie oben erwähnt, gilt der Satz nicht für differenzierbare komplexwertige Funktionen. Stattdessen wird eine Verallgemeinerung des Theorems wie folgt angegeben:
Sei f : Ω → C eine holomorphe Funktion auf der offenen konvexen Menge Ω und seien a und b verschiedene Punkte in Ω. Dann gibt es Punkte u , v auf L ab (dem Geradensegment von a nach b ) mit
Dabei ist Re() der Realteil und Im() der Imaginärteil einer komplexwertigen Funktion.