Konvexe und konkave Funktionen
- f(tx+(1−t)y)≤tf(x)+(1−t)f(y)
Anschaulich bedeutet die Definition: Die Funktionswerte zwischen zwei Werten
x,y liegen unterhalb der
Verbindungsgeraden der beiden Funktionswerte an
x und
y.
Gilt des Ungleichheitszeichen in die umgekehrte Richtung, also
- f(tx+(1−t)y)≥tf(x)+(1−t)f(y)
für alle
x,y aus
I und
t zwischen 0 und 1 gilt, so wird die
Funktion als
konkav bezeichnet. Vereinzelt wird der hier verwendete Begriff "
konvex" als "
konvex von unten" und im Gegensatz dazu "
konkav" als "
konvex von oben" bezeichnet.
Eine
Funktion heißt
streng konvex, wenn für alle
x,y aus
I (bzw.
C) und
t echt zwischen 0 und 1 gilt:
- f(tx+(1−t)y)<tf(x)+(1−t)f(y).
Analog heißt eine
Funktion streng konkav, wenn für alle
x,y aus
I (bzw.
C) und
t echt zwischen 0 und 1 gilt:
- f(tx+(1−t)y)>tf(x)+(1−t)f(y).
Die besondere Bedeutung konvexer bzw.
konkaver Funktionen liegt darin, dass sie allgemeiner als
lineare Funktionen sind, aber einfach zu untersuchende Eigenschaften haben, die viele Aussagen über nichtlineare Systeme, insbesondere über nichtlineare Optimierungsprobleme ermöglichen.
Beispiele
Konvexität, Beschränktheit und Stetigkeit
Schwächere Definition der Konvexität
Setzt man
Stetigkeit voraus, so reicht für Konvexität in einer konvexen
Teilmenge C eines reellen topologischen
Vektorraums bereits die Bedingung, dass ein beliebiges, aber fixes
λ∈R mit
0<λ<1 existiert, sodass für alle
x,y aus
C gilt:
- f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y).
Um dies zu sehen, betrachtet man die
Menge T aller "guten"
t, die durch
- T={t∈[0,1]:f(tx+(1−t)y)≤tf(x)+(1−t)f(y)∀x,y∈C}
definiert ist.
Seien nun
u,v∈T. Dann gilt auch
λu+(1−λ)v∈T, denn
- f((λu+(1−λ)v)x+(1−λu−(1−λ)v)y)
- =f(λ(ux+(1−u)y)+(1−λ)(vx+(1−v)y))
- ≤λf(ux+(1−u)y)+(1−λ)f(vx+(1−v)y)
- ≤λ(uf(x)+(1−u)f(y))+(1−λ)(vf(x)+(1−v)f(y))
- =(λu+(1−λ)v)f(x)+(1−λu−(1−λ)v)f(y).
Sein nun
t eine beliebige
reelle Zahl mit
0<t<1. Dann lässt sich eine Intervallschachtelung
[un,vn] mit
un,vn∈T konstruieren, die gegen
t konvergiert: Sei
u0=0,v0=1 und
0≤un≤t<vn≤1 und
0<vn−un≤qn mit
0<q:=min(λ,1−λ)<1.
Sei
tn:=λun+(1−λ)vn.
Ist
tn≤t, so setzt man
un+1:=tn,vn+1:=vn und es gilt
vn+1−un+1=λ(vn−un).
Ist
tn>t, so setzt man
un+1:=un,vn+1:=tn und es gilt
vn+1−un+1=(1−λ)(vn−un).
un+1,tn+1 sind ebenfalls aus
T, es gilt
t∈[un+1,vn+1] und
0<vn+1−un+1≤qn+1.
Die so konstruierte Intervallschachtelung konvergiert also gegen
t; wegen der
Stetigkeit von
f gilt daher
t∈T. Da
t beliebig gewählt war, folgt also
T=[0,1] und
f ist
konvex.
Gegenbeispiel ohne Stetigkeit
Dass
Stetigkeit für die schwächere Definition wirklich benötigt wird, lässt sich mit folgendem Gegenbeispiel zeigen: Ist
bj∈R,j∈J eine Hamelbasis des
Vektorraums der
reellen Zahlen über dem Körper der
rationalen Zahlen, also eine über den
rationalen Zahlen linear unabhängige
Menge reeller Zahlen, in der jede
reelle Zahl r eine Darstellung der Art
r=j∈J∑qjbj mit nur
endlich vielen rationalen
qj=/0 hat, so erfüllt bei beliebiger Wahl von
f(bj) die
Funktion f(r):=j∈J∑qjf(bj) zwar
f(2x+y)≤2f(x)+f(y), ist aber nicht notwendigerweise
konvex.
Beschränktheit und Konvexität
Setzt man für eine
Funktion f zusätzlich zur Bedingung dass für ein fixes
λ∈(0,1) die Beziehung
- f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y)
Formal ist der Beweis allerdings etwas komplizierter. Zunächst beachte man, dass aus den obigen Voraussetzungen für
natürliche Zahlen n und
- x=λnu+(1−λn)y
folgt, dass
- f(x)≤λnf(u)+(1−λn)f(y)
bzw.
- f(u)=f(λn1x−(λn1−1)y)≥λn1f(x)−(λn1−1)f(y).
- Bρ(a)={x:∥x−a∥<ρ}⊆C
eine zur Gänze in
C enthaltene offene Kugel um
a. Wäre nun
f nicht
stetig in
a, so gäbe es ein
ε>0 sodass für jedes
δ>0 ein
x existiert, sodass zwar
∥a−x∥<δ aber
∣f(x)−f(a)∣>ε. Sein nun
n∈N so gewählt, dass
- λn1−1>εM−f(a),
wobei
M eine
obere Schranke für
f sei. Wählt man nun
δ=λnρ, so existiert also ein
x mit
- ∥x−a∥<λnρ
aber
- ∣f(x)−f(a)∣>ε.
Angenommen,
f(x)>f(a)+ϵ. Dann gilt für
y:=λn1x−(λn1−1)a
- f(y)=f(λn1x−(λn1−1)a)≥λn1f(x)−(λn1−1)f(a)>f(a)+λn1ϵ>M.
Das kann aber nicht sein, da
∥y−a∥=λn1∥x−a∥<ρ. Daher liegt
y in
C und es muss
f(y)<M gelten.
Sei daher
f(x)<f(a)−ϵ. Dann gilt für
z:=λn1a−(λn1−1)x
- f(z)=f(λn1a−(λn1−1)x)≥λn1f(a)−(λn1−1)f(x)>f(a)+(λn1−1)ϵ>M.
Das kann aber auch nicht sein, da
∥z−a∥=(λn1−1)∥x−a∥<ρ. Daher liegt auch
z in
C und es muss ebenfalls
f(z)<M gelten.
f muss daher
stetig in
a sein.
- f(x+y)=f(x)+f(y)
- f(1)=a.
Aus dieser Aussage folgt nämlich, dass diese Funktionalgleichung eine eindeutige Lösung hat, wenn zusätzlich gefordert wird, dass
f beschränkt ist.
Unendlichdimensionaler Fall
Im unendlichdimensionalen Fall brauchen
konvexe Funktionen nicht
stetig zu sein, da es lineare (also somit auch konvexe) Funktionale gibt, die nicht
stetig sind. Allerdings gilt, dass beschränkte konvexe Funktionale eines
normierten Vektorraums stetig sind.
Endlichdimensionaler Fall
Innere Punkte
Konvexe Funktionen f einer konvexen
Teilmenge C des endlichdimensionalen
reellen Vektorraums Rn sind
stetig in den
inneren Punkten. Um das zu sehen, betrachte man einen
inneren Punkt a∈C. Für diesen existiert ein Simplex
Sn⊆C mit den Eckpunkten
p1,…,pn,pn+1, der
a wieder als
inneren Punkt enthält. Jeder
Punkt x∈Sn ist aber in der Form
- x=j=1∑n+1tjpj
mit
- j∑tj=1
- f(x)=f(j=1∑n+1tjpj)≤j=1∑n+1tjf(pj)≤maxf(pj)=:M.
Randpunkte
In
Randpunkten können
konvexe Funktionen unstetig sein, wie das Beispiel der
Funktion [0,∞)→R mit
- f(x)={1fallsx=00sonst
zeigt, die zwar
konvex ist, aber am
Randpunkt x=0 eine Unstetigkeit aufweist.
Seit man begonnen hat, die einfachsten Behauptungen zu beweisen, erwiesen sich viele von ihnen als falsch.
Bertrand Russell
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld
• Dοrfplatz 25 • 17237 Blankеnsее
• Tel.: 01734332309 (Vodafone/D2) •
Email: cο@maτhepedιa.dе