Halley-Verfahren

Das Halley-Verfahren (auch Verfahren der berührenden Hyperbeln) ist, ähnlich wie das Newton-Verfahren, eine Methode der numerischen Mathematik zur Bestimmung von Nullstellen \(\displaystyle f(x)=0\) reeller Funktionen \(\displaystyle f:\R\to\R\). Im Gegensatz zum Newton-Verfahren hat es die Konvergenzordnung 3, benötigt dazu aber zusätzlich zur ersten auch die zweite Ableitung. Es ist nach dem Astronomen Edmond Halley benannt, der auch den Halleyschen Kometen entdeckte. Ein vergleichbares Verfahren ist das Euler-Tschebyschow-Verfahren.
 
 

Beschreibung des Verfahrens

Sei \(\displaystyle f\) eine reelle Funktion mit stetiger zweiter Ableitung, \(\displaystyle f\in C^2(\R,\R)\) und sei \(\displaystyle a\) eine einfache Nullstelle von \(\displaystyle f\), d.h. \(\displaystyle f'(a)\ne 0\). Dann wird der Funktionsverlauf von \(\displaystyle f\) in der Nähe von \(\displaystyle a\) gerade gebogen, indem statt \(\displaystyle f\) die Funktion \(\displaystyle g(x)=\dfrac{f(x)}{\sqrt{|f\, '(x)|}}\) betrachtet wird. Diese Konstruktion ist von der Nullstelle unabhängig. Nun wird das Newton-Verfahren auf \(\displaystyle g\) angewandt. Es ist
\(\displaystyle g'(x)=\left(f(x)\cdot |f'(x)|^{-1/2}\right)' \)\(\displaystyle = f'(x)\cdot |f'(x)|^{-1/2}+f(x)\cdot(-\dfrac12)|f'(x)|^{-3/2}\sgn(f'(x))\,f(x)\)\(\displaystyle =\dfrac{2f'(x)^2-f(x)f(x)}{2f'(x)\sqrt{|f'(x)|}} \)
und daher \(\displaystyle H_f(x)=N_g(x)=x-\dfrac{g(x)}{g'(x)}=x-\dfrac{2f(x)f'(x)}{2f'(x)^2-f(x)f(x)} \)
Daraus ergibt sich die Iteration des Halley-Verfahrens wie folgt: Es wird ein geeigneter Startwert \(\displaystyle x_0\) gewählt, wobei sich dieselben Schwierigkeiten und Strategien wie beim Newton-Verfahren ergeben. Mit diesem wird die Folge \(\displaystyle (x_k)_{k\in\N}\) der sukzessiven Näherungen durch die Iterationsvorschrift
\(\displaystyle x_{k+1}=H_f(x_k)=x_k-\dfrac{2f(x_k)f'(x_k)}{2f'(x_k)^2-f(x_k)f(x_k)}\)
bestimmt.

Beispiel

Die Iteration für die Quadratwurzel von 5 ergibt mit \(\displaystyle f(x)=x^2-5\) die Iterationsvorschrift
\(\displaystyle H_f(x)=x\,\dfrac{x^2+15}{3x^2+5}\)
und damit die Berechnungstabelle
\(\displaystyle k\) \(\displaystyle x_k\) \(\displaystyle f(x_k)\)
0 3.00000000000000000000000000000000000000000000000000000000000 4.00000000000
1 2.25000000000000000000000000000000000000000000000000000000000 0.0625000000000
2 2.23606811145510835913312693498452012383900928792569659442724 5.99066414899E-7
3 2.23606797749978969640929385361588622700967141237081284965284 5.37483143712E-22
4 2.23606797749978969640917366873127623544061835961152572427090 0.000000000000
Es ergibt sich eine Folge von 0, 1, 5, 21, >60 gültigen Stellen, d.h. eine Verdreifachung in jedem Schritt. Das Newtonverfahren hat die Verfahrensvorschrift:
\(\displaystyle G_f(x)=\dfrac{x^2+5}{2x}\)
Im direkten Vergleich zeigt das Halley Verfahren die schnellere Konvergenz. Es benötigt jedoch mehr Rechenoperationen pro Schritt.

Kubische Konvergenz

Sei \(\displaystyle f\) dreimal stetig differenzierbar. Da \(\displaystyle a\) als Nullstelle von \(\displaystyle f\) vorausgesetzt wurde, gilt näherungsweise \(\displaystyle f(x)=f(x)-f(a)\approx f´(a)(x-a)\). Genauer gilt auf einem Intervall \(\displaystyle I\), welches \(\displaystyle a\) enthält, nach dem Mittelwertsatz der Differentialrechnung die zweiseitige Abschätzung
\(\displaystyle \dfrac{|f(x)|}{\max_{z\in I}|f'(z)|}\le |x-a|\le\dfrac{|f(x)|}{\min_{z\in I}|f'(z)|}\),
d.h. sowohl \(\displaystyle x-a=O(f(x))\) als auch \(\displaystyle f(x)=O(x-a)\). Es reicht also, das Verhältnis der Funktionswerte von einem Iterationsschritt zum nächsten zu bestimmen.
Die Taylorentwicklung zweiten Grades von \(\displaystyle f\) ist
\(\displaystyle f\left(x+h\right)=f(x)+ f'(x)\,h+\dfrac12 f(x)\,h^2 +O\left(h^3\right)\).
Dies ergibt zunächst eine Näherung durch eine Parabel, die \(\displaystyle f\) im Punkt \(\displaystyle x\) von zweiter Ordnung berührt. Ist \(\displaystyle f(x)\) klein genug, so hat diese Parabel eine Nullstelle, die deutlich nahe an \(\displaystyle x\) liegt, nämlich bei
\(\displaystyle h=-\dfrac{2f(x)}{f'(x)+\text{sign}(f'(x))\sqrt{f'(x)^2-2f(x)f(x)}}\)
Die entsprechende Iteration ist
\(\displaystyle x_{k+1}=x_k-\dfrac{2f(x_k)}{f'(x_k)+\text{sign}(f'(x_k))\sqrt{f'(x_k)^2-2f(x_k)f(x_k)}}\).
Da der Nenner von \(\displaystyle h\) in der Nähe einer Nullstelle von \(\displaystyle f\) von Null verschieden ist, gilt \(\displaystyle h=O(f(x))\). Durch diese Konstruktion von \(\displaystyle h\) verschwinden die ersten drei Glieder der Taylor-Entwicklung, daher gilt \(\displaystyle f(x_{k+1})=O(h^3)=O(f(x_k)^3)\).
Benutzt man in der Taylor-Entwicklung die Identität \(\displaystyle (a+bh)(a-bh)\)\(\displaystyle =a^2-b^2h^2=a^2+O(h^2)\), so kann man diese in einen Bruch von in \(\displaystyle h\) linearen Funktionen verwandeln:
\(\displaystyle f\left(x+h\right)=f(x)+\left(f'(x)+\dfrac12 f(x)h\right)\,h+O\left(h^3\right)\) \(\displaystyle =f(x)+\dfrac{f'(x)^2h}{f'(x)-\dfrac12 f(x)h}+O\left(h^3\right)\)\(\displaystyle =\dfrac{f(x)f'(x)+h(f'(x)^2-\dfrac12f(x)f(x))}{f'(x)-\dfrac12 f(x)h}+O\left(h^3\right)\ \)
Die Funktion \(\displaystyle f\) wird also durch eine Hyperbel approximiert, die \(\displaystyle f\) in \(\displaystyle x\) zu ebenfalls zweiter Ordnung berührt. Der Zähler der Hyperbelfunktion verschwindet für \(\displaystyle h=-\dfrac{2f(x)f'(x)}{2f'(x)^2-f(x)f(x)}\), woraus sich die Halley-Iteration (s.o.) ergibt. Wieder gilt \(\displaystyle h=O(f(x))\) und damit
\(\displaystyle f(H_f(x))=O(h^3)=O(f(x)^3)\,\)
Daraus folgt dann für die Halley-Iteration
\(\displaystyle x_{k+1}-a=H_f(x_k)-a=O(f(H_f(x_k)))\)\(\displaystyle =O(f(x_k)^3)=O((x_k-a)^3)\),
d.h. die kubische Konvergenz.

mehrdimensionale Erweiterung

Eine Erweiterung des Verfahrens auf Funktionen mehrerer Veränderlicher \(\displaystyle F: \mathbb{R}^n \to \mathbb{R}^n\) ist möglich. Es kann der gleiche binomische Trick zur Herstellung einer Hyperbelfunktion verwendet werden. Dabei ist aber zu beachten,
  1. dass \(\displaystyle F\, '(x)\) eine Matrix ist, die als invertierbar vorausgesetzt wird,
  2. dass \(\displaystyle F\, (x)\) ein Tensor dritter Stufe ist, genauer eine vektorwertige symmetrische Bilinearform, und
  3. dass die unvollständig ausgewertete zweite Ableitung \(\displaystyle F\, (x)(v,\cdot)\), die ebenfalls eine Matrix ist, im Allgemeinen nicht mit der Matrix \(\displaystyle F\, '(x)\) kommutiert.
Dies sind keine Hindernisse, diese Eigenschaften machen nur die Rechnung etwas unübersichtlicher. Es bezeichne \(\displaystyle t=-F´(x)^{-1}F(x)\) den üblichen Newtonschritt, sei \(\displaystyle C(u,v)=\dfrac12 F'(x)^{-1}F(x)(u,v)\) der entsprechend modifizierte Term zweiter Ordnung. Dann gilt für die Taylorentwicklung in \(\displaystyle x\)
\(\displaystyle F(x+s)=F(x)+F'(x)s+\dfrac12F(x)(s,s)+O(s^3)\)\(\displaystyle =F'(x)\,\left(-t+s+C(s,s)\right)+O(s^3)\) d.h. \(\displaystyle F'(x)^{-1}F(x+s)=\left(-t+\left(I+C(s,\cdot)\right)\,s+O(s^3)\right)\)\(\displaystyle =\left(-t+\left(I-C(s,\cdot)\right)^{-1}\,s+O(s^3)\right)\)\(\displaystyle =\left(I-C(s,\cdot)\right)^{-1}\,\left(-t+C(s,t)+s+O(s^3)\right) \)
Der in \(\displaystyle s\) lineare Teil des Zählers wird nun zu Null gesetzt und weiter umgeformt. Dabei wird die Symmetrie von \(\displaystyle C(\cdot ,\cdot )\) ausgenutzt:
\(\displaystyle 0=-t+C(s,t)+s=-t+\left(I+C(t,\cdot)\right)\,s\quad\)\(\displaystyle \iff\quad s=\left(I+C(t,\cdot)\right)^{-1}\,t\)
Werden nun die Kurznotationen durch die ursprünglichen Ausdrücke ersetzt, so ergibt sich
\(\displaystyle s =-\left(I-\dfrac12F'(x)^{-1}F(x)\left(F'(x)^{-1}F(x),\cdot\right)\right)^{-1}\;F'(x)^{-1}F(x)\)\(\displaystyle =-\left(F'(x)-\dfrac12F(x)\left(F'(x)^{-1}F(x),\cdot\right)\right)^{-1}\;F(x) \).
Man überzeugt sich leicht, dass diese Formel sich im eindimensionalen Fall zur Halley-Iteration reduziert. Der sich daraus ergebende Iterationsschritt des mehrdimensionalen Halley-Verfahrens kann in 3 einfacheren Schritten bestimmt werden:
  1. Newton-Schritt: Löse \(\displaystyle F'(x_k)t_k=-F(x_k)\)
  2. Korrektur des Newton-Schritts: Löse \(\displaystyle \left(F'(x_k)+\dfrac{1}{2}F(x_k)(t_k,\cdot) \right)s_k = -F(x_k)\)
  3. Setze \(\displaystyle x_{k+1}=x_k+s_k\)
Ist die 2.Ableitung Lipschitz-stetig, so konvergiert das Verfahren lokal kubisch.
Da \(\displaystyle F(x)\) als klein vorausgesetzt wurde, ist es nicht wirklich notwendig, die Inverse der großen Klammer zu bestimmen. Es kann wieder der binomische Trick (bzw. die Taylorformel 1. Grades) benutzt werden, um den einfacheren, aber bis auf Terme dritter Ordnung (nun in \(\displaystyle F(x)\)) identischen Ausdruck
\(\displaystyle s=-\left(I+\dfrac12F'(x)^{-1}F(x)\left(F'(x)^{-1}F(x),\cdot\right)\right)\;F'(x)^{-1}F(x)\)\(\displaystyle =-F'(x)^{-1}F(x)-\dfrac12F'(x)^{-1}F(x)(F'(x)^{-1}F(x),F'(x)^{-1}F(x)) \)
zu erhalten. Die daraus abgeleitete Iteration ist das Euler-Tschebyschow-Verfahren.

Literatur

  • T.R. Scavo and J.B. Thoo, On the geometry of Halley's method. American Mathematical Monthly, volume 102 (1995), number 5, pages 417-426.
  • Hubert Schwetlick: Numerische Lösung nichtlinearer Gleichungen Deutscher Verlag der Wissenschaften 1979

Strukturen sind die Waffen der Mathematiker.

N. Bourbaki

Copyright- und Lizenzinformationen: Diese Seite basiert dem Artikel Halley-Verfahren aus der frеiеn Enzyklοpädιe Wιkιpеdιa und stеht unter der Dοppellizеnz GNU-Lιzenz für freie Dokumentation und Crеative Commons CC-BY-SA 3.0 Unportеd (Kurzfassung). In der Wιkιpеdιa ist eine Listе dеr Autorеn des Originalartikels verfügbar. Da der Artikel geändert wurde, reicht die Angabe dieser Liste für eine lizenzkonforme Weiternutzung nicht aus!
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld  • Dοrfplatz 25  •  17237 Blankеnsее  • Tel.: 01734332309 (Vodafone/D2)  •  Email: cο@maτhepedιa.dе