Chomsky-Hierarchie
Die
Chomsky-Hierarchie beschreibt die Hierarchie von
Klassen formaler Grammatiken, deren Hierarchiestufen sich darin unterscheiden, wie rigide die Einschränkungen für die Form zulässiger Produktionsregeln auf der jeweiligen Stufe sind.
Grammatiken niedrigeren Typs sind erzeugungsmächtiger als die höherer Typen. Eine Sprache, die von einer
Grammatik des Typs k erzeugt wird, heißt eine
Sprache des Typs k. Neben die
Chomsky-Hierarchie der Grammatiken tritt in diesem Sinne eine
Chomsky-Hierarchie der Sprachen.
Typ-0-Grammatik (allgemeine Chomsky-Grammatik oder Phrasenstrukturgrammatik)
Typ-0-Grammatiken werden auch
unbeschränkte Grammatiken genannt. Es handelt sich dabei um die
Klasse aller
formalen Grammatiken der Form
G=(V,Σ,S,P).
Um die Zugehörigkeit zur
Klasse der Typ-0-Grammatiken auszudrücken, schreibt man
G∈Typ0
Typ-1-Grammatik (kontextsensitive Grammatik)
Typ-1-Grammatiken werden auch kontextsensitive Grammatiken genannt. Sie sind längenbeschränkte Typ-0 Grammatiken, d.h. für alle Regeln der Form
w1→w2 gilt stets
∣w1∣<=∣w2∣, einzige Ausnahme bildet die ebenfalls zugelassene Regel
S→ε.
Ist eine Grammatik
G kontextsensitiv, so schreibt man
G∈Typ1.
Anders als bei kontextfreien Grammatiken können auf der linken Seite der Produktionen kontextsensitiver Grammatiken durchaus statt einzelner Symbole ganze Symbolfolgen stehen, sofern sie nur mindestens ein Nichtterminalsymbol enthält.
Typ-2-Grammatik (kontextfreie Grammatik)
Typ-2-Grammatiken werden auch
kontextfreie Grammatiken genannt. Es sind Typ-1-Grammatiken, für die gelten muss:
∀(w1→w2)∈P:(w1∈N)∧(w2∈(N∪Σ)+)
In jeder Regel der Grammatik muss also auf der linken Seite genau ein nicht-terminales Symbol stehen und auf der rechten Seite kann eine beliebige nicht-leere Folge von terminalen und nichtterminalen Symbolen stehen.
Außerdem kann wie bei Typ-1-Grammatiken die Ausnahmeregel
S→ε zugelassen werden, wenn
S auf keiner rechten Seite einer Regel vorkommt.
Man schreibt
G∈Typ2
Typ-3-Grammatik (reguläre Grammatik)
Typ-3-Grammatiken werden auch reguläre Grammatiken genannt. Es handelt sich um Typ-2-Grammatiken, bei denen auf der rechten Seite von Produktionen genau ein Terminalsymbol auftreten darf und maximal ein weiteres Nichtterminalsymbol. Die erlaubte Stellung solcher Nichtterminalsymbole muss außerdem über alle Produktionen hinweg einheitlich immer vor oder immer hinter dem Terminalsymbol sein, je nachdem spricht man auch genauer von linksregulären und rechtsregulären Grammatiken.
Man schreibt
G∈Typ3 für reguläre Grammatiken
G.
Chomsky-Hierarchie für formale Sprachen
Eine
formale Sprache ist vom Typ
i entsprechend der Hierarchie für Grammatiken, wenn es von einer Typ-
i-Grammatik erzeugt wird. Formal ausgedrückt heißt das:
L ist vom Typ
i∈{0,…,3}, falls es eine Grammatik
G∈Typi mit
L=L(G) gibt. Man schreibt dann
L∈Li
In der
Chomsky-Hierarchie für
formale Sprachen besteht zwischen den Sprachmengen benachbarter Ebenen eine echte
Teilmengenbeziehung:
L3⊂L2⊂L1⊂L0,
wobei gelegentlich auch folgende Symbole verwendet werden:
REG⊂CF⊂CS⊂RE
Beispiele für Sprachen in den jeweiligen Differenzmengen sind:
- L1={anbncn∣n≥1} ist vom Typ 1, aber nicht vom Typ 2
- L2={anbn∣n≥1} ist vom Typ 2, aber nicht vom Typ 3
Beweise für die Nichtzugehörigkeit bestimmter Sprachen zu den Sprachklassen
L2 und
L3 wie hier werden oft mit dem Schleifensatz geführt.
Miß alles, was sich messen läßt, und mach alles meßbar, was sich nicht messen läßt.
Galileo Galilei
Anbieterkеnnzeichnung: Mathеpеdιa von Тhοmas Stеιnfеld
• Dοrfplatz 25 • 17237 Blankеnsее
• Tel.: 01734332309 (Vodafone/D2) •
Email: cο@maτhepedιa.dе