[2] | 1 | %
|
---|
| 2 | % $Id: report.tex 571 2008-04-20 17:31:04Z rick $
|
---|
| 3 | %
|
---|
| 4 |
|
---|
| 5 | \documentclass[12pt,a4paper]{article}
|
---|
| 6 |
|
---|
| 7 | \frenchspacing
|
---|
| 8 | \usepackage[english,dutch]{babel}
|
---|
| 9 | \selectlanguage{dutch}
|
---|
[224] | 10 | \usepackage[pdftex]{graphicx}
|
---|
[2] | 11 | \usepackage{url}
|
---|
| 12 | \usepackage{amssymb,amsmath}
|
---|
[224] | 13 | \usepackage{float}
|
---|
[226] | 14 | \usepackage{tikz}
|
---|
[227] | 15 | \usepackage{fixltx2e}
|
---|
[254] | 16 | \usepackage{rotating}
|
---|
[2] | 17 |
|
---|
[226] | 18 | \usetikzlibrary{arrows,decorations.pathmorphing,backgrounds,positioning,fit,petri}
|
---|
| 19 |
|
---|
| 20 |
|
---|
| 21 |
|
---|
| 22 | \setlength\parindent{0pt}
|
---|
| 23 | \setlength\parskip{\baselineskip}
|
---|
[224] | 24 | \floatstyle{ruled}
|
---|
| 25 | \newfloat{algoritm}{thp}{lop}
|
---|
| 26 | \floatname{algoritm}{Algoritme}
|
---|
| 27 |
|
---|
[242] | 28 | \title{Opdracht 3 \\
|
---|
[224] | 29 | \large{Topics on Parsing and Formal Languages - fall 2010}}
|
---|
[2] | 30 | \author{Rick van der Zwet\\
|
---|
[224] | 31 | \texttt{<hvdzwet@liacs.nl>}}
|
---|
[2] | 32 | \date{\today}
|
---|
| 33 |
|
---|
[224] | 34 |
|
---|
[2] | 35 | \begin{document}
|
---|
[224] | 36 | \newcommand{\DFA}{\emph{DFA}~}
|
---|
| 37 | \newcommand{\qed}{\hfill \ensuremath{\Box}}
|
---|
[238] | 38 | \newcommand{\all}{\Sigma^*}
|
---|
[253] | 39 | \newcommand{\sep}{~|~}
|
---|
[2] | 40 | \maketitle
|
---|
[224] | 41 | \begin{abstract}
|
---|
| 42 | Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek
|
---|
[242] | 43 | \cite{JS2009} gebruikt bij het college. In deze opdracht zullen vijf opgaven
|
---|
[253] | 44 | (1, 5, 6, 8, 14) van hoofdstuk 5 behandeld worden.
|
---|
[224] | 45 | \end{abstract}
|
---|
[2] | 46 |
|
---|
[242] | 47 | \section{Opgave 5.1}
|
---|
[256] | 48 | De grammatica $G$ bestaat uit de volgende producties:
|
---|
| 49 | \begin{equation*}
|
---|
[253] | 50 | \begin{array}{l}
|
---|
| 51 | S \rightarrow AB \sep b \\
|
---|
| 52 | A \rightarrow BC \sep a \\
|
---|
| 53 | B \rightarrow AS \sep CB \sep b \\
|
---|
| 54 | C \rightarrow SS \sep a \\
|
---|
| 55 | \end{array}
|
---|
[256] | 56 | \end{equation*}
|
---|
[224] | 57 |
|
---|
[253] | 58 | Gebruikmakend van het CYK algoritme gaan we aantonen dat $x = babbbab \in L(G)$
|
---|
| 59 | zit. De ondersteunende tabel is van de grootte $6\times6$ omdat dit de lengte
|
---|
[255] | 60 | van het woord $x$ is. In tabel~\ref{tb:opdr1} staat\footnote{Om de \LaTeX~tabel
|
---|
[256] | 61 | automatisch te gegenereren vanuit een woord en een CFG grammatica heb ik
|
---|
[255] | 62 | \url{http://rickvanderzwet.nl/svn/personal/liacs/TPFL2010/assignment3/cyk.py}
|
---|
| 63 | geschreven, vanwege de fouten ik met handwerk maakte.} cel $i,j$ voor welke
|
---|
| 64 | transities er gevolgt moet worden om het
|
---|
| 65 | subwoord $x[i..j]$ te vormen. Omdat de start transitie $S$ in $1,6$ staat zit
|
---|
| 66 | het woord $x$ in $L(G)$. De ontleedboom is te zien in figuur~\ref{fig:opdr1}.
|
---|
[224] | 67 |
|
---|
[253] | 68 |
|
---|
[254] | 69 | \begin{sidewaystable}[htbp]
|
---|
[253] | 70 | \center
|
---|
[255] | 71 | \begin{tabular}{|c||c|c|c|c|c|c|c|}
|
---|
[253] | 72 | \hline
|
---|
[255] | 73 | i\textbackslash j & 1 & 2 & 3 & 4 & 5 & 6 & 7 \\ \hline \hline
|
---|
| 74 | 1 & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,1) \\S: (A,B,2) \\B: (A,S,2) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1) \\B: (C,B,3) \\C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,1) \\S: (A,B,2),(A,B,4) \\A: (B,C,3) \\B: (A,S,4),(C,B,4) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1),(B,C,3),(B,C,4) \\C: (S,S,1),(S,S,5) \\S: (A,B,2),(A,B,4)\\...(A,B,5),(A,B,6) \\B: (A,S,2),(C,B,3)\\...(A,S,4),(C,B,4),(A,S,5)\\...(C,B,5),(A,S,6) \\ \end{tabular} \\ \hline
|
---|
| 75 | 2 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} A \\C \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2) \\B: (A,S,2),(C,B,2) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2) \\B: (C,B,2),(C,B,4) \\A: (B,C,3) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2),(A,B,5),(A,B,6) \\B: (A,S,2),(C,B,2),\\...(C,B,4),(A,S,5),(A,S,6) \\A: (B,C,3) \\C: (S,S,5) \\ \end{tabular} \\ \hline
|
---|
| 76 | 3 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,3) \\B: (C,B,4) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,3) \\B: (C,B,4),(A,S,5),(A,S,6) \\S: (A,B,5),(A,B,6) \\ \end{tabular} \\ \hline
|
---|
| 77 | 4 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} C: (S,S,4) \\ \end{tabular} & \begin{tabular}{l} $\emptyset$ \end{tabular} & \begin{tabular}{l} A: (B,C,4) \\C: (S,S,4) \\B: (C,B,5) \\ \end{tabular} \\ \hline
|
---|
| 78 | 5 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,5) \\S: (A,B,6) \\B: (A,S,6) \\ \end{tabular} \\ \hline
|
---|
| 79 | 6 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} A \\C \\ \end{tabular} & \begin{tabular}{l} S: (A,B,6) \\B: (A,S,6),(C,B,6) \\ \end{tabular} \\ \hline
|
---|
| 80 | 7 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} \\ \hline
|
---|
[253] | 81 |
|
---|
| 82 | \end{tabular}
|
---|
[255] | 83 | \caption{$CYK(L(G),a)$. Algoritme beschreven in \cite{JS2009}[pg.~142]}
|
---|
| 84 | \label{tb:opdr1}
|
---|
[254] | 85 | \end{sidewaystable}
|
---|
[253] | 86 |
|
---|
[255] | 87 | \begin{figure}
|
---|
| 88 | \center
|
---|
| 89 | \begin{tikzpicture}
|
---|
| 90 | [level distance=10mm,level/.style={sibling distance=40mm/#1}]
|
---|
| 91 | \node {S}
|
---|
| 92 | child {node {A}
|
---|
| 93 | child {node {B}
|
---|
| 94 | child {node {b}}
|
---|
| 95 | }
|
---|
| 96 | child {node {C}
|
---|
| 97 | child {node {a}}
|
---|
| 98 | }
|
---|
| 99 | }
|
---|
| 100 | child {node {B}
|
---|
| 101 | child {node {C}
|
---|
| 102 | child {node {S}
|
---|
| 103 | child {node {S}
|
---|
| 104 | child {node {b}
|
---|
| 105 | }
|
---|
| 106 | }
|
---|
| 107 | child {node {S}
|
---|
| 108 | child {node {b}}
|
---|
| 109 | }
|
---|
| 110 | }
|
---|
| 111 | child {node {S}
|
---|
| 112 | child {node {b}}
|
---|
| 113 | }
|
---|
| 114 | }
|
---|
| 115 | child {node {B}
|
---|
| 116 | child {node {A}
|
---|
| 117 | child {node {a}}
|
---|
| 118 | }
|
---|
| 119 | child {node {S}
|
---|
| 120 | child {node {b}}
|
---|
| 121 | }
|
---|
| 122 | }
|
---|
| 123 | }
|
---|
| 124 | ;
|
---|
| 125 | \end{tikzpicture}
|
---|
| 126 | \label{fig:opdr1}
|
---|
| 127 | \caption{Ontleedboom voor het woord $babbbab$}
|
---|
| 128 | \end{figure}
|
---|
| 129 |
|
---|
[242] | 130 | \section{Opgave 5.5}
|
---|
[256] | 131 | Om een LL(1) grammatica te generen voor alle woorden in $\{w \in
|
---|
| 132 | \{a,b\}^*~:~|w|_a = |w|_b\}$ is:
|
---|
| 133 | \begin{equation*}
|
---|
| 134 | S \rightarrow aSbS \sep bSaS \sep \emptyset
|
---|
| 135 | \end{equation*}
|
---|
| 136 | Om aan te tonen dat de grammatica correct is, is het eerst belangrijk om te
|
---|
| 137 | zien dat elke keer dat een $a$ genereerd word er ook automatisch een $b$
|
---|
| 138 | genereerd wordt. Deze dus altijd gelijk zijn.
|
---|
| 139 | Om te laten zien dat deze grammatica \emph{alle} woorden in de taal bevat is
|
---|
| 140 | bewijzen we met inductie naar lengte van het woord. Als $|w| = 0$ dan is $w =
|
---|
| 141 | \emptyset$, deze wordt door de taal herkent.
|
---|
[224] | 142 |
|
---|
[256] | 143 | Neem alle woorden tot lengte $2N$ en een gelijk aantal $a$ en $b$ afleidbaar
|
---|
| 144 | zijn van $S$. Neem nu de string $w'$ met een gelijk aantal $a$ en $b$, een
|
---|
| 145 | lengte van $2(N+1)$ en $a$ als begin symbool. In het slechte geval is $2N+2$
|
---|
| 146 | weer nieuw woord doordat je altijd een extra $T$ kan ontwikkelen en die daarna
|
---|
| 147 | laat terminereren. Bijvoorbeeld $abab \rightarrow abaSbS \rightarrow ababSaSbS
|
---|
| 148 | \rightarrow ababab$.
|
---|
[226] | 149 |
|
---|
[256] | 150 | In de betere gevallen bestaat er een $2 \le j \le 2N+2$ zodaning dat $j$
|
---|
| 151 | aangeeft dat $w[1..j]$ een gelijk aantal $a$ en $b$ heeft, zodanig dat de vorm
|
---|
| 152 | van $w' = aw_1bw_2$. Met inductie kunnen we bewijzen dat $w_1$ en $w_2$
|
---|
| 153 | gemaakt kunnen worden van $S$, wat volgt dat $w'$ ook van $S$ gemaakt kan
|
---|
| 154 | worden.
|
---|
| 155 |
|
---|
[257] | 156 | LL(1) eigenschap wordt bereikt, door naar de \emph{FIRST} te kijken, welke
|
---|
| 157 | respectivelijk $\{a\}, \{b\}, \{\emptyset\}$ zijn. De $FOLLOW(S) =
|
---|
| 158 | \{a,b,\emptyset\}$. Deze twee gegevens samen maken dat de LL(1) bereikt wordt,
|
---|
| 159 | welke ook te zijn is in tabel~\ref{tb:opdr5}.
|
---|
[256] | 160 |
|
---|
[257] | 161 | \begin{table}
|
---|
| 162 | \center
|
---|
| 163 | \begin{tabular}{c||c|c|c}
|
---|
| 164 | y \textbackslash x & a & b & \$ \\
|
---|
| 165 | \hline \hline
|
---|
| 166 | S & $S \rightarrow aSbS$ & $S \rightarrow bSaS$ & $S \rightarrow \emptyset$ \\
|
---|
| 167 | a & pop & & \\
|
---|
| 168 | b & & pop & \\
|
---|
| 169 | \# & & & accept \\
|
---|
| 170 | \end{tabular}
|
---|
| 171 | \caption{Ontleedtabel for Opdracht 5.5}
|
---|
| 172 | \label{tb:opdr5}
|
---|
| 173 | \end{table}
|
---|
| 174 |
|
---|
| 175 |
|
---|
[242] | 176 | \section{Opgave 5.6}
|
---|
[258] | 177 | Laat $G$ een \emph{CFG} zijn zonder 'nutteloze symbolen. Als $G$ een LL(1) grammatica is dan en slechts als, voor willekeurig twee ongelijke producties van de vorm $X \rightarrow \alpha$ en $X \rightarrow \beta$, dan is het volgende geldig, als $x,y \in FOLLOW(X)$ dan $FIRST(\alpha x) \cap FIRST(\beta y) = \emptyset$. De symbolen $x$ en $y$ hoeven niet unique te zijn.
|
---|
[226] | 178 |
|
---|
[258] | 179 | $\Rightarrow$ Als $G$ LL(1) dan moet met behulp van '{e}'{e} symbool de juiste
|
---|
| 180 | transitie gekozen worden. Als we bijvoorbeeld in toestand $X$ zijn dan moet
|
---|
| 181 | onze volgende stap (de $FIRST$) unique \footnote{De eigenschap wordt
|
---|
| 182 | afgedwongen door Stelling 5.3.4 en de bovenstaande definitie op
|
---|
[259] | 183 | \cite{JS2009}[pg.~157]} zijn onafhankelijk wat hier achter wordt gezet.
|
---|
[226] | 184 |
|
---|
[258] | 185 | $\Leftarrow$ Als voor alle willekeurige $x$ en $y$ beiden in $FOLLOW(X)$ beiden
|
---|
| 186 | geen gemeenschapelijke start symbool hebben ($FIRST(\alpha x) \cap FIRST(\beta
|
---|
| 187 | y) = \emptyset$), betekend dat de transities $X \rightarrow \alpha$ en $X
|
---|
| 188 | \rightarrow \beta$ door elkaar te onderscheiden zijn door het eerste symbool.
|
---|
| 189 | Omdat dit geldt voor alle transities is de taal dus herkenbaar door enkel het
|
---|
[259] | 190 | eerste symbool in de transities en dus LL(1). Als ze wel een gemeenschapelijk
|
---|
| 191 | start symbool hebben zijn er minimaal 2 symbolen nodig om de taal te herkennen
|
---|
| 192 | en is deze \underline{niet} LL(1).
|
---|
[258] | 193 |
|
---|
| 194 |
|
---|
[259] | 195 | % \section{Opgave 5.8}
|
---|
| 196 | % Een voorbeeld van een LR(0) grammatica waar er een levensvatbare prefix
|
---|
| 197 | % $\gamma$ bestaat en \emph{item}\footnote{Ik kan geen goede vertaling voor item
|
---|
| 198 | % vinden welke de definie \cite{JS2009}[pg.~145] eer aandoet} $A \rightarrow
|
---|
| 199 | % \bullet, B \rightarrow \alpha \bullet \beta$ welke beiden geldig zijn voor
|
---|
| 200 | % $\gamma$.
|
---|
| 201 | \newpage
|
---|
| 202 | \section{Opgave 5.10}
|
---|
| 203 | Een voorbeeld van een grammatica welke wel $LL(k+1)$ is maar niet $LL(k)$, is gegeven in \cite{STOC69}[pg.~174] en is de grammatica van de taal $\{a^n(b^kd|b|cc)^n : n \ge 1\}$:
|
---|
| 204 | \begin{equation}
|
---|
| 205 | \begin{array}{l}
|
---|
| 206 | S \rightarrow aSA \\
|
---|
| 207 | S \rightarrow aA \\
|
---|
| 208 | A \rightarrow cc \\
|
---|
| 209 | A \rightarrow bB \\
|
---|
| 210 | A \rightarrow \varepsilon \\
|
---|
| 211 | B \rightarrow b^{k-1}d \\
|
---|
| 212 | \end{array}
|
---|
| 213 | \end{equation}
|
---|
[226] | 214 |
|
---|
| 215 |
|
---|
[242] | 216 | \section{Opgave 5.14}
|
---|
[226] | 217 |
|
---|
| 218 |
|
---|
[224] | 219 | \begin{thebibliography}{1}
|
---|
| 220 | \bibitem[JS2009]{JS2009}Jeffrey Shallit, \emph{A second course in formal
|
---|
| 221 | languages and automata theory }, \emph{Cambridge University Press}, 2009.
|
---|
[259] | 222 | \bibitem[STOC69]{STOC69}Rosenkrantz, D. J. and Stearns, R. E., Properties of
|
---|
| 223 | deterministic top down grammars, Proceedings of the first annual
|
---|
| 224 | ACM symposium on Theory of computing, STOC '69, Marina del Rey,
|
---|
| 225 | California, United States, 165--180
|
---|
[2] | 226 | \end{thebibliography}
|
---|
| 227 | \end{document}
|
---|
[259] | 228 |
|
---|