source: liacs/TPFL2010/assignment3/report.tex@ 354

Last change on this file since 354 was 260, checked in by Rick van der Zwet, 14 years ago

5.14 done!

File size: 11.1 KB
Line 
1%
2% $Id: report.tex 571 2008-04-20 17:31:04Z rick $
3%
4
5\documentclass[12pt,a4paper]{article}
6
7\frenchspacing
8\usepackage[english,dutch]{babel}
9\selectlanguage{dutch}
10\usepackage[pdftex]{graphicx}
11\usepackage{url}
12\usepackage{amssymb,amsmath}
13\usepackage{float}
14\usepackage{tikz}
15\usepackage{fixltx2e}
16\usepackage{rotating}
17
18\usetikzlibrary{arrows,decorations.pathmorphing,backgrounds,positioning,fit,petri}
19
20
21
22\setlength\parindent{0pt}
23\setlength\parskip{\baselineskip}
24\floatstyle{ruled}
25\newfloat{algoritm}{thp}{lop}
26\floatname{algoritm}{Algoritme}
27
28\title{Opdracht 3 \\
29\large{Topics on Parsing and Formal Languages - fall 2010}}
30\author{Rick van der Zwet\\
31 \texttt{<hvdzwet@liacs.nl>}}
32\date{\today}
33
34
35\begin{document}
36\newcommand{\DFA}{\emph{DFA}~}
37\newcommand{\qed}{\hfill \ensuremath{\Box}}
38\newcommand{\all}{\Sigma^*}
39\newcommand{\sep}{~|~}
40\maketitle
41\begin{abstract}
42Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek
43\cite{JS2009} gebruikt bij het college. In deze opdracht zullen vijf opgaven
44(1, 5, 6, 8, 14) van hoofdstuk 5 behandeld worden.
45\end{abstract}
46
47\section{Opgave 5.1}
48De grammatica $G$ bestaat uit de volgende producties:
49\begin{equation*}
50\begin{array}{l}
51S \rightarrow AB \sep b \\
52A \rightarrow BC \sep a \\
53B \rightarrow AS \sep CB \sep b \\
54C \rightarrow SS \sep a \\
55\end{array}
56\end{equation*}
57
58Gebruikmakend van het CYK algoritme gaan we aantonen dat $x = babbbab \in L(G)$
59zit. De ondersteunende tabel is van de grootte $6\times6$ omdat dit de lengte
60van het woord $x$ is. In tabel~\ref{tb:opdr1} staat\footnote{Om de \LaTeX~tabel
61automatisch te gegenereren vanuit een woord en een CFG grammatica heb ik
62\url{http://rickvanderzwet.nl/svn/personal/liacs/TPFL2010/assignment3/cyk.py}
63geschreven, vanwege de fouten ik met handwerk maakte.} cel $i,j$ voor welke
64transities er gevolgt moet worden om het
65subwoord $x[i..j]$ te vormen. Omdat de start transitie $S$ in $1,6$ staat zit
66het woord $x$ in $L(G)$. De ontleedboom is te zien in figuur~\ref{fig:opdr1}.
67
68
69\begin{sidewaystable}[htbp]
70\center
71\begin{tabular}{|c||c|c|c|c|c|c|c|}
72\hline
73i\textbackslash j & 1 & 2 & 3 & 4 & 5 & 6 & 7 \\ \hline \hline
74 1 & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,1) \\S: (A,B,2) \\B: (A,S,2) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1) \\B: (C,B,3) \\C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,1) \\S: (A,B,2),(A,B,4) \\A: (B,C,3) \\B: (A,S,4),(C,B,4) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,1),(B,C,3),(B,C,4) \\C: (S,S,1),(S,S,5) \\S: (A,B,2),(A,B,4)\\...(A,B,5),(A,B,6) \\B: (A,S,2),(C,B,3)\\...(A,S,4),(C,B,4),(A,S,5)\\...(C,B,5),(A,S,6) \\ \end{tabular} \\ \hline
75 2 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} A \\C \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2) \\B: (A,S,2),(C,B,2) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2) \\B: (C,B,2),(C,B,4) \\A: (B,C,3) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} S: (A,B,2),(A,B,5),(A,B,6) \\B: (A,S,2),(C,B,2),\\...(C,B,4),(A,S,5),(A,S,6) \\A: (B,C,3) \\C: (S,S,5) \\ \end{tabular} \\ \hline
76 3 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} C: (S,S,3) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,3) \\B: (C,B,4) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} A: (B,C,3) \\B: (C,B,4),(A,S,5),(A,S,6) \\S: (A,B,5),(A,B,6) \\ \end{tabular} \\ \hline
77 4 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} C: (S,S,4) \\ \end{tabular} & \begin{tabular}{l} $\emptyset$ \end{tabular} & \begin{tabular}{l} A: (B,C,4) \\C: (S,S,4) \\B: (C,B,5) \\ \end{tabular} \\ \hline
78 5 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} & \begin{tabular}{l} A: (B,C,5) \\ \end{tabular} & \begin{tabular}{l} C: (S,S,5) \\S: (A,B,6) \\B: (A,S,6) \\ \end{tabular} \\ \hline
79 6 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} A \\C \\ \end{tabular} & \begin{tabular}{l} S: (A,B,6) \\B: (A,S,6),(C,B,6) \\ \end{tabular} \\ \hline
80 7 & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} \end{tabular} & \begin{tabular}{l} S \\B \\ \end{tabular} \\ \hline
81
82\end{tabular}
83\caption{$CYK(L(G),a)$. Algoritme beschreven in \cite{JS2009}[pg.~142]}
84\label{tb:opdr1}
85\end{sidewaystable}
86
87\begin{figure}
88\center
89\begin{tikzpicture}
90 [level distance=10mm,level/.style={sibling distance=40mm/#1}]
91 \node {S}
92 child {node {A}
93 child {node {B}
94 child {node {b}}
95 }
96 child {node {C}
97 child {node {a}}
98 }
99 }
100 child {node {B}
101 child {node {C}
102 child {node {S}
103 child {node {S}
104 child {node {b}
105 }
106 }
107 child {node {S}
108 child {node {b}}
109 }
110 }
111 child {node {S}
112 child {node {b}}
113 }
114 }
115 child {node {B}
116 child {node {A}
117 child {node {a}}
118 }
119 child {node {S}
120 child {node {b}}
121 }
122 }
123 }
124 ;
125\end{tikzpicture}
126\label{fig:opdr1}
127\caption{Ontleedboom voor het woord $babbbab$}
128\end{figure}
129
130\section{Opgave 5.5}
131Om een LL(1) grammatica te generen voor alle woorden in $\{w \in
132\{a,b\}^*~:~|w|_a = |w|_b\}$ is:
133\begin{equation*}
134S \rightarrow aSbS \sep bSaS \sep \emptyset
135\end{equation*}
136Om aan te tonen dat de grammatica correct is, is het eerst belangrijk om te
137zien dat elke keer dat een $a$ genereerd word er ook automatisch een $b$
138genereerd wordt. Deze dus altijd gelijk zijn.
139Om te laten zien dat deze grammatica \emph{alle} woorden in de taal bevat is
140bewijzen we met inductie naar lengte van het woord. Als $|w| = 0$ dan is $w =
141\emptyset$, deze wordt door de taal herkent.
142
143Neem alle woorden tot lengte $2N$ en een gelijk aantal $a$ en $b$ afleidbaar
144zijn van $S$. Neem nu de string $w'$ met een gelijk aantal $a$ en $b$, een
145lengte van $2(N+1)$ en $a$ als begin symbool. In het slechte geval is $2N+2$
146weer nieuw woord doordat je altijd een extra $T$ kan ontwikkelen en die daarna
147laat terminereren. Bijvoorbeeld $abab \rightarrow abaSbS \rightarrow ababSaSbS
148\rightarrow ababab$.
149
150In de betere gevallen bestaat er een $2 \le j \le 2N+2$ zodaning dat $j$
151aangeeft dat $w[1..j]$ een gelijk aantal $a$ en $b$ heeft, zodanig dat de vorm
152van $w' = aw_1bw_2$. Met inductie kunnen we bewijzen dat $w_1$ en $w_2$
153gemaakt kunnen worden van $S$, wat volgt dat $w'$ ook van $S$ gemaakt kan
154worden.
155
156LL(1) eigenschap wordt bereikt, door naar de \emph{FIRST} te kijken, welke
157respectivelijk $\{a\}, \{b\}, \{\emptyset\}$ zijn. De $FOLLOW(S) =
158\{a,b,\emptyset\}$. Deze twee gegevens samen maken dat de LL(1) bereikt wordt,
159welke ook te zijn is in tabel~\ref{tb:opdr5}.
160
161\begin{table}
162\center
163\begin{tabular}{c||c|c|c}
164y \textbackslash x & a & b & \$ \\
165\hline \hline
166S & $S \rightarrow aSbS$ & $S \rightarrow bSaS$ & $S \rightarrow \emptyset$ \\
167a & pop & & \\
168b & & pop & \\
169\# & & & accept \\
170\end{tabular}
171\caption{Ontleedtabel for Opdracht 5.5}
172\label{tb:opdr5}
173\end{table}
174
175
176\section{Opgave 5.6}
177Laat $G$ een \emph{CFG} zijn zonder 'nutteloze symbolen. Als $G$ een LL(1) grammatica is dan en slechts als, voor willekeurig twee ongelijke producties van de vorm $X \rightarrow \alpha$ en $X \rightarrow \beta$, dan is het volgende geldig, als $x,y \in FOLLOW(X)$ dan $FIRST(\alpha x) \cap FIRST(\beta y) = \emptyset$. De symbolen $x$ en $y$ hoeven niet unique te zijn.
178
179$\Rightarrow$ Als $G$ LL(1) dan moet met behulp van '{e}'{e} symbool de juiste
180transitie gekozen worden. Als we bijvoorbeeld in toestand $X$ zijn dan moet
181onze volgende stap (de $FIRST$) unique \footnote{De eigenschap wordt
182afgedwongen door Stelling 5.3.4 en de bovenstaande definitie op
183\cite{JS2009}[pg.~157]} zijn onafhankelijk wat hier achter wordt gezet.
184
185$\Leftarrow$ Als voor alle willekeurige $x$ en $y$ beiden in $FOLLOW(X)$ beiden
186geen gemeenschapelijke start symbool hebben ($FIRST(\alpha x) \cap FIRST(\beta
187y) = \emptyset$), betekend dat de transities $X \rightarrow \alpha$ en $X
188\rightarrow \beta$ door elkaar te onderscheiden zijn door het eerste symbool.
189Omdat dit geldt voor alle transities is de taal dus herkenbaar door enkel het
190eerste symbool in de transities en dus LL(1). Als ze wel een gemeenschapelijk
191start symbool hebben zijn er minimaal 2 symbolen nodig om de taal te herkennen
192en is deze \underline{niet} LL(1).
193
194
195% \section{Opgave 5.8}
196% Een voorbeeld van een LR(0) grammatica waar er een levensvatbare prefix
197% $\gamma$ bestaat en \emph{item}\footnote{Ik kan geen goede vertaling voor item
198% vinden welke de definie \cite{JS2009}[pg.~145] eer aandoet} $A \rightarrow
199% \bullet, B \rightarrow \alpha \bullet \beta$ welke beiden geldig zijn voor
200% $\gamma$.
201\newpage
202\section{Opgave 5.10}
203Een voorbeeld van een grammatica welke wel $LL(k+1)$ is maar niet $LL(k)$, is
204gegeven in context van het aantonen dat voor elke $k > 0$ de $L(k+1)$ talen
205niet de $L(k)$ talen zijn. \cite{STOC69}[pg.~174] en is de grammatica van de
206taal $\{a^n(b^kd|b|cc)^n : n \ge 1\}$:
207\begin{equation*}
208\begin{array}{l}
209S \rightarrow aSA \\
210S \rightarrow aA \\
211A \rightarrow cc \\
212A \rightarrow bB \\
213A \rightarrow \epsilon \\
214B \rightarrow b^{k-1}d \\
215\end{array}
216\end{equation*}
217
218
219\section{Opgave 5.14}
220Laat $G$ een LR(0) grammatica zijn met $A \rightarrow \alpha \bullet, \alpha
221\ne \epsilon$, welke geldig is voor een levensvatbare prefix $\gamma$ er geen
222enkel ander \emph{item} kan geldig zijn voor $\gamma$. Als er een \emph{item}
223van de vorm $A \rightarrow \alpha B$ is levert dit een shift-reduce error op.
224Als er een \emph{item} van de vorm $A \rightarrow \beta \bullet : \alpha \ne
225\beta$ zal het betekenen dat er een \emph{item} 'vooraf' aan gegaan $A
226\rightarrow \bullet \alpha$ \underline{en} $A \rightarrow \bullet \beta$, wat
227niet mogelijk is omdat enkel de eerste geldig kan zijn per definitie.
228
229
230\begin{thebibliography}{1}
231\bibitem[JS2009]{JS2009}Jeffrey Shallit, \emph{A second course in formal
232languages and automata theory }, \emph{Cambridge University Press}, 2009.
233\bibitem[STOC69]{STOC69}Rosenkrantz, D. J. and Stearns, R. E., Properties of
234deterministic top down grammars, Proceedings of the first annual
235ACM symposium on Theory of computing, STOC '69, Marina del Rey,
236California, United States, 165--180
237\end{thebibliography}
238\end{document}
239
Note: See TracBrowser for help on using the repository browser.