[2] | 1 | %
|
---|
| 2 | % $Id: report.tex 571 2008-04-20 17:31:04Z rick $
|
---|
| 3 | %
|
---|
| 4 |
|
---|
| 5 | \documentclass[12pt,a4paper]{article}
|
---|
| 6 |
|
---|
| 7 | \frenchspacing
|
---|
| 8 | \usepackage[english,dutch]{babel}
|
---|
| 9 | \selectlanguage{dutch}
|
---|
[224] | 10 | \usepackage[pdftex]{graphicx}
|
---|
[2] | 11 | \usepackage{url}
|
---|
| 12 | \usepackage{amssymb,amsmath}
|
---|
[224] | 13 | \usepackage{float}
|
---|
[226] | 14 | \usepackage{tikz}
|
---|
[227] | 15 | \usepackage{fixltx2e}
|
---|
[2] | 16 |
|
---|
[226] | 17 | \usetikzlibrary{arrows,decorations.pathmorphing,backgrounds,positioning,fit,petri}
|
---|
| 18 |
|
---|
| 19 |
|
---|
| 20 |
|
---|
| 21 | \setlength\parindent{0pt}
|
---|
| 22 | \setlength\parskip{\baselineskip}
|
---|
[224] | 23 | \floatstyle{ruled}
|
---|
| 24 | \newfloat{algoritm}{thp}{lop}
|
---|
| 25 | \floatname{algoritm}{Algoritme}
|
---|
| 26 |
|
---|
| 27 | \title{Opdracht 1 \\
|
---|
| 28 | \large{Topics on Parsing and Formal Languages - fall 2010}}
|
---|
[2] | 29 | \author{Rick van der Zwet\\
|
---|
[224] | 30 | \texttt{<hvdzwet@liacs.nl>}}
|
---|
[2] | 31 | \date{\today}
|
---|
| 32 |
|
---|
[224] | 33 |
|
---|
[2] | 34 | \begin{document}
|
---|
[224] | 35 | \newcommand{\DFA}{\emph{DFA}~}
|
---|
| 36 | \newcommand{\qed}{\hfill \ensuremath{\Box}}
|
---|
[2] | 37 | \maketitle
|
---|
[224] | 38 | \begin{abstract}
|
---|
| 39 | Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek
|
---|
| 40 | \cite{JS2009} gebruikt bij het college. In deze opdracht zullen zeven opgaven
|
---|
[243] | 41 | (3,20,22,47,54,68,69) van hoofdstuk 3 behandeld worden.
|
---|
[224] | 42 | \end{abstract}
|
---|
[2] | 43 |
|
---|
[224] | 44 | \section{Opgave 3.3}
|
---|
| 45 | Als $L \subseteq \Sigma^*$ is regulier dan is de taal
|
---|
| 46 | \begin{equation}
|
---|
| 47 | 2L := {a_1,a_1,a_2,a_2,\ldots,a_k,a_k}~:~elke~a_i \in \Sigma~en~a_1a_2{\cdots}a_k \in L
|
---|
| 48 | \end{equation}
|
---|
| 49 | regulier. Zie dat er een `verdubbeling' optreed van symbolen, dit gedrag is de
|
---|
[229] | 50 | modelleren in een \DFA. Omdat $L$ regulier is bestaat er een \DFA $M =
|
---|
| 51 | (Q,\Sigma,\delta,q_0,F)$ die $L$ beschrijft. Construeer nu een nieuwe \DFA $P$
|
---|
[224] | 52 | die de nieuwe taal $2L$ gaat beschrijven, neem hiervoor het alfabet ($\Sigma$),
|
---|
[229] | 53 | en de begintoestand $q_0$ over van $L$. De toestanden ($Q$) worden verdubbeld.
|
---|
[224] | 54 | $voor~alle~q \in Q:~voeg~q'~toe~aan~Q$. Neem ook de transities over van $M$,
|
---|
[229] | 55 | maar maak aanpassingen zodanig dat de nieuwe toestanden ook gelezen worden. Dus
|
---|
[224] | 56 | $\delta(q,x)$ wordt $\delta(q,q'),\delta(q',x)$. De acceptatie toestand $F$
|
---|
[243] | 57 | is gelijkt aan de oude acceptatie toestand.
|
---|
[226] | 58 | \\
|
---|
[229] | 59 | De nieuwe \DFA $P$ beschrijft $2L$ en dus is $2L$ regulier.
|
---|
[224] | 60 | \qed
|
---|
| 61 |
|
---|
| 62 |
|
---|
[225] | 63 | \section{Opgave 3.20}
|
---|
[243] | 64 | Laat $\Sigma = \{0,1\}$ zijn. Een voorbeeld van de taal $L \subseteq
|
---|
[225] | 65 | \Sigma^*$ voor welke geldt dat, de Myhill-Nerode\cite{JS2009}[pg. 77--81]
|
---|
[229] | 66 | gelijkheid relatie $R_L$ de eigenschap heeft dat elk woord in $\Sigma^*$ zijn
|
---|
[244] | 67 | eigen equivalentie klasse is. Dit wilt zeggen dat $xR_{l}y$ dan en slechts dan
|
---|
| 68 | voor alle $z \in \Sigma^*$, is er een $xz \in L$ dan en slechts als $yz \in L$.
|
---|
| 69 | Omdat hier gezocht wordt naar een taal waarbij de woorden allemaal equivalentie
|
---|
| 70 | klassen op-zich zijn, zal alle elementen met elkaar vergeleken kunnen worden
|
---|
| 71 | door middel van $R_L$ en hier mogen geen positieve 'gevallen' uitkomen.
|
---|
[224] | 72 |
|
---|
[244] | 73 | De (triviale) taal $L = {01,10}$ is een voorbeeld hiervan. Beiden woorden hebben
|
---|
| 74 | hun eigen klasse. Als $x = 0$ en $y = 1$, bestaat er een $z = 1$, zodanig dat
|
---|
| 75 | $xz \in L, yz \notin L$.
|
---|
[226] | 76 |
|
---|
[245] | 77 | De taal $M = \{{0}^* : |M|_0~is~een~priemgetal\}$ is een ander voorbeeld. Als we
|
---|
[244] | 78 | kijken naar $aR_{l}b$ kan er altijd een $z$ gevormd worden zodanig dat $az \in
|
---|
| 79 | M, bz \notin M$. Bijvoorbeeld $a = 0^3, b =0^5, z = 0^4$. Deze eigenschap wordt
|
---|
| 80 | afgedwongen door het `feit' dat er geen relatie bestaat tussen de lengtes
|
---|
| 81 | tussen opeenvolgende priemgetallen.\footnote{Ik heb dit voor gemak aangenomen,
|
---|
| 82 | de praktijk is echter dat is nog een groot wiskundig vraagstuk is.}
|
---|
[226] | 83 |
|
---|
[244] | 84 |
|
---|
| 85 | \section{Opgave 3.22*}
|
---|
[229] | 86 | Om aan te tonen dat een \emph{2DFA} exponentieel meer expressief is dan een
|
---|
[226] | 87 | \DFA voor bepaalde talen kijken we naar de volgende taal; Laat $n$ een integer
|
---|
[229] | 88 | $\ge1$ en $F_n \subseteq \{0,1,2,3,4\}^*$ als volgende gedefinieerd:
|
---|
[226] | 89 | \begin{equation}
|
---|
[244] | 90 | F_n = \{3~0^{i_1}~1~0^{i_2} \cdots 1~0^{i_n}~2^k~0^{i_k}~4 : 1 \le k,j,i_j \le n\}
|
---|
[226] | 91 | \end{equation}
|
---|
| 92 |
|
---|
| 93 | Als eerste kan de $F_n$ door een \emph{2DFA} van $O(n)$ toestanden geaccepteerd
|
---|
| 94 | worden, welke aan te tonen is door eerst te kijken naar de eigenschappen van
|
---|
[245] | 95 | $F_n$ hierbij is de zien dat de $0$-reeks van de lengte $i_k$ zowel voor als na
|
---|
[226] | 96 | de $2^k$ moet voorkomen. Waarbij $2^k$ aangeeft, waar deze $0$-reeks gevonden
|
---|
[245] | 97 | kan worden bij de plek $k$. De \emph{2DFA} moet dus twee dingen doen. Het
|
---|
[226] | 98 | aantal keer nul op twee plekken vergelijken. Waarbij 1 plek vast staat en de
|
---|
[245] | 99 | tweede plek variabele wordt gedefinieerd. De aanpak kan als volgt gezien worden:
|
---|
| 100 | \begin{verbatim}
|
---|
| 101 | 1. controleren of |1| <= 2de 0-reeks (dmv 'knopen-strook').
|
---|
| 102 | 2. |2| tellen (onthouden dmv 'knopen-strook', dit is `variable' A).
|
---|
| 103 | 3. naar begin lopen.
|
---|
| 104 | 4. A-1 '1' instanties laten passeren.
|
---|
| 105 | 5. |0| tellen (onthouden dmv 'knopen-strook'm dit is `variable' A).
|
---|
| 106 | 6. naar begin 2de 0-reeks lopen.
|
---|
| 107 | 7. 0-reeks vergelijken.
|
---|
| 108 | \end{verbatim}
|
---|
| 109 | Voor deze aanpak zijn 3 `knopen-stroken' nodig en 3 transitie-lagen. In totaal
|
---|
| 110 | dus in ongeveer $O(6n)$ knopen. Figuur~\ref{fig:2dfa} laat de \emph{2DFA}
|
---|
| 111 | zien.
|
---|
[226] | 112 |
|
---|
| 113 |
|
---|
| 114 | \begin{figure}
|
---|
| 115 | \center
|
---|
| 116 | \begin{tikzpicture}
|
---|
[245] | 117 | \node[place,pin={[pin edge={style=<-,blue,thick,decorate,decoration={snake, pre length=4pt}}]left:}] (q00) {};
|
---|
| 118 | \node[place] (q01) [right=of q00] {};
|
---|
| 119 | \node[place] (q02) [right=of q01] {};
|
---|
| 120 | \node[place] (q03) [right=of q02] {};
|
---|
| 121 | \node[place] (q11) [below=of q01] {};
|
---|
| 122 | \node[place] (q12) [below=of q02] {};
|
---|
| 123 | \node[place] (q13) [below=of q03] {};
|
---|
| 124 | \node[place] (q10) [below=of q00] {};
|
---|
| 125 | \node[place] (q20) [below=of q10] {};
|
---|
| 126 | \node[place] (q21) [below=of q11] {};
|
---|
| 127 | \node[place] (q22) [below=of q12] {};
|
---|
| 128 | %\node[place] (q2) [below=of q1] {};
|
---|
| 129 | %\node[place,pin={[pin edge={style=-<,thick,decorate,decoration={snake, pre length=4pt}}]below:}] (q3) [below=of q2] {};
|
---|
| 130 | %\node[place] (q01) [right=3cm of q1] {};
|
---|
| 131 | %\node[place] (q02) [right=3cm of q2] {};
|
---|
[226] | 132 | \path[->]
|
---|
[245] | 133 | % (q0) edge [decorate,decoration={snake}] node[left] {goto-2} (q00)
|
---|
| 134 | (q00) edge node[above] {3,R} (q01)
|
---|
| 135 | (q01) edge node[above] {1,R} (q02)
|
---|
| 136 | (q01) edge [loop above] node[above] {0,R} (q01)
|
---|
| 137 | (q02) edge node[above] {1,R} (q03)
|
---|
| 138 | (q02) edge [loop above] node[above] {0,R} (q02)
|
---|
| 139 | (q03) edge [loop above] node[above] {0,R} (q03)
|
---|
| 140 |
|
---|
| 141 | (q11) edge node[above] {0,L} (q10)
|
---|
| 142 | (q12) edge [bend left] node[below] {0,L} (q10)
|
---|
| 143 | (q13) edge [bend left] node[below] {0,L} (q10)
|
---|
| 144 |
|
---|
| 145 | (q01) edge node {2,R} (q11)
|
---|
| 146 | (q02) edge node {2,R} (q12)
|
---|
| 147 | (q03) edge node {2,R} (q13)
|
---|
| 148 | (q13) edge node[above] {2,R} (q12)
|
---|
| 149 | (q12) edge node[above] {2,R} (q11)
|
---|
| 150 |
|
---|
| 151 | (q10) edge node {2,L} (q20)
|
---|
| 152 | (q20) edge node[below] {2,L} (q21)
|
---|
| 153 | (q21) edge node[below] {2,L} (q22)
|
---|
| 154 |
|
---|
| 155 |
|
---|
| 156 | % (q1) edge node[left] {2} (q2)
|
---|
| 157 | % (q2) edge node[left] {2} (q3)
|
---|
| 158 | % (q1) edge [decorate,decoration={snake}] node[above] {0-length-check} (q01)
|
---|
| 159 | % (q2) edge [decorate,decoration={snake}] node[above] {0-length-check} (q02)
|
---|
[226] | 160 | ;
|
---|
| 161 | \end{tikzpicture}
|
---|
[245] | 162 | \caption{Opdracht 2.22a uitgewerkt voor $n = 3$, niet geldige stappen zijn niet genoemd en moet allen naar een 'trap' knoop gestuurd worden}
|
---|
| 163 | \label{fig:2dfa}
|
---|
[226] | 164 | \end{figure}
|
---|
| 165 |
|
---|
| 166 | Om te laten zien dat een \DFA minstens $n^n$ toestanden nodig heeft moet je
|
---|
| 167 | gebruik maken van het feit dan een \DFA niet terug kan lopen. Het zal dus een
|
---|
| 168 | `geheugen' moeten maken om het maximale $0$ woord voor de `splitsing' ($2^k$)
|
---|
| 169 | te kunnen onthouden om zo te kijken of het overeen komt het $0$ woord na de
|
---|
| 170 | `splitsing'. Omdat je voor elke $F_i$ waarbij $1 \ge i \ge n$ minimaal $n$
|
---|
| 171 | toestanden nodig hebt om te kunnen tellen en hiervan weer $n$ unieke sets
|
---|
| 172 | bestaan, heb je dus minimaal $n^n$ toestanden nodig.
|
---|
| 173 |
|
---|
[227] | 174 | \section{Opgave 3.47}
|
---|
[226] | 175 |
|
---|
[227] | 176 | Om te bewijzen dat `de klasse van talen geaccepteerd door \DFA' => `de klasse van
|
---|
| 177 | talen gespecificeerd door de reguliere expressies'\cite{JS2009}[Theorem 1.4.2, (b) => (a)]
|
---|
| 178 | aan de hand van het volgende voorbeeld:
|
---|
| 179 | Laat $M = (Q,\Sigma, \delta, q_1,F)$ een \DFA zijn, waarbij $Q =
|
---|
[229] | 180 | \{q_1,q_2,\ldots,q_n\}$. Definieer nu $R_{i,j,k}$ als de taal van alle woorden
|
---|
[227] | 181 | die van toestand $i$ naar toestand $j$ gaan zonder door toestanden te gaan die
|
---|
| 182 | hoger als $k$ genummerd zijn.
|
---|
[226] | 183 |
|
---|
[229] | 184 | Om dit te doen is een recursieve formule nodig, welke $R_{i,j,k}$ als invoer
|
---|
[227] | 185 | heeft. a) Kijk welke transities er mogelijk zijn in $\delta$ met toestand $i$ als
|
---|
| 186 | begin positie. Plaats deze op de `stapel'. b) Werk de elementen op de stapel
|
---|
| 187 | stuk voor stuk af volgens dezelfde methodiek. Stop pas als de $\delta$
|
---|
| 188 | resultaat $j$ bevat. Let erop dat oneindige herhalingen gedetecteerd moeten
|
---|
| 189 | worden om het algoritme te laten termineren. Je kan het zien als het volledig
|
---|
| 190 | doorzoeken van een boom met in de wortel de knoop $i$.
|
---|
[226] | 191 |
|
---|
[224] | 192 | \section{Opgave 3.54}
|
---|
[227] | 193 |
|
---|
[229] | 194 | Laat $\Sigma = \{1,2,3,\ldots,n\}$ zijn en definieer:
|
---|
[227] | 195 | \begin{equation}
|
---|
| 196 | L_n = \{w \in \Sigma^* : |w|_i = 1~voor~alle~i\}
|
---|
| 197 | \end{equation}
|
---|
| 198 | Dit zijn dus de woorden waarbij alle elementen precies \'{e}\'{e}n keer in voor
|
---|
| 199 | komen. Bijvoorbeeld $L_3 = \{123,132,213,231,312,321\}$.
|
---|
| 200 |
|
---|
| 201 | Om te laten zijn dat er minimal een reguliere expressie van lengte $2^{n-1}$
|
---|
| 202 | nodig is om $L_n$ te specificeren, moet de \emph{Myhill-Nerode} stelling
|
---|
| 203 | toegepast worden. Vanwege de eigenschap dat prefix uniek is, zat het nooit
|
---|
| 204 | mogelijk worden om aan beiden woorden hetzelfde toe te voegen zodanig dat ze in
|
---|
| 205 | elkaars klasse terecht komen. (elk `bit' informatie is relevant). Voor alle
|
---|
| 206 | klasse zal dus apart gekeken worden of aan de eisen voldaan wordt. Om dus alle
|
---|
| 207 | getallen $n$ van de string te controleren of zij uniek is zijn minimaal
|
---|
| 208 | $2^{n-1}$ toestanden nodig.
|
---|
| 209 |
|
---|
| 210 | Echter voor $\overline{L_n}$ is wel een reguliere expressie te vinden en wel
|
---|
| 211 | in de grootte $O(n^2)$. Door simpelweg voor elke $i \in \Sigma^*$ een reguliere
|
---|
| 212 | expressie te maken van de vorm $x^*~i~x^*~i~x^*$ waarbij $x = Sigma^* - i$.
|
---|
| 213 |
|
---|
[224] | 214 | \section{Opgave 3.68}
|
---|
[227] | 215 |
|
---|
| 216 | Voor een woord $w \in \Sigma^*$, is een palc($w$) de korte palindroom $x$
|
---|
| 217 | zodanig dat $w$ een prefix is van $x$. en palc($L$) = $\bigcup_{w \in L}\{palc(w)\}$.
|
---|
| 218 |
|
---|
| 219 | Om te laten zien dat palc($w$) = $wt^{-1}w^R$, waarbij $wt^{-1}$ het woord is $w$
|
---|
[229] | 220 | waar het suffix $t$ eraf gehaald is en $t$ de langste palindroom suffix van $w$
|
---|
[227] | 221 | is, moet er gebruik gemaakt worden van een tegenstelling. Als $w$ nog een
|
---|
| 222 | palindroom aan het einde zal bevatten $uu$, dan ziet $x$ er als volgt uit
|
---|
| 223 | $wuuuuw$, dit is niet de korte palindroom ($ww$), welke $uuuu$ er nog makkelijk
|
---|
[229] | 224 | uit weggehaald had kunnen worden. Een willekeurige suffix van $w$ kan ook geen
|
---|
[227] | 225 | palindroom vormen die nog `weggesneden' kan worden, omdat hij anders al in den
|
---|
| 226 | beginne een palindroom had moeten zijn.
|
---|
| 227 |
|
---|
[229] | 228 | Als $L$ is regulier, dan is palc($L$) ook regulier, welke er een unieke
|
---|
[227] | 229 | `vertaling' van een woord $w$ naar zijn palc($w$). De nieuwe woorden zullen in
|
---|
| 230 | het slechtste geval evenveel blijven, maar de taal kan ook kleiner worden.
|
---|
| 231 |
|
---|
| 232 | De andere kant op geldt dit \underline{niet}, als $L$ regulier is, dan is het
|
---|
| 233 | onbeslist of palc\textsuperscript{-1}($L$) ook regulier is. Het kan namelijk
|
---|
[229] | 234 | zeer goed dat een (ingewikkelde) functie die woorden genereerde welke een
|
---|
| 235 | palindroom zijn en die aan een vast prefix ($p$) toegevoegd. De \emph{palc}
|
---|
[227] | 236 | functie zal deze allen naar \'{e}\'{e}n woord omzetten, welke dan regulier is.
|
---|
| 237 |
|
---|
| 238 |
|
---|
[224] | 239 | \section{Opgave 3.69}
|
---|
| 240 |
|
---|
[227] | 241 | Laat $x_1,x_2,\ldots,x_k \in \Sigma^*$. Om te laten zien dat $\Sigma^* -
|
---|
| 242 | x_{1}^{*}x_{2}^{*} \cdots x_{k}^*$ eindig is dan en slechts als $|\Sigma| = 1$
|
---|
| 243 | en gcd($|x_1|,|x_2|,\ldots,|x_k|$) = 1 moet er een paar dingen bewezen worden
|
---|
| 244 | a) aantonen dat het \underline{niet} geldt voor de tegenvoorbeelden a) $gcd
|
---|
| 245 | > 1$ b) $|\Sigma| > 1$ en tevens moet aangetoond worden waarom de eindigheid
|
---|
[228] | 246 | voor dit specifieke geval geldt.
|
---|
[227] | 247 |
|
---|
[228] | 248 | Merk op dat met een gcd van 1 alle getallen in de verzameling \{1,
|
---|
| 249 | priemgetallen\} zitten. Bij een alfabet van 1 letter hoeft er enkel maar
|
---|
| 250 | gesproken worden over lengtes. Standaard zitten alle lengtes in de taal.
|
---|
| 251 | Aangezien de `deel-lengtes' ($x_1,x_2,\ldots,x_k$) nul of meer keer in de
|
---|
| 252 | verzameling in de verzameling mogen zitten. Zal je uiteindelijk overblijven met
|
---|
| 253 | een eindige set lengtes. In het geval dat er lengte 1 gevonden wordt, zal zelfs
|
---|
| 254 | de lege set het antwoord zijn.
|
---|
| 255 |
|
---|
| 256 | a) Als $|\Sigma| > 1$, bijvoorbeeld $\{1,2\}$ dan kan er een oneindige
|
---|
| 257 | verzameling gemaakt worden, door $x_1,x_2,\ldots,x_k \in 1^*$. De $2*$ zal dan een
|
---|
| 258 | oneindige verzameling vormen.
|
---|
| 259 |
|
---|
| 260 | b) $gcd > 1$, bijvoorbeeld $2$ dan kan er een oneindige verzameling gemaakt
|
---|
| 261 | worden, doordat niet alle woorden gemaakt kunnen worden. Enkel worden van
|
---|
| 262 | `even' lengte in dit geval. Waardoor de `oneven' woorden een eindige string
|
---|
| 263 | gaan vormen. Bij grotere waardes ($r$) kunnen ook 'groepen' (de $|r|* - 1$)
|
---|
| 264 | bijvoorbeeld niet meer bereikt worden, welke dan tot een oneindige verzameling
|
---|
| 265 | kunnen groeien.
|
---|
| 266 |
|
---|
[224] | 267 | \begin{thebibliography}{1}
|
---|
| 268 | \bibitem[JS2009]{JS2009}Jeffrey Shallit, \emph{A second course in formal
|
---|
| 269 | languages and automata theory }, \emph{Cambridge University Press}, 2009.
|
---|
[2] | 270 | \end{thebibliography}
|
---|
| 271 | \newpage
|
---|
| 272 | \end{document}
|
---|