[2] | 1 | %
|
---|
| 2 | % $Id: report.tex 571 2008-04-20 17:31:04Z rick $
|
---|
| 3 | %
|
---|
| 4 |
|
---|
| 5 | \documentclass[12pt,a4paper]{article}
|
---|
| 6 |
|
---|
| 7 | \frenchspacing
|
---|
| 8 | \usepackage[english,dutch]{babel}
|
---|
| 9 | \selectlanguage{dutch}
|
---|
[224] | 10 | \usepackage[pdftex]{graphicx}
|
---|
[2] | 11 | \usepackage{url}
|
---|
| 12 | \usepackage{amssymb,amsmath}
|
---|
[224] | 13 | \usepackage{float}
|
---|
[226] | 14 | \usepackage{tikz}
|
---|
[227] | 15 | \usepackage{fixltx2e}
|
---|
[2] | 16 |
|
---|
[226] | 17 | \usetikzlibrary{arrows,decorations.pathmorphing,backgrounds,positioning,fit,petri}
|
---|
| 18 |
|
---|
| 19 |
|
---|
| 20 |
|
---|
| 21 | \setlength\parindent{0pt}
|
---|
| 22 | \setlength\parskip{\baselineskip}
|
---|
[224] | 23 | \floatstyle{ruled}
|
---|
| 24 | \newfloat{algoritm}{thp}{lop}
|
---|
| 25 | \floatname{algoritm}{Algoritme}
|
---|
| 26 |
|
---|
| 27 | \title{Opdracht 1 \\
|
---|
| 28 | \large{Topics on Parsing and Formal Languages - fall 2010}}
|
---|
[2] | 29 | \author{Rick van der Zwet\\
|
---|
[224] | 30 | \texttt{<hvdzwet@liacs.nl>}}
|
---|
[2] | 31 | \date{\today}
|
---|
| 32 |
|
---|
[224] | 33 |
|
---|
[2] | 34 | \begin{document}
|
---|
[224] | 35 | \newcommand{\DFA}{\emph{DFA}~}
|
---|
| 36 | \newcommand{\qed}{\hfill \ensuremath{\Box}}
|
---|
[2] | 37 | \maketitle
|
---|
[224] | 38 | \begin{abstract}
|
---|
| 39 | Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek
|
---|
| 40 | \cite{JS2009} gebruikt bij het college. In deze opdracht zullen zeven opgaven
|
---|
[227] | 41 | (3,20,22,47,54,68,69) van hoofdstuk 3 behandeld worden. De opgaven zijn
|
---|
[229] | 42 | willekeurig gekozen met behulp van een kans generator, het kans dus zijn dat
|
---|
[227] | 43 | niet alle onderwerpen van hoofdstuk 3 behandeld worden.
|
---|
[224] | 44 | \end{abstract}
|
---|
[2] | 45 |
|
---|
[224] | 46 | \section{Opgave 3.3}
|
---|
| 47 | Als $L \subseteq \Sigma^*$ is regulier dan is de taal
|
---|
| 48 | \begin{equation}
|
---|
| 49 | 2L := {a_1,a_1,a_2,a_2,\ldots,a_k,a_k}~:~elke~a_i \in \Sigma~en~a_1a_2{\cdots}a_k \in L
|
---|
| 50 | \end{equation}
|
---|
| 51 | regulier. Zie dat er een `verdubbeling' optreed van symbolen, dit gedrag is de
|
---|
[229] | 52 | modelleren in een \DFA. Omdat $L$ regulier is bestaat er een \DFA $M =
|
---|
| 53 | (Q,\Sigma,\delta,q_0,F)$ die $L$ beschrijft. Construeer nu een nieuwe \DFA $P$
|
---|
[224] | 54 | die de nieuwe taal $2L$ gaat beschrijven, neem hiervoor het alfabet ($\Sigma$),
|
---|
[229] | 55 | en de begintoestand $q_0$ over van $L$. De toestanden ($Q$) worden verdubbeld.
|
---|
[224] | 56 | $voor~alle~q \in Q:~voeg~q'~toe~aan~Q$. Neem ook de transities over van $M$,
|
---|
[229] | 57 | maar maak aanpassingen zodanig dat de nieuwe toestanden ook gelezen worden. Dus
|
---|
[224] | 58 | $\delta(q,x)$ wordt $\delta(q,q'),\delta(q',x)$. De acceptatie toestand $F$
|
---|
| 59 | moet ook aangepast worden, door de oude acceptatie $q$ te vervangen door $q'$.
|
---|
[226] | 60 | \\
|
---|
[229] | 61 | De nieuwe \DFA $P$ beschrijft $2L$ en dus is $2L$ regulier.
|
---|
[224] | 62 | \qed
|
---|
| 63 |
|
---|
| 64 |
|
---|
[225] | 65 | \section{Opgave 3.20}
|
---|
| 66 | Laat $\Sigma = {0,1}$ zijn. Een voorbeeld van de taal $L \subseteq
|
---|
| 67 | \Sigma^*$ voor welke geldt dat, de Myhill-Nerode\cite{JS2009}[pg. 77--81]
|
---|
[229] | 68 | gelijkheid relatie $R_L$ de eigenschap heeft dat elk woord in $\Sigma^*$ zijn
|
---|
[226] | 69 | eigen equivalentie klasse is. Dit wilt zeggen dat voor alle $z \in \Sigma^*$,
|
---|
| 70 | is er een $xz \in L$ dan en slechts als $yz \in L$. Omdat hier gezocht wordt
|
---|
[229] | 71 | naar een taal waarbij de woorden allemaal equivalentie klassen op-zich zijn, zal
|
---|
| 72 | alle elementen met elkaar vergeleken kunnen worden door middel van $R_L$ en hier mogen geen
|
---|
[226] | 73 | positieve 'gevallen' uitkomen.
|
---|
[224] | 74 |
|
---|
[226] | 75 | Een mooi voorbeeld is de taal van \emph{PRIMES2}\cite{JS2009}[pg. 2], waarbij
|
---|
| 76 | de priemgetallen in een binair stelsel worden vertegenwoordigd. Door op unieke
|
---|
| 77 | 'start' van de woorden zullen deze nooit in elkaar vervallen en zal dus elk
|
---|
| 78 | woord zijn eigen klasse zijn.
|
---|
| 79 |
|
---|
| 80 |
|
---|
[224] | 81 | \section{Opgave 3.22}
|
---|
[229] | 82 | Om aan te tonen dat een \emph{2DFA} exponentieel meer expressief is dan een
|
---|
[226] | 83 | \DFA voor bepaalde talen kijken we naar de volgende taal; Laat $n$ een integer
|
---|
[229] | 84 | $\ge1$ en $F_n \subseteq \{0,1,2,3,4\}^*$ als volgende gedefinieerd:
|
---|
[226] | 85 | \begin{equation}
|
---|
| 86 | F_n = \{3~0^{i_1}~1~0^{i_2} \cdots 1~0^{i_n}~2^k~0^{i_k}~4 : 1 \ge k,j,i_j \ge n\}
|
---|
| 87 | \end{equation}
|
---|
| 88 |
|
---|
| 89 | Als eerste kan de $F_n$ door een \emph{2DFA} van $O(n)$ toestanden geaccepteerd
|
---|
| 90 | worden, welke aan te tonen is door eerst te kijken naar de eigenschappen van
|
---|
| 91 | $F_n$ hierbij is de zien dat de $0$-reeks van de lengte $i^k$ zowel voor als na
|
---|
| 92 | de $2^k$ moet voorkomen. Waarbij $2^k$ aangeeft, waar deze $0$-reeks gevonden
|
---|
| 93 | kan worden e.g. bij welke $i_x$. De \emph{2DFA} moet dus twee dingen doen. Het
|
---|
| 94 | aantal keer nul op twee plekken vergelijken. Waarbij 1 plek vast staat en de
|
---|
[229] | 95 | tweede plek variabele wordt gedefinieerd. Dit lijkt mij controleren op twee los
|
---|
[226] | 96 | staande feiten. Hiervoor heb ik \underline{geen} antwoord gevonden. Ik kan
|
---|
| 97 | enkel wat voor $O(n^2)$ bedenken, welke een idee is in Figuur~\ref{fig:idee}
|
---|
| 98 | uitgewerkt is.
|
---|
| 99 |
|
---|
| 100 |
|
---|
| 101 | \begin{figure}
|
---|
| 102 | \center
|
---|
| 103 | \begin{tikzpicture}
|
---|
| 104 | \node[place,pin={[pin edge={style=<-,blue,thick,decorate,decoration={snake, pre length=4pt}}]left:}] (q0) {};
|
---|
| 105 | \node[place] (q1) [below=of q0] {};
|
---|
| 106 | \node[place] (q2) [below=of q1] {};
|
---|
| 107 | \node[place,pin={[pin edge={style=-<,thick,decorate,decoration={snake, pre length=4pt}}]below:}] (q3) [below=of q2] {};
|
---|
| 108 | \node[place] (q01) [right=3cm of q1] {};
|
---|
| 109 | \node[place] (q02) [right=3cm of q2] {};
|
---|
| 110 | \path[->]
|
---|
| 111 | (q0) edge [decorate,decoration={snake}] node[left] {goto-2} (q1)
|
---|
| 112 | (q1) edge node[left] {2} (q2)
|
---|
| 113 | (q2) edge node[left] {2} (q3)
|
---|
| 114 | (q1) edge [decorate,decoration={snake}] node[above] {0-length-check} (q01)
|
---|
| 115 | (q2) edge [decorate,decoration={snake}] node[above] {0-length-check} (q02)
|
---|
| 116 | ;
|
---|
| 117 | \end{tikzpicture}
|
---|
| 118 | \caption{Idee voor Opdracht 2.22a}
|
---|
[227] | 119 | \label{fig:idee}
|
---|
[226] | 120 | \end{figure}
|
---|
| 121 |
|
---|
| 122 | Om te laten zien dat een \DFA minstens $n^n$ toestanden nodig heeft moet je
|
---|
| 123 | gebruik maken van het feit dan een \DFA niet terug kan lopen. Het zal dus een
|
---|
| 124 | `geheugen' moeten maken om het maximale $0$ woord voor de `splitsing' ($2^k$)
|
---|
| 125 | te kunnen onthouden om zo te kijken of het overeen komt het $0$ woord na de
|
---|
| 126 | `splitsing'. Omdat je voor elke $F_i$ waarbij $1 \ge i \ge n$ minimaal $n$
|
---|
| 127 | toestanden nodig hebt om te kunnen tellen en hiervan weer $n$ unieke sets
|
---|
| 128 | bestaan, heb je dus minimaal $n^n$ toestanden nodig.
|
---|
| 129 |
|
---|
[227] | 130 | \section{Opgave 3.47}
|
---|
[226] | 131 |
|
---|
[227] | 132 | Om te bewijzen dat `de klasse van talen geaccepteerd door \DFA' => `de klasse van
|
---|
| 133 | talen gespecificeerd door de reguliere expressies'\cite{JS2009}[Theorem 1.4.2, (b) => (a)]
|
---|
| 134 | aan de hand van het volgende voorbeeld:
|
---|
| 135 | Laat $M = (Q,\Sigma, \delta, q_1,F)$ een \DFA zijn, waarbij $Q =
|
---|
[229] | 136 | \{q_1,q_2,\ldots,q_n\}$. Definieer nu $R_{i,j,k}$ als de taal van alle woorden
|
---|
[227] | 137 | die van toestand $i$ naar toestand $j$ gaan zonder door toestanden te gaan die
|
---|
| 138 | hoger als $k$ genummerd zijn.
|
---|
[226] | 139 |
|
---|
[229] | 140 | Om dit te doen is een recursieve formule nodig, welke $R_{i,j,k}$ als invoer
|
---|
[227] | 141 | heeft. a) Kijk welke transities er mogelijk zijn in $\delta$ met toestand $i$ als
|
---|
| 142 | begin positie. Plaats deze op de `stapel'. b) Werk de elementen op de stapel
|
---|
| 143 | stuk voor stuk af volgens dezelfde methodiek. Stop pas als de $\delta$
|
---|
| 144 | resultaat $j$ bevat. Let erop dat oneindige herhalingen gedetecteerd moeten
|
---|
| 145 | worden om het algoritme te laten termineren. Je kan het zien als het volledig
|
---|
| 146 | doorzoeken van een boom met in de wortel de knoop $i$.
|
---|
[226] | 147 |
|
---|
[224] | 148 | \section{Opgave 3.54}
|
---|
[227] | 149 |
|
---|
[229] | 150 | Laat $\Sigma = \{1,2,3,\ldots,n\}$ zijn en definieer:
|
---|
[227] | 151 | \begin{equation}
|
---|
| 152 | L_n = \{w \in \Sigma^* : |w|_i = 1~voor~alle~i\}
|
---|
| 153 | \end{equation}
|
---|
| 154 | Dit zijn dus de woorden waarbij alle elementen precies \'{e}\'{e}n keer in voor
|
---|
| 155 | komen. Bijvoorbeeld $L_3 = \{123,132,213,231,312,321\}$.
|
---|
| 156 |
|
---|
| 157 | Om te laten zijn dat er minimal een reguliere expressie van lengte $2^{n-1}$
|
---|
| 158 | nodig is om $L_n$ te specificeren, moet de \emph{Myhill-Nerode} stelling
|
---|
| 159 | toegepast worden. Vanwege de eigenschap dat prefix uniek is, zat het nooit
|
---|
| 160 | mogelijk worden om aan beiden woorden hetzelfde toe te voegen zodanig dat ze in
|
---|
| 161 | elkaars klasse terecht komen. (elk `bit' informatie is relevant). Voor alle
|
---|
| 162 | klasse zal dus apart gekeken worden of aan de eisen voldaan wordt. Om dus alle
|
---|
| 163 | getallen $n$ van de string te controleren of zij uniek is zijn minimaal
|
---|
| 164 | $2^{n-1}$ toestanden nodig.
|
---|
| 165 |
|
---|
| 166 | Echter voor $\overline{L_n}$ is wel een reguliere expressie te vinden en wel
|
---|
| 167 | in de grootte $O(n^2)$. Door simpelweg voor elke $i \in \Sigma^*$ een reguliere
|
---|
| 168 | expressie te maken van de vorm $x^*~i~x^*~i~x^*$ waarbij $x = Sigma^* - i$.
|
---|
| 169 |
|
---|
[224] | 170 | \section{Opgave 3.68}
|
---|
[227] | 171 |
|
---|
| 172 | Voor een woord $w \in \Sigma^*$, is een palc($w$) de korte palindroom $x$
|
---|
| 173 | zodanig dat $w$ een prefix is van $x$. en palc($L$) = $\bigcup_{w \in L}\{palc(w)\}$.
|
---|
| 174 |
|
---|
| 175 | Om te laten zien dat palc($w$) = $wt^{-1}w^R$, waarbij $wt^{-1}$ het woord is $w$
|
---|
[229] | 176 | waar het suffix $t$ eraf gehaald is en $t$ de langste palindroom suffix van $w$
|
---|
[227] | 177 | is, moet er gebruik gemaakt worden van een tegenstelling. Als $w$ nog een
|
---|
| 178 | palindroom aan het einde zal bevatten $uu$, dan ziet $x$ er als volgt uit
|
---|
| 179 | $wuuuuw$, dit is niet de korte palindroom ($ww$), welke $uuuu$ er nog makkelijk
|
---|
[229] | 180 | uit weggehaald had kunnen worden. Een willekeurige suffix van $w$ kan ook geen
|
---|
[227] | 181 | palindroom vormen die nog `weggesneden' kan worden, omdat hij anders al in den
|
---|
| 182 | beginne een palindroom had moeten zijn.
|
---|
| 183 |
|
---|
[229] | 184 | Als $L$ is regulier, dan is palc($L$) ook regulier, welke er een unieke
|
---|
[227] | 185 | `vertaling' van een woord $w$ naar zijn palc($w$). De nieuwe woorden zullen in
|
---|
| 186 | het slechtste geval evenveel blijven, maar de taal kan ook kleiner worden.
|
---|
| 187 |
|
---|
| 188 | De andere kant op geldt dit \underline{niet}, als $L$ regulier is, dan is het
|
---|
| 189 | onbeslist of palc\textsuperscript{-1}($L$) ook regulier is. Het kan namelijk
|
---|
[229] | 190 | zeer goed dat een (ingewikkelde) functie die woorden genereerde welke een
|
---|
| 191 | palindroom zijn en die aan een vast prefix ($p$) toegevoegd. De \emph{palc}
|
---|
[227] | 192 | functie zal deze allen naar \'{e}\'{e}n woord omzetten, welke dan regulier is.
|
---|
| 193 |
|
---|
| 194 |
|
---|
[224] | 195 | \section{Opgave 3.69}
|
---|
| 196 |
|
---|
[227] | 197 | Laat $x_1,x_2,\ldots,x_k \in \Sigma^*$. Om te laten zien dat $\Sigma^* -
|
---|
| 198 | x_{1}^{*}x_{2}^{*} \cdots x_{k}^*$ eindig is dan en slechts als $|\Sigma| = 1$
|
---|
| 199 | en gcd($|x_1|,|x_2|,\ldots,|x_k|$) = 1 moet er een paar dingen bewezen worden
|
---|
| 200 | a) aantonen dat het \underline{niet} geldt voor de tegenvoorbeelden a) $gcd
|
---|
| 201 | > 1$ b) $|\Sigma| > 1$ en tevens moet aangetoond worden waarom de eindigheid
|
---|
[228] | 202 | voor dit specifieke geval geldt.
|
---|
[227] | 203 |
|
---|
[228] | 204 | Merk op dat met een gcd van 1 alle getallen in de verzameling \{1,
|
---|
| 205 | priemgetallen\} zitten. Bij een alfabet van 1 letter hoeft er enkel maar
|
---|
| 206 | gesproken worden over lengtes. Standaard zitten alle lengtes in de taal.
|
---|
| 207 | Aangezien de `deel-lengtes' ($x_1,x_2,\ldots,x_k$) nul of meer keer in de
|
---|
| 208 | verzameling in de verzameling mogen zitten. Zal je uiteindelijk overblijven met
|
---|
| 209 | een eindige set lengtes. In het geval dat er lengte 1 gevonden wordt, zal zelfs
|
---|
| 210 | de lege set het antwoord zijn.
|
---|
| 211 |
|
---|
| 212 | a) Als $|\Sigma| > 1$, bijvoorbeeld $\{1,2\}$ dan kan er een oneindige
|
---|
| 213 | verzameling gemaakt worden, door $x_1,x_2,\ldots,x_k \in 1^*$. De $2*$ zal dan een
|
---|
| 214 | oneindige verzameling vormen.
|
---|
| 215 |
|
---|
| 216 | b) $gcd > 1$, bijvoorbeeld $2$ dan kan er een oneindige verzameling gemaakt
|
---|
| 217 | worden, doordat niet alle woorden gemaakt kunnen worden. Enkel worden van
|
---|
| 218 | `even' lengte in dit geval. Waardoor de `oneven' woorden een eindige string
|
---|
| 219 | gaan vormen. Bij grotere waardes ($r$) kunnen ook 'groepen' (de $|r|* - 1$)
|
---|
| 220 | bijvoorbeeld niet meer bereikt worden, welke dan tot een oneindige verzameling
|
---|
| 221 | kunnen groeien.
|
---|
| 222 |
|
---|
[224] | 223 | \begin{thebibliography}{1}
|
---|
| 224 | \bibitem[JS2009]{JS2009}Jeffrey Shallit, \emph{A second course in formal
|
---|
| 225 | languages and automata theory }, \emph{Cambridge University Press}, 2009.
|
---|
[2] | 226 | \end{thebibliography}
|
---|
| 227 | \newpage
|
---|
| 228 | \end{document}
|
---|