source: liacs/TPFL2010/assignment1/report.tex@ 351

Last change on this file since 351 was 250, checked in by Rick van der Zwet, 14 years ago

To be delivered.

File size: 15.0 KB
RevLine 
[2]1%
2% $Id: report.tex 571 2008-04-20 17:31:04Z rick $
3%
4
5\documentclass[12pt,a4paper]{article}
6
7\frenchspacing
8\usepackage[english,dutch]{babel}
9\selectlanguage{dutch}
[224]10\usepackage[pdftex]{graphicx}
[2]11\usepackage{url}
12\usepackage{amssymb,amsmath}
[224]13\usepackage{float}
[226]14\usepackage{tikz}
[227]15\usepackage{fixltx2e}
[2]16
[226]17\usetikzlibrary{arrows,decorations.pathmorphing,backgrounds,positioning,fit,petri}
18
19
20
21\setlength\parindent{0pt}
22\setlength\parskip{\baselineskip}
[224]23\floatstyle{ruled}
24\newfloat{algoritm}{thp}{lop}
25\floatname{algoritm}{Algoritme}
26
27\title{Opdracht 1 \\
28\large{Topics on Parsing and Formal Languages - fall 2010}}
[2]29\author{Rick van der Zwet\\
[224]30 \texttt{<hvdzwet@liacs.nl>}}
[2]31\date{\today}
32
[224]33
[2]34\begin{document}
[224]35\newcommand{\DFA}{\emph{DFA}~}
36\newcommand{\qed}{\hfill \ensuremath{\Box}}
[2]37\maketitle
[224]38\begin{abstract}
39Dit schrijven zal uitwerkingen van opgaven behandelen uit het boek
40\cite{JS2009} gebruikt bij het college. In deze opdracht zullen zeven opgaven
[243]41(3,20,22,47,54,68,69) van hoofdstuk 3 behandeld worden.
[224]42\end{abstract}
[2]43
[224]44\section{Opgave 3.3}
45Als $L \subseteq \Sigma^*$ is regulier dan is de taal
46\begin{equation}
472L := {a_1,a_1,a_2,a_2,\ldots,a_k,a_k}~:~elke~a_i \in \Sigma~en~a_1a_2{\cdots}a_k \in L
48\end{equation}
49regulier. Zie dat er een `verdubbeling' optreed van symbolen, dit gedrag is de
[229]50modelleren in een \DFA. Omdat $L$ regulier is bestaat er een \DFA $M =
51(Q,\Sigma,\delta,q_0,F)$ die $L$ beschrijft. Construeer nu een nieuwe \DFA $P$
[224]52die de nieuwe taal $2L$ gaat beschrijven, neem hiervoor het alfabet ($\Sigma$),
[229]53en de begintoestand $q_0$ over van $L$. De toestanden ($Q$) worden verdubbeld.
[224]54$voor~alle~q \in Q:~voeg~q'~toe~aan~Q$. Neem ook de transities over van $M$,
[229]55maar maak aanpassingen zodanig dat de nieuwe toestanden ook gelezen worden. Dus
[224]56$\delta(q,x)$ wordt $\delta(q,q'),\delta(q',x)$. De acceptatie toestand $F$
[243]57is gelijkt aan de oude acceptatie toestand.
[226]58\\
[229]59De nieuwe \DFA $P$ beschrijft $2L$ en dus is $2L$ regulier.
[224]60\qed
61
62
[225]63\section{Opgave 3.20}
[243]64Laat $\Sigma = \{0,1\}$ zijn. Een voorbeeld van de taal $L \subseteq
[225]65\Sigma^*$ voor welke geldt dat, de Myhill-Nerode\cite{JS2009}[pg. 77--81]
[229]66gelijkheid relatie $R_L$ de eigenschap heeft dat elk woord in $\Sigma^*$ zijn
[244]67eigen equivalentie klasse is. Dit wilt zeggen dat $xR_{l}y$ dan en slechts dan
68voor alle $z \in \Sigma^*$, is er een $xz \in L$ dan en slechts als $yz \in L$.
69Omdat hier gezocht wordt naar een taal waarbij de woorden allemaal equivalentie
70klassen op-zich zijn, zal alle elementen met elkaar vergeleken kunnen worden
71door middel van $R_L$ en hier mogen geen positieve 'gevallen' uitkomen.
[224]72
[244]73De (triviale) taal $L = {01,10}$ is een voorbeeld hiervan. Beiden woorden hebben
74hun eigen klasse. Als $x = 0$ en $y = 1$, bestaat er een $z = 1$, zodanig dat
75$xz \in L, yz \notin L$.
[226]76
[245]77De taal $M = \{{0}^* : |M|_0~is~een~priemgetal\}$ is een ander voorbeeld. Als we
[244]78kijken naar $aR_{l}b$ kan er altijd een $z$ gevormd worden zodanig dat $az \in
79M, bz \notin M$. Bijvoorbeeld $a = 0^3, b =0^5, z = 0^4$. Deze eigenschap wordt
80afgedwongen door het `feit' dat er geen relatie bestaat tussen de lengtes
81tussen opeenvolgende priemgetallen.\footnote{Ik heb dit voor gemak aangenomen,
82de praktijk is echter dat is nog een groot wiskundig vraagstuk is.}
[226]83
[244]84
85\section{Opgave 3.22*}
[229]86Om aan te tonen dat een \emph{2DFA} exponentieel meer expressief is dan een
[226]87\DFA voor bepaalde talen kijken we naar de volgende taal; Laat $n$ een integer
[229]88$\ge1$ en $F_n \subseteq \{0,1,2,3,4\}^*$ als volgende gedefinieerd:
[226]89\begin{equation}
[244]90 F_n = \{3~0^{i_1}~1~0^{i_2} \cdots 1~0^{i_n}~2^k~0^{i_k}~4 : 1 \le k,j,i_j \le n\}
[226]91\end{equation}
92
93Als eerste kan de $F_n$ door een \emph{2DFA} van $O(n)$ toestanden geaccepteerd
94worden, welke aan te tonen is door eerst te kijken naar de eigenschappen van
[245]95$F_n$ hierbij is de zien dat de $0$-reeks van de lengte $i_k$ zowel voor als na
[226]96de $2^k$ moet voorkomen. Waarbij $2^k$ aangeeft, waar deze $0$-reeks gevonden
[245]97kan worden bij de plek $k$. De \emph{2DFA} moet dus twee dingen doen. Het
[226]98aantal keer nul op twee plekken vergelijken. Waarbij 1 plek vast staat en de
[245]99tweede plek variabele wordt gedefinieerd. De aanpak kan als volgt gezien worden:
100\begin{verbatim}
[246]1011. controleren of |1| <= 2de 0-reeks dmv 'knopen-strook' (knopen 0.X en 1.X).
1022. |2| tellen onthouden dmv 'knopen-strook' (knopen 2.X).
1033. naar gewenste locatie lopen (knopen 3.X).
1044. |0| tellen onthouden dmv 'knopen-strook' (knopen 4.X).
1055. naar begin 2de 0-reeks lopen (knopen 5.X).
1066. 0-reeks vergelijken (knopen 6.X).
[245]107\end{verbatim}
[246]108Voor deze aanpak zijn 3 `knopen-stroken' nodig, 3 `transitie-lagen' en 1 controle
109strook. In totaal dus in ongeveer $O(7n)$ knopen. Figuur~\ref{fig:2dfa} laat
110de \emph{2DFA} zien.
[226]111
112
113\begin{figure}
114\center
[246]115\begin{tikzpicture}[node distance=20mm]
116\node[place,pin={[pin edge={style=<-,blue,thick,decorate,decoration={snake, pre length=4pt}}]left:}] (q00) {0.0};
117\node[place] (q01) [right=of q00] {0.1};
118\node[place] (q02) [right=of q01] {0.2};
119\node[place] (q03) [right=of q02] {0.3};
120\node[place] (q10) [below=of q00] {1.0};
121\node[place] (q11) [below=of q01] {1.1};
122\node[place] (q12) [below=of q02] {1.2};
123\node[place] (q13) [below=of q03] {1.3};
124\node[place] (q20) [below=of q10] {2.0};
125\node[place] (q21) [below=of q11] {2.1};
126\node[place] (q22) [below=of q12] {2.2};
127
128\node[place] (q30) [below=of q20] {3.0};
129\node[place] (q31) [below=of q21] {3.1};
130\node[place] (q32) [below=of q22] {3.2};
131\node[place] (q33) [right=of q32] {3.3};
132
133\node[place] (q40) [below=of q30] {4.0};
134\node[place] (q41) [below=of q31] {4.1};
135\node[place] (q42) [below=of q32] {4.2};
136
137\node[place] (q50) [below=of q40] {5.0};
138\node[place] (q51) [below=of q41] {5.1};
139\node[place] (q52) [below=of q42] {5.2};
140\node[place] (q53) [double,right=of q52] {5.3};
141
142\node[place] (q60) [below=2cm of q50] {6.0};
143\node[place] (q61) [below=2cm of q51] {6.1};
144\node[place] (q62) [below=2cm of q52] {6.2};
145\node[place] (q63) [right=of q62] {6.3};
146
[226]147\path[->]
[245]148 (q00) edge node[above] {3,R} (q01)
149 (q01) edge node[above] {1,R} (q02)
150 (q01) edge [loop above] node[above] {0,R} (q01)
151 (q02) edge node[above] {1,R} (q03)
152 (q02) edge [loop above] node[above] {0,R} (q02)
153 (q03) edge [loop above] node[above] {0,R} (q03)
154
155 (q11) edge node[above] {0,L} (q10)
156 (q12) edge [bend left] node[below] {0,L} (q10)
157 (q13) edge [bend left] node[below] {0,L} (q10)
158
159 (q01) edge node {2,R} (q11)
160 (q02) edge node {2,R} (q12)
161 (q03) edge node {2,R} (q13)
162 (q13) edge node[above] {2,R} (q12)
163 (q12) edge node[above] {2,R} (q11)
164
165 (q10) edge node {2,L} (q20)
166 (q20) edge node[below] {2,L} (q21)
167 (q21) edge node[below] {2,L} (q22)
168
[246]169 (q20) edge node {0,L} (q30)
170 (q21) edge node {0,L} (q31)
171 (q22) edge node {0,L} (q32)
[245]172
[246]173 (q30) edge node {1,L} (q31)
174 (q31) edge node {1,L} (q32)
175 (q32) edge [bend left] node {3,R} (q33)
176 (q32) edge [bend right] node {1,R} (q33)
177
178 (q30) edge [loop below] node {0,L} (q30)
179 (q31) edge [loop below] node {0,L} (q31)
180 (q32) edge [loop below] node {0,L} (q32)
181
182 (q33) edge [bend left] node {0,R} (q42)
183 (q42) edge node {0,R} (q41)
184 (q41) edge node {0,R} (q40)
185
186 (q40) edge [bend right] node {2,R} (q60)
187 (q40) edge node {1,R} (q50)
188 (q41) edge [bend right] node {2,R} (q61)
189 (q41) edge node {1,R} (q51)
190 (q42) edge [bend right] node {2,R} (q62)
191 (q42) edge node {1,R} (q52)
192
193 (q50) edge [loop below] node {$\begin{array}{c}1,R\\0,R\end{array}$} (q50)
194 (q51) edge [loop below] node {$\begin{array}{c}1,R\\0,R\end{array}$} (q51)
195 (q52) edge [loop below] node {$\begin{array}{c}1,R\\0,R\end{array}$} (q52)
196 (q50) edge [bend left,looseness=2] node {2,R} (q60)
197 (q51) edge [bend left,looseness=2] node {2,R} (q61)
198 (q52) edge [bend left,looseness=2] node {2,R} (q62)
199
200 (q60) edge node {0,R} (q61)
201 (q61) edge node {0,R} (q62)
202 (q62) edge node {0,R} (q63)
203 (q63) edge node {4,R} (q53)
[226]204 ;
205\end{tikzpicture}
[247]206\caption{Opdracht 2.22a uitgewerkt voor $1 \le n \le 3$. Niet geldige stappen zijn niet genoemd en moet voor compleetheidnaar een 'putje' knoop gestuurd worden. Uitbreiden kan door het expanderen van `traviale' knopen.}
[245]207\label{fig:2dfa}
[226]208\end{figure}
209
210Om te laten zien dat een \DFA minstens $n^n$ toestanden nodig heeft moet je
211gebruik maken van het feit dan een \DFA niet terug kan lopen. Het zal dus een
212`geheugen' moeten maken om het maximale $0$ woord voor de `splitsing' ($2^k$)
213te kunnen onthouden om zo te kijken of het overeen komt het $0$ woord na de
214`splitsing'. Omdat je voor elke $F_i$ waarbij $1 \ge i \ge n$ minimaal $n$
215toestanden nodig hebt om te kunnen tellen en hiervan weer $n$ unieke sets
216bestaan, heb je dus minimaal $n^n$ toestanden nodig.
217
[247]218Dit vertaald zich in een Myhill-Nerode relatie om het aantal toestanden te
219kunnen bepalen. $F_p$ en $F_q$ waarbij $p < q, 1 \le p,q \le n$ is
220onderscheidbaar, door voor $z=2*0*4$ te nemen, zodanig dat het woord door $F_q$
221geaccepteerd wordt, maar niet door $F_p$, door $|z|_2 \ge p$ te kiezen.
222
223Voor elke $F_i : 1 \ge i \ge n$ geldt dat deze `intern' ook $i^2$ unique
224toestanden geeft. We splitsen de woorden bij $2$, zodat we over een `prefix' en
[249]225`suffix' kunnen praten. Een `prefix' past maar bij '{e}'{e}n `suffix'. De
[247]226`suffixes' die gegenereeerd worden van de vorm $2*0*4$, kan $i^2$ vormen
227aannemen (bijvoorbeeld $i=2 {204,2004,22004,2204}$).
228Deze unique suffixes zorgen ervoor dat de Myhill-Nerode toepassing een
229substring $z$ kan vinden welke een van de unique suffixes bevat, waardoor het
230`prefix' niet samenkomt met een `suffix'.
231
[227]232\section{Opgave 3.47}
[226]233
[248]234Om te bewijzen dat `de klasse van talen geaccepteerd door \DFA' $\Rightarrow$ `de klasse van
235talen gespecificeerd door de reguliere expressies'\cite{JS2009}[Theorem 1.4.2, (b) $\Rightarrow$ (a)]
[227]236aan de hand van het volgende voorbeeld:
237Laat $M = (Q,\Sigma, \delta, q_1,F)$ een \DFA zijn, waarbij $Q =
[229]238\{q_1,q_2,\ldots,q_n\}$. Definieer nu $R_{i,j,k}$ als de taal van alle woorden
[227]239die van toestand $i$ naar toestand $j$ gaan zonder door toestanden te gaan die
[248]240hoger dan $k$ genummerd zijn.
[226]241
242
[248]243$R_{i,j,k}$ accepteert als $q_i \in q_1, q_j \in F$.
244Om $R_{i,j,k+1}$ te verkrijgen, nemen we eerst de toestanden van $R_{i,j,k}$,
245deze verenigen we dan met alle toestanden die we vanuit $R_{i,j,k}$ kunnen
246bereiken met een transities $\delta(a,k+1) : i \le a \le j$, die in een
247\underline{nieuwe} toestand uitkomen, de lussen hebben geen meerwaarde voor ons
248doel. De begin toestand is te markeren als $R_{i,j,0} = {q_1} : i = j = 1$.
249
[224]250\section{Opgave 3.54}
[227]251
[229]252Laat $\Sigma = \{1,2,3,\ldots,n\}$ zijn en definieer:
[227]253\begin{equation}
[249]254L_n = \{w \in \Sigma^* : |w|_i = 1~voor~alle~i\in \Sigma\}
[227]255\end{equation}
[249]256Dit zijn dus de woorden waarbij alle elementen van $\Sigma$ precies \'{e}\'{e}n keer voor
[227]257komen. Bijvoorbeeld $L_3 = \{123,132,213,231,312,321\}$.
258
[249]259a) Om te laten zijn dat er minimaal een reguliere expressie van lengte $2^{n-1}$
260nodig is om $L_n$ te specificeren, passen we de \emph{Myhill-Nerode} stelling
261toe. Neem $x,y \in \Sigma^*$. Als geldt $|x| = |y|$ en de elementen zijn
262gelijk, maar enkel hun volgorde verschilt (bijvoorbeeld $123,132$) dan zitten
263ze in dezelfde klasse. Voor $xR_{l}y$ als de lengte verschilt, dan is er een
264$z$ te vinden zodanig dat $y$ wel geaccepteerd wordt en $x$ niet (bijvoorbeeld
265voor $34,345$, is dit $12$), vanwege $|x| + a \neq = |y| + a = n$ desals $|x|
266\neq |y|$. Als de `inhoud' verschilt maar de lengte gelijk is dan $z = \Sigma -
267\{y\}$, omdat $\Sigma \backslash \{x\} \neq \Sigma \backslash \{y\}$.
[227]268
269
[249]270b) Echter voor $\overline{L_n}$ is wel een reguliere expressie te vinden en wel
271in de grootte $O(n^2)$. $\bigcup_{a : 0 .. n}{\bigcup_{i \in \Sigma_a}\{x^*ix^*ix^*\}}$ waarbij $x \in
272(\Sigma_a \backslash \{i\})^*$.
273
[224]274\section{Opgave 3.68}
[227]275
276Voor een woord $w \in \Sigma^*$, is een palc($w$) de korte palindroom $x$
277zodanig dat $w$ een prefix is van $x$. en palc($L$) = $\bigcup_{w \in L}\{palc(w)\}$.
278
[250]279a) Om te laten zien dat palc($w$) = $wt^{-1}w^R$, waarbij $wt^{-1}$ het woord is $w$
[229]280waar het suffix $t$ eraf gehaald is en $t$ de langste palindroom suffix van $w$
[250]281is, moet er gebruik gemaakt worden van een tegenstelling. Neem aan dat $w$ een
282palindroom aan het einde zal bevatten $uu$ en dus van de vorm is $ruu$ dan ziet
283palc($w$) er als volgt uit $ruuuur$, dit is niet de korte palindroom
284($rr$), welke $uuuu$ er nog uit $x$ weggehaald had kunnen worden.
285Een willekeurige suffix van $w$ kan dus geen palindroom vormen die nog
286`weggesneden' kan worden, omdat hij anders al in den beginne een palindroom had
287moeten zijn.
288$t$ moet wel de \underline{langste} palindroom suffix van $w$ zijn, omdat
289anders een `dubbele' palindroom problemen op gaat leveren. Neem bijvoorbeeld
290$w$ van de vorm is $ruuyy$ als je van de palindroom $yy$ verwijderd, zal
291palc($w$) = $ruuuur$. Dit is niet de kortste palindroom ($rr$).
[227]292
[250]293b) Neem $L = \{ uvxyz : u,x,z \in 1^*~en~v,u \in 0^* \}$ en $\Sigma = \{0,1\}$.
294De woorden die palc($L$) moeten bevatten zijn alle woorden van $L$ minus de
295woorden $|x|_1 = even, |v|_0 = |y|_0, |u|_0 = |z|_0$. Die set komt niet door
296het pumping lemma en is dus palc($L$) is \underline{niet} regulier.
[227]297
[250]298c) Neem palc\textsuperscript{-1}($L$), dan is dit $\{ x \in L, u \in \Sigma^* :
299xuu \}$, welke alle woorden zijn met hun prefix in $L$ en hun suffix is een
300palindroom. Het genereren van palindromen met een reguliere taal is
301\underline{niet} mogelijk, dus palc\textsuperscript{-1}($L$) is
302\underline{niet} regulier.
[227]303
[224]304\section{Opgave 3.69}
305
[227]306Laat $x_1,x_2,\ldots,x_k \in \Sigma^*$. Om te laten zien dat $\Sigma^* -
307x_{1}^{*}x_{2}^{*} \cdots x_{k}^*$ eindig is dan en slechts als $|\Sigma| = 1$
[250]308en gcd($|x_1|,|x_2|,\ldots,|x_k|$) = 1\footnote{Ook paargewijs relatief priem genoemd, zie http://nl.wikipedia.org/wiki/Paarsgewijs\_relatief\_priem}, moeten beiden kanten op bekeken worden.
[227]309
[228]310
[250]311$\Rightarrow$: Door middel van een tegenstelling kunnen we bewijzen dat
312$|\Sigma| = 1$ moet zijn. Neem $|\Sigma| > 1$ en $x_1,x_2,\ldots,x_n = 0$ dan
313is deze oneindig, en wel in de vorm $(\Sigma \backslash {0})^*$. Door een
314tweede tegenstelling tonen we aan dat de gcd \'{e}\'{e}n moet zijn. Als $|\Sigma|
315= 1$ en $g$ = gcd($|x_1|,|x_2|,\ldots,|x_n|$) $\neq$ 1 dan komen er enkel woorden
316voor van lengte $g^n : n = 1 .. n$ Hierdoor zullen de woorden met lengte
317$(g-1)^*$ een oneindige reeks vormen.
[228]318
[250]319$\Leftarrow$: Doordat $|\Sigma| = 1$ is de lengte van de string indentiek aan
320zijn formaat. Met een gcd($|x_1|,|x_2|,\ldots,|x_n|$) $\neq$ 1 kunnen we alle
321bijna alle lengtes genereren door de eigenschap dat de nummers (relatief) priem
322zijn.\footnote{Dit is een grote gok, aangenomen dat er een Stelling bestaat,
323welke stelt dat je uit 2 priemgetallen vanaf een bepaald punt alle getallen kan
324genereren.}
[228]325
[224]326\begin{thebibliography}{1}
327\bibitem[JS2009]{JS2009}Jeffrey Shallit, \emph{A second course in formal
328languages and automata theory }, \emph{Cambridge University Press}, 2009.
[2]329\end{thebibliography}
330\newpage
331\end{document}
Note: See TracBrowser for help on using the repository browser.