Normalformen

BCNF $\subseteq$ 3NF $\subseteq$ 2NF $\subseteq$ 1NF

Zerlegung

Es entstehen Anomalien, wenn wir nicht Entities und Relations getrennt speichern.

Deshalb braucht man sinnvolle Zerlegung.

Beispiel
Anomalien
Update-Anomalie Wenn Sokrates umzieht, mehrere Zeilen updaten
Lösch-Anomalie Eine Vorlesung fällt weg
Create-Anomalie kein key, wenn Professor keine Vorlesung ließt

Zerlegung von $\mathcal R$ in $\mathcal{R}_{1}, \ldots, \mathcal{R}_{n}$

$\small \operatorname{att}\left(\mathcal{R}_{1}\right) \cup \cdots \cup \operatorname{att}\left(\mathcal{R}_{n}\right)=\operatorname{att}(\mathcal{R})$

Kriterien: Verlustlosigkeit und Abhängigkeitstreue

Verlustlostigkeit

Die Informationen in $\mathcal R$ müssen nach der Zerlegung rekonstruierbar sein.

$\small R=\pi_{\mathcal{R}_{1}}(R) \bowtie \pi_{\mathcal{R}_{2}}(R) \bowtie \cdots \bowtie \pi_{\mathcal{R}_{n}}(R)$

Die Join-Attribute müssen Super-Schlüssel sein.

Abhängigkeitstreue

Die FDs in $\mathcal R$ müssen nach der Zerlegung übertragbar sein.

Sei

$\small \mathcal{R}^{\prime} \subseteq \mathcal{R}$

$\small F\left[\mathcal{R}^{\prime}\right]=\left\{\alpha \rightarrow \beta \in F \mid \alpha \cup \beta \subseteq \mathcal{R}^{\prime}\right\}$

Es muss gelten

$\small F \equiv\left(F^{+}\left[\mathcal{R}_{1}\right] \cup \cdots \cup F^{+}\left[\mathcal{R}_{n}\right]\right)$ bzw

$\small F^{+}=\left(F^{+}\left[\mathcal{R}_{1}\right] \cup \cdots \cup F^{+}\left[\mathcal{R}_{n}\right]\right)^{+}$

3. Normalform

Geschichte

1NF: 1. Normalform

Wenn Domänen von $\mathcal R$ atomar sind (keine nested tables)

2NF: 2. Normalform

Wenn nur genau ein einziges Konzept modeliert wird

Definition 3NF

$\alpha \subseteq \mathcal{R}$ , $B\in \mathcal R$

Wir wandeln alle FDs so um dass rechts nur eine Attribute steht.

$\forall (\alpha \rarr B) \in F:$ muss mindestens eines der Bedingungen gelten:

$B\in \alpha$ (triviale FD)

$\alpha$ ist ein Superschlüssel von $\mathcal R$

Attribut $B$ ist Teil des Schlüssel von $\mathcal R$

Alternative Definition
💡
Nur damit man die Definition aus Wikipedia auch versteht.
Nicht Teil des Stoffes
Nach Codd: "Es muss 2NF gelten und kein Nicht-Schlüssel-Attribut darf transitiv von einem Schlüssel abhängen"
Das bedeutet - Angenommen es existieren die Attributmengen: $\small \text{keys}, \text{ nonKeys}$
Dann muss gelten:
$\small \text{keys} \rarr \text{nonKeys}$
$\small \text{nonKeys} \not\rarr \text{keys}$
$\small \text{nonKeys} \rarr A,~ A \notin \text{keys},~ A \notin \text{nonKeys}$

Synthese-Algorithmus

Ermöglicht Zerlegung in 3NF

$\mathcal{R}=\mathcal{R}_{1} \cup \cdots \cup \mathcal{R}_{n}$

Verlustlos, Abhängigkeitstreu und alle $\mathcal R_i$ sind in 3NF.

Synthese-Algorithmus

Bestimme kanonische Überdeckung $F_C$ zu $F$
Damit wir nur so viel zerlegen wie unbedingt notwendig

$\forall (\alpha \rarr \beta) \in F_C:$
Erstelle für jede FD ein eigenes Relationenschema $\mathcal{R}_{i}:=\alpha \cup \beta$
Ordne jeder $\mathcal R_i$ die FDs $F_{i}:=F_{c}\left[\mathcal{R}_{i}\right]$ zu
$\small F_C[\mathcal{R}_i]=\left\{\alpha \rightarrow \beta \in F_C \mid \alpha \cup \beta \subseteq \mathcal{R}_i\right\}$
Damit Abhängigkeitstreue erfüllt ist

Falls keines der erzeugten Teilschemata einen Schlüssel von $\mathcal R$ enthält,
1. wähle einen Schlüssel $\kappa \in \mathcal{R}$
  Keinjoinmöglich, deshalb IDs erzeugen
1. Definiere zusätzlich das Schema $\mathcal{R}_{\kappa}:=\kappa$ wobei $F_\kappa:=\empty$

Kürze überflüssige Schemata wenn sie in einem anderen enthalten sind.

Boyce-Codd Normalform

Es werden mit 3NF nicht alle Anomalien beseitigt.

Beispiel
$\small \mathcal{R}=\text { Städte(Ort, Land, Chef, EW) }$
$\small \mathrm{F}=\{\{\text { Ort, Land }\} \rightarrow\{\mathrm{EW}\},~\{\text { Land }\} \rightarrow\{\text { Chef }\},~\{\text { Chef }\} \rightarrow\{\text { Land }\}\}$
Schlüssel: $\small \{\text { Ort, Land }\},~\{\text { Ort, Chef }\}$
Redundanz: Wer chef von einem land ist
Theoretisch weil sie sich gegenseitig bestimmen, müsste nur eines der beiden Attribute vorkommen.

Nur in BCNF wird Anomalie-Freiheit garantiert.

Definition BCNF

$\alpha \subseteq \mathcal{R}$ , $B\in \mathcal R$

Wir wandeln alle FDs so um dass links nur eine Attribute steht.

$\forall (\alpha \rarr B) \in F:$ muss mindestens eines der Bedingungen gelten:

$B\in \alpha$ (triviale FD)

$\alpha$ ist ein Superschlüssel von $\mathcal R$

~~Attribut~~ ~~$\sout{B\in}$ einem der Schlüssel von~~ ~~$\sout{\mathcal R}$ ~~

Dekompositions-Algorithmus

Ermöglicht Zerlegung in BCNF

$\mathcal{R}=\mathcal{R}_{1} \cup \cdots \cup \mathcal{R}_{n}$

Verlustlos, ~~Abhängigkeitstreu~~ und alle $\mathcal R_i$ sind in 3NF.

Es ist nicht immer möglich, dass Zerlegung Abhängigkeitstreu ist.

Dekompositions-Algorithmus

$\small Z=\{(\mathcal{R}, F)\}$

$\small \forall(\mathcal{R}_i, F_i) \in Z$ :
Wenn nicht in BCNF, dann wähle die $\small (\alpha \rarr \beta) \in F_i$ welche die Bedingung verletzt
1. Zerlege $\small \mathcal{R}_i$
  $\small \mathcal{R}_{i_{1}}:=(\alpha \cup \beta)\quad \quad \quad ~~F_{i_{1}}:=F_{i}^{+}\left[\mathcal{R}_{i_{1}}\right]$
  $\small \mathcal{R}_{i_{2}}:=\mathcal{R}_{i}-(\beta-\alpha) \quad F_{i_{2}}:=F_{i}^{+}\left[\mathcal{R}_{i_{2}}\right]$
  wobei $\small F_i^+[\mathcal{R}_i]=\left\{\alpha \rightarrow \beta \in F_i^+ \mid \alpha \cup \beta \subseteq \mathcal{R}_i\right\}$
1. Entferne $\small (\mathcal{R}_i, F_i)$ aus $\small Z$
1. Füge $\small \left(\mathcal{R}_{i_{1}}, F_{i_{1}}\right)$ und $\small \left(\mathcal{R}_{i_{2}}, F_{i_{2}}\right)$ in $Z$ ein
  $\small Z:=\left(Z-\left(\left\{\mathcal{R}_{i}, F_{i}\right)\right\}\right) \cup\left\{\left(\mathcal{R}_{i_{1}}, F_{i_{1}}\right)\right\} \cup\left\{\left(\mathcal{R}_{i_{2}}, F_{i_{2}}\right)\right\}$