Virtuelle Dialoge für den Unterricht Mona Ton informiert sich bei Konrad Rennert zum Thema Datenbanken Im 2. Teil geht es um die Organisation Mona: Kürzlich zeigte ich einem Kollegen meine mit Excel erstellte Fehlzeitstatistik. Er sagte, dass Redundanzen entfernt werden müssen. Was meinte er damit? Konrad: Die Redundanzen sind im Beispiel mit roter Umrandung gekennzeichnet. In jeder Tabelle einer Datenbank sollen nur Daten enthalten sein, die zu einer einzigen Objektart gehören. Im konkreten Fall ist die 2. Normalform verletzt. Mona: Konrad, Sie fangen gleich mit der 2. Normalform an. Dann gibt es wohl auch eine 1.? Konrad: Genau so ist es. Normalisieren bezeichnet den Prozess der schrittweisen Aufteilung von Tabellen. Die erste Normalform (1NF) ist dann erreicht, wenn die Felder einer Tabelle keine zusammengesetzten Werte enthalten. Die zweite Normalform (2NF) ist dann erreicht, wenn die erste Normalform schon erfüllt ist und Wertewiederholungen vermieden werden - sofern man von den Schlüsselpaaren für die verknüpften Tabellen absieht. http://de.wikipedia.org/wiki/Normalisierung_(Datenbank) Die dritte Normalform (3NF) kommt zum Tragen, wenn die Normalisierung schon für die 1NF und 2NF umgesetzt wurde. Bei 3NF geht es um die Berücksichtigung indirekter (transitiver) Abhängigkeiten. Mona: Postleitzahl und Ort der Adressen hängen also transitiv voneinander ab. Die Post braucht für ihre Dienste eigentlich nur die Postleitzahl. Die Ortsangabe in einer Adresse kommt unserer Vorstellung entgegen, weil wir den Empfänger damit verbinden. Für die maschinelle Sortierung der Post ist demnach eine Zahl besser geeignet. Texte, d.h. Ortsnamen kommen unserem Verständnis entgegen. Wie und wo legt man die geeigneten Datentypen für die Felder einer Tabelle fest? Konrad: Das geschieht üblicherweise in der Entwurfsansicht der Tabellen. Das Beispiel oben im Bild stammt von einer für den Einstieg in die Datenbankanwendungen gut geeigneten Access-Datenbank. Mona: In Excel-Tabellen formatiere ich gelegentlich die markierten Zellen, um sie passend darzustellen? Gibt es bei Datenbank-Tabellen ähnliche Eigenschaften? Konrad: In der Entwurfsansicht lassen sich die Feldeigenschaften der Tabellenfelder komfortabel bearbeiten. Feldgröße, Standardwert, Eingabeformate und Gültigkeitsregeln sind sinnvoll, um Dateneingaben zu verhindern, wenn sie nicht plausibel sind. Diese Einstellungen geschehen üblicherweise in der Entwurfsansicht der Tabellen. Das Beispiel oben im Bild ist einer MS-Access-Datenbank entnommen. MS-Access ist zum Einstieg gut geeignet weil es vergleichsweise schnell zu erlernen ist. Mona: Beim Googeln nach Primärschlüssel habe ich folgenden Satz gefunden und nicht verstanden: Der Primärschlüssel ist eine minimale Kombination von Attributen, durch deren Werte jede Entität eindeutig identifiziert wird. Kann das auch verständlicher ausgedrückt werden? Konrad: Der Primärschlüssel ist ein Feld oder eine Kombination von Feldern in einer Tabelle, die jeden in dieser Tabelle gespeicherten Datensatz eindeutig beschreibt. Z.B.: Das KFZ-Kennzeichen in der Fahrzeugzulassungsdatenbank, die Nummer des Ausweises im Melderegister, die PNR in der Mitarbeitertabelle Mona: Im Zusammenhang mit dem Primärschlüssel fällt in der Regel auch der Begriff „Index". Bei Sachbüchern habe ich verstanden, warum ein Index hilfreich ist. Wie funktioniert er bei Datenbanken? Konrad: Eine gute Erklärung des Index liefern die Erläuterungen zur Feldeigenschaft „Indiziert" falls man MS-Access einsetzt. Ein Index beschleunigt Suchvorgänge sowie Sortieren nach einem Feld. Mona: Die Beziehungen zwischen den Tabellen einer Datenbank werden im nächsten Abschnitt behandelt.