Semistructured Data and XML Summer 2007
Prof. Dr. Wolfgang May
Assistants: Erik Behrends,
Oliver Fritzen
Date and Time: Wednesday 10-12 ct, Thursday 14-16 ct, MN67.
Lecture and Exercises/Lab mixed (see announcements on this page)
6 ECTS credits (Studies in Applied Informatics and in BSc Wirtschaftsinformatik),
Diplom Wirtschaftsinformatik: 4 WiInf-credits,
(elective/"Wahlbereich" Informatik).
Course Description
One of the most important facts that lead to the overall success of XML
is that the "XML world" combines a lot of already known concepts in an
optimal way for coping with a broad spectrum of requirements.
The course will first review some of these preceding (partially even historic)
concepts (network database model, relational databases, object-oriented
databases) and the integration of data and metadata (SchemaSQL). Then,
the idea of "semistructured data" is introduced by showing early
representatives that helped to shape the XML world (F-Logic, OEM).
In the main part, XML is presented as a data model and a markup-meta-language,
and the current languages of the concepts of the XML world are systematically
investigated and applied: DTD, XPath, XQuery, XSLT, XLink, XML Schema,
and SQL/XML.
The lecture uses the geographical sample database "Mondial"
in its XML version for illustrations.
For practical exercises, the XML software is installed in the IFI CIP
Pool.
The software playground page can be found
here.
The sample code fragments can be found in the pool under
/afs/informatik.uni-goettingen.de/course/xml-lecture/
.
The recorded lectures from summer 2006 can be found here.
Hinweis an Clausthal: dieses Mal wurde keine Übertragung angefordert/geplant,
was aber dort wohl eben (13.4.) erst aufgefallen ist. Wir sind in GOE diesmal nicht in
dem Multimedia-Hörsaal (ausserdem ist auch kein Übertragungs-Hiwi
gebucht), das wird also so kurzfristig auch wohl nichts mehr.
Trotzdem: Clausthaler Teilnehmer sind immer willkommen, nach Göttingen
zu kommen, und/oder anhand der Aufzeichnungen vom letzten Jahr selbständig
zu lernen (der Inhalt wird so ziemlich derselbe sein). Die Klausur
wird sich dann regeln (entweder in GOE, oder parallel in CLZ).
Dates & Topics
- 18.4.:
Administrativa, Overview, Introductory Presentation "XML".
[Slides 2-on-1]
[Slides 4-on-1]
- 19.4.:
first: some Look and Feel - playing with eXist.
General Concepts and Notions of the database area.
Slides: Relational Model
- 25.4.:
Earlier database models, concepts and extensions:
Basic Concepts and Notions; example and recall: relational model.
Slides: early DB concepts
- 26.4.: Earlier database models, concepts and extensions:
Network data model, Relational Model, Object-Oriented Model
- Some references to read about database history (optionally):
- 2.5.: "History" continued: Schema SQL, early semistructured data models.
Slides: early semistructured data models
- 3.5.: "History" continued: early semistructured data models.
- 9.5.: XML: data model, language, DTDs etc.
Slides: XML basics
- 10..5.: XML: data model, language, DTDs etc. (cont'd)
Exercise sheet 1: XML & DTD
(PostScript,
PDF)
- 16.5.: XPath: navigation and addressing language for XML
Slides: XPath
- 17.5.: holiday (Himmelfahrt/Ascension Day)
- 23.5.: XPath (Cont'd)
Exercise sheet 2: XPath
(PostScript |
PDF)
- 24.5.: Discussion of Exercise sheet 1,
solution [postscript,
pdf],
Ergebnis der Ad-hoc-Lösung zu Aufgabe 2:
unidb.dtd,
students.xml,
anfrage.xpath
- 30.5.:
The query language: XQuery
Slides: XQuery
Exercise sheet 3: XQuery
(PostScript |
PDF)
- 31.5.: Discussion of Exercise Sheet 2,
solution [postscript,
pdf];
sample XML document fragment for Ex.4
- 6.6. XQuery (Cont'd)
- 7.6. Updating XML Data (same slide set as XQuery); The transformation language: XSLT
Slides: XSLT
- 13.6. XSLT (Cont'd).
Exercise sheet 4: XSLT
(PostScript |
PDF)
- 14.6.
Discussion of sample solutions for XPath/XQuery Exercises
[postscript,
pdf]
- 20.6. XSLT (Cont'd).
- 21.6. XSLT (Cont'd).
- 27.6. Global referencing in XML - the linking languages: XPointer and XLink
Slides: XLink
- 28.6. Discussion of Exercise Sheet 4 (XSLT)
Solution [postscript,
pdf]
- 4.7. XML Schema, APIs: DOM/SAX, Sonstiges
Slides: XML Schema,
Slides: DOM/SAX,
Literature etc..
- 5.7. XML Schema (Cont'd),
XML Databases
Slides: XML and Databases
Further information on XML & DB can e.g. be found here:
- 11.7. XML Databases (Cont'd)
Hinweis: die Folien wurden teilweise überarbeitet, daher neue Seitenzahlen.
Die Änderungen betreffen aber keine klausurrelevanten Dinge.
- 12.7.: Gastvortrag Accenture: Einsatz von XML in Projekten etc.
- Keine Vorlesung am 18.7.
Klausur:
- Donnerstag, 19.7. 13:30-15:30, Dauer 90 min.
GOE: MN67
CLZ: Werner-Grübmeyer-HS (CLZ, Hauptgebäude).
@CLZ: wie bei den übertragenen Vorlesungen üblich, ist die Klausur
der übliche Weg zum Scheinerwerb, als auch als vorgezogene
Diplomteilprüfung.
- Klausuranmeldung: Anmeldeschluss ist am 12.7., 23:59 Uhr
Anmeldung bitte auf jeden Fall per Mail an
may@informatik.uni-goettingen.de
(Vorname, Nachname, Matrikelnummer, Studiengang)!
(mit FlexNever kann keine Vollständigkeit der Listen garantiert werden).
Falls die Prüfung in FlexNever eingetragen ist, melden Sie sich bitte
dort ebenfalls an (dies erleichtert dem PA die Arbeit).
Derzeit können sich BSc-Studierende nach neuer PO offensichtlich nicht in
FlexNever anmelden [Melden Sie sich bitte per Mail beim Pruefungsamt - das PA
bestreitet, dass es Probleme gibt, geben koennte, oder je gegeben haben koennte].
- Zum Thema FlexNever: Schauen Sie mal nach, ob Ihre Kreditpunkte fuer "DB WS0607"
(6 CP) und "SQL-Praktikum 06" (6 CP neue PO, 9 CP alte PO wegen Übergangsregelung)
noch alle da sind.
Klausurergebnis
|