Mal eben schnell unterwegs nachschauen was es in der Mensa zu Mittag gibt – oft sind schon zwei Klicks einer zu viel. Einen Bookmark oder Lesezeichen auf den Mensaplan der Universität-Duisburg-Essen zu setzen ist gar nicht so einfach. Der URL des Speiseplanes ist immer vom Datum abhängig, eigentlich sogar von der aktuellen Woche. Nett gemeint aber dennoch unpraktisch: Das Studentenwerk benennt den URL des aktuellen Speiseplans immer nach dem Schema „Kürzel Mensaname- Datum – erster Wochentag – Bindestrich – letzter Wochentag“.
Hier ein Beispiel:
http://studentenwerk.essen-duisburg.de/speiseplaene/hme_1203-1603.htm
Ein URL der z.B. auf hme_aktuell.htm enden würde, wäre viel besser geeignet, da man sich einfach ein Lesezeichen darauf setzen könnte. Außerdem interessiert es brennend was es heute zu essen gibt. Noch schöner wäre ein RSS-Feed der im Browser oder im mobilen RSS-Reader auch auf dem Smartphone darstellbar wäre, von einem echtem maschinenlesbarem Webservice per SOAP oder REST ganz zu schweigen.
Was tun in so einem Fall? Das Abgreifen von Daten über einfache Webseiten wird mit Web-Scraping oder auch Screen-Scraping bezeichnet. Es sind eine handvoll wirklich sehr nützliche Werkzeuge verfügbar, die teilweise in der Lage sind aus existierenden Webseiten echte Webservices zu generieren, welche sich auch für Web2.0 Mashups weiterverwenden lassen.
Für den einfachen Mensaplan reichen aber schon ein kleines Shellscript mit elinks, wget, iconv, sed, grep und html-tidy (zur Reparatur des fehlerhaften HTML-Exports diverser Microsoft-Produkte) aus, um einige valide RSS-Feeds nebst passender minimalistischer HTML-Seiten zu erzeugen.
Möge sich ein jeder nach gusto bedienen, es ist angerichtet, guten Appetit!
EDIT:
Ich habe auch noch eine mobile Version des Mensa-Speiseplanes für Webkit-basierte Smartphone-Browser (z.B. iPhone und Android) hinzugefügt:
http://www.uni-due.de/~bischoff/mensa/index.html
Insgesamt 6 Mensen werden aktuell unterstützt:
- Hauptmensa Essen
- Hauptmensa Duisburg
- Cafe Schützenbahn
- Bibliothek Duisburg
- Ins Grüne! Duisburg
- Klinikum Essen
Mittlerweile werden die Daten per Script aus PDF-Speiseplänen generiert!
RSS-Feed Hauptmensen Essen und Duisburg plus Cafe Schützenbahn in Essen:
http://www.uni-due.de/~bischoff/mensa/rss.xml
RSS-Feed nur Hauptmensa Essen:
http://www.uni-due.de/~bischoff/mensa/hauptmensa_essen_rss.xml
HTML-Seite dazu:
http://www.uni-due.de/~bischoff/mensa/hauptmensa_essen.html
RSS-Feed nur Hauptmensa Duisburg:
http://www.uni-due.de/~bischoff/mensa/hauptmensa_duisburg_rss.xml
HTML-Seite dazu:
http://www.uni-due.de/~bischoff/mensa/hauptmensa_duisburg.html
RSS-Feed nur Cafe Schützenbahn:
http://www.uni-due.de/~bischoff/mensa/cafe_sch_essen_rss.xml
HTML-Seite dazu:
http://www.uni-due.de/~bischoff/mensa/cafe_sch_essen.html
Schreibe einen Kommentar