Feed me – Appetit auf RSS-Feeds? Oder auf einen mobilen Mensa-Speiseplan der Universität Duisburg-Essen?

Mal eben schnell unterwegs nachschauen was es in der Mensa zu Mittag gibt – oft sind schon zwei Klicks einer zu viel. Einen Bookmark oder Lesezeichen auf den Mensaplan der Universität-Duisburg-Essen zu setzen ist gar nicht so einfach. Der URL des Speiseplanes ist immer vom Datum abhängig, eigentlich sogar von der aktuellen Woche. Nett gemeint aber dennoch unpraktisch: Das Studentenwerk benennt den URL des aktuellen Speiseplans immer nach dem Schema „Kürzel Mensaname- Datum – erster Wochentag – Bindestrich – letzter Wochentag“.

Hier ein Beispiel:

http://studentenwerk.essen-duisburg.de/speiseplaene/hme_1203-1603.htm

Ein URL der z.B. auf hme_aktuell.htm enden würde, wäre viel besser geeignet, da man sich einfach ein Lesezeichen darauf setzen könnte. Außerdem interessiert es brennend was es heute zu essen gibt. Noch schöner wäre ein RSS-Feed der im Browser oder im mobilen RSS-Reader auch auf dem Smartphone darstellbar wäre, von einem echtem maschinenlesbarem Webservice per SOAP oder REST ganz zu schweigen.

Was tun in so einem Fall? Das Abgreifen von Daten über einfache Webseiten wird mit Web-Scraping oder auch Screen-Scraping   bezeichnet.  Es sind eine handvoll wirklich sehr nützliche Werkzeuge verfügbar, die teilweise in der Lage sind aus existierenden Webseiten echte Webservices zu generieren, welche sich auch für Web2.0 Mashups weiterverwenden lassen.

Für den einfachen Mensaplan reichen aber schon ein kleines Shellscript mit elinks, wget, iconv, sed, grep und html-tidy (zur Reparatur des fehlerhaften HTML-Exports diverser Microsoft-Produkte) aus, um einige valide RSS-Feeds nebst passender minimalistischer HTML-Seiten zu erzeugen.

Möge sich ein jeder nach gusto bedienen, es ist angerichtet, guten Appetit!

EDIT:

Ich habe auch noch eine mobile Version des Mensa-Speiseplanes für Webkit-basierte Smartphone-Browser (z.B. iPhone und Android) hinzugefügt:

http://www.uni-due.de/~bischoff/mensa/index.html

Insgesamt 6 Mensen werden aktuell unterstützt:

Mittlerweile werden die Daten per Script aus PDF-Speiseplänen generiert!

RSS-Feed Hauptmensen Essen und Duisburg plus Cafe Schützenbahn in Essen:

http://www.uni-due.de/~bischoff/mensa/rss.xml

RSS-Feed nur Hauptmensa Essen:

http://www.uni-due.de/~bischoff/mensa/hauptmensa_essen_rss.xml

HTML-Seite dazu:

http://www.uni-due.de/~bischoff/mensa/hauptmensa_essen.html

RSS-Feed nur Hauptmensa Duisburg:

http://www.uni-due.de/~bischoff/mensa/hauptmensa_duisburg_rss.xml

HTML-Seite dazu:

http://www.uni-due.de/~bischoff/mensa/hauptmensa_duisburg.html

RSS-Feed nur Cafe Schützenbahn:

http://www.uni-due.de/~bischoff/mensa/cafe_sch_essen_rss.xml

HTML-Seite dazu:

http://www.uni-due.de/~bischoff/mensa/cafe_sch_essen.html

 


Beitrag veröffentlicht

in

, ,

von

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert