LD.Datenprojekt: Unterschied zwischen den Versionen

Aus LeipzigWiki
Zur Navigation springenZur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
(42 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
Home > [[Zukunftsakademie]]
Home > [[LD.LOD|Leipziger Initiative für Offene Daten]]


[[Kategorie:Leipzig]] [[Kategorie:Agenda21]]
[[Kategorie:LOD]]


== Zukunftsakademie: Erhebung der relevanten Angebotsstruktur in der Leipziger Region ==
== Leipziger Vereine und Offene Daten ==


Um in der Vernetzung von Angeboten im Themenbereich der [[Zukunftsakademie]] in der Leipziger Region voranzukommen, wie es eine der Zielstellungen der Zukunftsakademie vorsieht, ist eine Bestandsaufnahme bestehender Angebote erste Voraussetzung. Hierzu gilt es, zunächst die bereits vorhandenen, teilweise auch digital vorliegenden öffentlich verfügbarer Informationen über die einschlägige Angebotsstruktur auszuwerten.  
'''Diese Arbeiten sind nun in die [[LD.LOD|Leipziger Initiative für Offene Daten]] eingegliedert.'''


Eine Koordinierung und Vernetzung mit dem Projekt [[ZAK.API-Leipzig|API Leipzig]] ist anzustreben.
=== Ziel ===


=== Methodik ===
des LD.Datenprojekts war der Aufbau und die Weiterentwicklung einer gemeinsam bewirtschafteten verteilten Infrastruktur von Daten und Beschreibungen über die Aktivitäten der am Projekt beteiligten Vereine und freien Träger aus der Region Leipzig. Das Projekt wurde vor allem aus dem [[MINT]]-Netzwerk Leipzig heraus vorangetrieben.


In dem Zusammenhang wurde mit einer nach dem [http://de.wikipedia.org/wiki/Open_Data Open Data Prinzip] verfügbaren Sammlung derartiger Informationen begonnen, bei deren Erstellung moderne Konzepte semantischer Techniken zum Einsatz kommen, wie sie am [http://aksw.org Institut für Informatik] der Uni Leipzig entwickelt werden. Die Aktivitäten ordnen sich ein in die weltweiten Bemühungen, ein Netzwerk von [http://de.wikipedia.org/wiki/Linked_Open_Data Linked Open Data] - also öffentlich verfügbaren aktuellen Daten - zu schaffen, das nach einheitlichen Prinzipien aufgebaut ist und mit öffentlich verfügbaren Werkzeugen durchsucht werden kann. Das Institut für Informatik ist in diesem Bereich am europäischen Projekt [http://lod2.eu/Welcome.html LOD-2] führend beteiligt.
'''Beteiligte:'''
* Prof. Dr. Hans-Gert Gräbe, Netzprojekt Uni Leipzig, Projektleitung, MINT-Netzwerk
* Juliane Metschies, Dr. Cornelia Leser, Projekt "Lernen vor Ort" (läuft zum 31.08.2012 aus, keine Fortführung)
* Matthias Petzold, concept&technology, [[LD.API-Leipzig|API Leipzig]]
* AKSW-Gruppe, Uni Leipzig


In einer ersten Arbeitsphase soll ein digital nutz- und abfragbare Übersicht über Orte, Träger, Angebote, Adressen und engagierte Personen der relevanten Angebotsstruktur in der Leipziger Region entstehen. Dies kann - im Kontext des [http://www.dorfwiki.org/wiki.cgi?HansGertGraebe/NetzProjekt Netz-Projekts] - in einem datengetriebenen Ansatz zu einer öffentlich verfügbaren Darstellung dieser städtischen Strukturen weiter entwickelt werden. In [http://bis.informatik.uni-leipzig.de/OLAT/LVPlanung bewährter Weise] ist dazu in einem agilen Verfahren zusammen mit der initialen Datenerhebung eine [[ZAK.Ontologie|Ontologie auf RDF-Basis]] zu entwickeln.
'''Interessierte:'''
*<s> Thomas Kujawa, [[Familienfreund KG]]</s> (siehe Diskussion)
* Ulrike Müller, Dr. Kerstin Schilling, Schulverwaltungsamt
* Veronika Seidel, SBA-L (angefragt über MINT-Netzwerk, Herr Riethmüller)
* Jana Gregor, MPI MIS Leipzig, MINT-Netzwerk


Aus dieser primären Datenquelle können mit adäquaten Werkzeugen sekundäre Datensätze extrahiert und abgeleitete Materialien (Druckwerke, Webseiten) erstellt werden.
Im engeren Kontext der [[Zukunftsakademie]] haben an ersten Sondierungen teilgenommen
* Ralf Elsässer, Leipziger Agenda 21
* Rolf Mörchel
* Roland Quester, Umweltbibliothek Leipzig


Nutzer, Anbieter, Entwickler und Betreiber - Überlegungen zur Strukturierung der Interessengruppen (stakeholder) und die Kommunikation zwischen diesen sowie Vorstellungen zu einem langfristigen Betreibermodell zur Aktualisierung und Fortschreibung des Datenbestands sind noch zu ergänzen.
=== Grundlegende Überlegungen ===


=== Werkzeuge und Daten ===
Im Rahmen des Projekts ist zu unterscheiden zwischen
* lesendem Zugriff und Suche auf den Datenbeständen einerseits und
* der Pflege, Fortschreibung und Qualitätssicherung der Datenbestände andererseits.


Die primäre Datenbasis wird derzeit mit dem '''OntoWiki''', einem am Lehrstuhl "Betriebliche Informationssysteme" entwickelten webgestützten RDF-Ontologie-Werkzeug, verwaltet.  Dies ist jedoch keine Restriktion, da die damit erzeugten Datenformate auch von
'''1. Lesender Zugriff'''
[http://de.wikipedia.org/wiki/Ontologie-Editor anderen Ontologie-Editoren] verarbeitet werden können.


* '''http://hgg.ontowiki.net -> Projekt MINT-Daten''' - Instanz des OntoWiki, mit der die Daten strukturiert erfasst werden.
1.1. Das Projekt geht davon aus, dass sämtliche Informationen in den aufzubauenden Datenbeständen öffentlich zugänglich sind, damit beim lesenden Zugriff auf die Daten keine Zugriffsbeschränkungen durchzusetzen sind und somit die Entkopplung von Anwendung und Datenbasis als Grundlage für Linked Open Data möglich ist.
:Über eine [http://de.wikipedia.org/wiki/SPARQL SPARQL]-Schnittstelle kann frei auf die Daten zugegriffen werden. Insbesondere sind komplexe Suchanfragen auch von dritter Seite möglich. Auch lässt sich der gesamte Datenbestand (dies kann im weiteren Verlauf des Projekts eingeschränkt werden) im RDF-Format heruntergeladen werden. Mit Blick auf die erforderliche Datenqualität können nur dazu berechtigte Personen den Datenbestand eiditieren. Dazu bietet OntoWiki ebenfalls eine gut entwickelte Oberfläche.
* [[ZAK.Ontologie]] - Beschreibung der Struktur der Ontologie der Datenbasis


Mehr zum OntoWiki:
1.2. Anwendungen können über standardisierte RDF-Schnittstellen auf die Datenbestände zugreifen. Ein solcher Ansatz erlaubt auch die einfache Einbindung des Projekts in die Linked Open Data Cloud.
* https://idw-online.de/pages/de/news300375
* http://en.wikipedia.org/wiki/OntoWiki
* http://ontowiki.net/Projects/OntoWiki
Mehr zu datengetriebenen Entwicklungsansätzen:
* Gräbe, Hans-Gert; Riechert, Thomas: Operativ-administrative Daten, Ontologien und semantische Technologien – das Open Data Projekt der Fakultät für Mathematik und Informatik der Universität Leipzig. [http://www.informatik.uni-leipzig.de/~graebe/Texte/wel-10.pdf pdf]
* Gräbe, Hans-Gert; Riechert, Thomas; Martin, Michael: OD.FMI – Engineering operativ-administrativer Daten für die universitäre Lehre. [http://www.informatik.uni-leipzig.de/~graebe/Texte/delfi-11.pdf pdf]


Aus diesem Datenkorpus lassen sich mit entsprechenden Werkzeugen Daten für spezielle Zwecke zusammenstellen, etwa
1.3. Für Nutzer der Datenbestände als Backend werden prototypische Lösungen für standardisierte Aufgaben als Plugin für bestehende Standardlösungen für Web-Frontends, namentlich Wordpress, entwickelt.
* eine (prototypische) [http://www.informatik.uni-leipzig.de/~graebe/zak-data Übersicht] über Träger und Angebote oder
 
* eine (prototypische - Stand entspricht den bisher gesammelten Informationen) [http://leipzig-netz.de/MINT/ZAK-Heft.pdf Broschüre] zu Leipziger MINT-Angeboten (Stand 02.07.2011)
Dazu soll zunächst eine prototypische Lösung auf der Basis eines verbreiteten Web-Frameworks erstellt werden, die den Leistungsumfang der Such- und Darstellungsmöglichkeiten der Seiten http://www.umweltbildung-leipzig.de erreicht und damit die Leistungsfähigkeit eines solchen Ansatzes demonstriert.
 
'''2. Pflege und Fortschreibung des Datenbestands'''
 
Dazu ist ein Workflow zu entwickeln, der die nachhaltige Aktualisierung der Daten ebenso sichert wie die Qualität des Datenbestands. Hierbei ist die Partitionierung der Daten
* nach ihrer physischen Lokalisierung
* nach der Aktualisierungshalbwertzeit
* nach den Stakeholdern
zu gewährleisten und umzusetzen.
 
Dazu war ein sich agil weiterentwickelnder '''Datenbestand''' des Projekts über ein SPARQL-fähiges Portal http://zak.ontowiki.de erreichbar. Dieses wird derzeit nur noch für das Teilprojekt Inspirata-Daten verwendet.  
 
Die bisherige '''Beschreibung der Struktur des Datenbestands''' wurde unter [[LD.LEO]] eingeordnet.

Aktuelle Version vom 16. Januar 2013, 16:05 Uhr

Home > Leipziger Initiative für Offene Daten

Leipziger Vereine und Offene Daten

Diese Arbeiten sind nun in die Leipziger Initiative für Offene Daten eingegliedert.

Ziel

des LD.Datenprojekts war der Aufbau und die Weiterentwicklung einer gemeinsam bewirtschafteten verteilten Infrastruktur von Daten und Beschreibungen über die Aktivitäten der am Projekt beteiligten Vereine und freien Träger aus der Region Leipzig. Das Projekt wurde vor allem aus dem MINT-Netzwerk Leipzig heraus vorangetrieben.

Beteiligte:

  • Prof. Dr. Hans-Gert Gräbe, Netzprojekt Uni Leipzig, Projektleitung, MINT-Netzwerk
  • Juliane Metschies, Dr. Cornelia Leser, Projekt "Lernen vor Ort" (läuft zum 31.08.2012 aus, keine Fortführung)
  • Matthias Petzold, concept&technology, API Leipzig
  • AKSW-Gruppe, Uni Leipzig

Interessierte:

  • Thomas Kujawa, Familienfreund KG (siehe Diskussion)
  • Ulrike Müller, Dr. Kerstin Schilling, Schulverwaltungsamt
  • Veronika Seidel, SBA-L (angefragt über MINT-Netzwerk, Herr Riethmüller)
  • Jana Gregor, MPI MIS Leipzig, MINT-Netzwerk

Im engeren Kontext der Zukunftsakademie haben an ersten Sondierungen teilgenommen

  • Ralf Elsässer, Leipziger Agenda 21
  • Rolf Mörchel
  • Roland Quester, Umweltbibliothek Leipzig

Grundlegende Überlegungen

Im Rahmen des Projekts ist zu unterscheiden zwischen

  • lesendem Zugriff und Suche auf den Datenbeständen einerseits und
  • der Pflege, Fortschreibung und Qualitätssicherung der Datenbestände andererseits.

1. Lesender Zugriff

1.1. Das Projekt geht davon aus, dass sämtliche Informationen in den aufzubauenden Datenbeständen öffentlich zugänglich sind, damit beim lesenden Zugriff auf die Daten keine Zugriffsbeschränkungen durchzusetzen sind und somit die Entkopplung von Anwendung und Datenbasis als Grundlage für Linked Open Data möglich ist.

1.2. Anwendungen können über standardisierte RDF-Schnittstellen auf die Datenbestände zugreifen. Ein solcher Ansatz erlaubt auch die einfache Einbindung des Projekts in die Linked Open Data Cloud.

1.3. Für Nutzer der Datenbestände als Backend werden prototypische Lösungen für standardisierte Aufgaben als Plugin für bestehende Standardlösungen für Web-Frontends, namentlich Wordpress, entwickelt.

Dazu soll zunächst eine prototypische Lösung auf der Basis eines verbreiteten Web-Frameworks erstellt werden, die den Leistungsumfang der Such- und Darstellungsmöglichkeiten der Seiten http://www.umweltbildung-leipzig.de erreicht und damit die Leistungsfähigkeit eines solchen Ansatzes demonstriert.

2. Pflege und Fortschreibung des Datenbestands

Dazu ist ein Workflow zu entwickeln, der die nachhaltige Aktualisierung der Daten ebenso sichert wie die Qualität des Datenbestands. Hierbei ist die Partitionierung der Daten

  • nach ihrer physischen Lokalisierung
  • nach der Aktualisierungshalbwertzeit
  • nach den Stakeholdern

zu gewährleisten und umzusetzen.

Dazu war ein sich agil weiterentwickelnder Datenbestand des Projekts über ein SPARQL-fähiges Portal http://zak.ontowiki.de erreichbar. Dieses wird derzeit nur noch für das Teilprojekt Inspirata-Daten verwendet.

Die bisherige Beschreibung der Struktur des Datenbestands wurde unter LD.LEO eingeordnet.