Abstracts

 

Semantic Web - ein Thema für Bibliotheksverbünde / Silke Schomburg

Entwickelt sich das Semantic Web nur zu einem noch weiteren Hype oder hat es eine wichtige strategische Bedeutung für Bibliotheken und ihre Verbünde? Wie kann das Semantic Web die Bibliothekslandschaft und die Informationsversorgung verändern? Warum sollten sich bibliothekarische Einrichtungen mit der Idee des Semantic Web auseinander setzen und die Technologien einsetzen? Welche Chancen bringt diese Technologie den Bibliotheken? Welchen Risiken und Herausforderungen muss man sich stellen? Der Vortrag gibt Antworten auf diese Fragen und stellt mögliche Szenarien für konkrete Anwendungen und perspektive Ziele, vor allem aus der Sicht eines Bibliotheksverbundes, vor.

Potenziale semantischer Technologien für die Bibliothek der Zukunft / Klaus Tochtermann

Ausgehend von der heutigen Situation, in der Bibliotheken semantische Technologien primär im Zusammenhang ihrer Datenbestände untersuchen, zeigt der Vortrag, in welcher Form semantische Technologien - darauf aufbauend - die Bibliothek der Zukunft gestalten können. Dies betrifft zum einen die Unterstützung des Forschungs- und Publikationsprozesses von Forschenden und zum anderen die Bereitstellung innovativer Bibliotheksservices. In diesem Kontext wird speziell auf Semantik-gestütze Arbeitsplätze sowie das Internet of Services als Teilaspekt des Future Internet eingegangen. Der Vortrag wird u.a. folgende Kernaussagen machen: 1. Die heutigen Diskussionen zum Thema Informationsqualität werden zukünftig durch Diskussionen zum Thema Servicequalität abgelöst. 2. Das heutige Paradigma des "Information Pulls" wird zukünftig verstärkt durch das Paradigma des "semantic-enhanced Information Push" abgelöst.

Linked data at the National Széchényi Library - road to the publication / Ádám Horváth

The presentation will focus on how we published our linked data and the tasks to be carried out to be able to publish the data. The presentation will begin with a short introduction of the library, the staff and the software and hardware infrastructure from the point of view of our topic. In the second part of the presentation I will explain what we have published and how it was published. The third part will be about the processes of the actual publication, and the tools used for the publication. Finally I would like to speak about some future plans.

Kollaboration durch das Semantic Web:
Strategie und Aktivitäten der Deutschen Nationalbibliothek
/ Reinhard Altenhöner

2010 hat die Deutsche Nationalbibliothek (DNB) damit begonnen, ihre Wissensbasis bestehend aus bibliographischen Daten und den Normdaten als Linked Data zu publizieren. Vor allem Normdaten bilden für die Erschließungsarbeit in Gedächtniseinrichtungen wie Museen, Archiven und Bibliotheken schon jetzt eine wichtige Basis. Ziel der DNB ist es jetzt, mit der Publikation der Daten als Tripel eine direkte Nutzung der gesamten nationalbibliografischen Daten und der Normdaten durch die Semantic-Web-Community zu ermöglichen und damit neue Nutzungsgruppen anzusprechen. Auf diese Weise eröffnen sich auch neue Wege der kooperativen Datennutzung: Durch die Verlinkung mit externen Datensets aus anderen Domänen gewinnen die bibliografischen Daten an Kontext und damit an Relevanz im World Wide Web, umgekehrt bieten externe Datensets das Potential, die eigenen Dienstleistungen zu verbessern und auszubauen.

Diese sichtbaren Schritte sind aber nur ein Glied in einer Kette anderer Aktivitäten, deren Nährboden Technologien und Werkzeuge aus dem Umfeld des Semantic Web sind. Dies gilt in besonderem Maße für den Usecase CONTENTUS im Rahmen der THESEUS-Förderinitiative, aber auch für eine Reihe weiterer Projekte und Vorhaben, die der semantischen Anreicherung und Verlinkung von Daten ebenso dienen wie ihrer adäquaten (stabilen) Bereitstellung und Nutzung in neuen Suchumgebungen. In den Blick kommt so eine neue, kooperativ getragene Dimension der Informationsaggregation, -integration und -bereitstellung. Langfristiges Ziel ist es, Bibliotheken und andere kulturelle Einrichtungen als ein verlässliches Rückgrat des Webs der Daten zu etablieren. Der Beitrag stellt strategische Überlegungen, konkrete Planungen und Aktivitäten der DNB vor.

data.bnf.fr: describing library resources through an information hub / Romain Wenz

In order to make its data more useful on the Web, the French national library has designed a new project. This "data.bnf.fr" project is still at an early stage. We are only starting to build the information hub that will allow us to gather the data from our various datasets. The BnF wishes to build Web pages, gathering resources around the concepts of "works" and "authors". The project involves transforming existing data, enriching and interlinking the dataset with internal and external resources, and publishing HTML pages for browsing by users and search engines. The raw data would also be accessible in RDF following the principles of linked data architecture. Our purpose is to use common standards, and to comply with the requirements of the Semantic Web. In this project, it is both a matter of interoperability with external sources, and of our own different datasets, since we have to align resources from several catalogues. Therefore, trying to provide a significant hub in the "linked data" cloud also has strong internal strategic issues, mainly in terms of bibliographic descriptions and choices (e.g. FRBR, RDA, integration of EAD). Technically speaking, our purpose is to gather data around concepts that focus on bibliographic entities.

W3C Working Group for Libraries and other institutions in the cultural heritage sector / Antoine Isaac

In the last couple of years, the linked data approach to data publishing, sharing and interlinking has gained momentum. A growing amount of data is being openly released on the web using RDF. Some libraries have already jumped in, and the community as a whole manifests great interest in the topic. Yet there remains some technical or organization issues to a wide linked data adoption in the library domain, which requires more outreach and technology mapping work. This is one of the main missions of the Library Linked Data incubator group, a one-year effort launched in May 2010 by the W3C "to help increase global interoperability of library data on the Web, by bringing together people involved in Semantic Web activities—focusing on Linked Data—in the library community and beyond, building on existing initiatives, and identifying collaboration tracks for the future." I will present the objectives of this group, as well as a mid-term report on the work being done.

Von offenen Daten zu einem Ökosystem vernetzten Wissens / Sören Auer

Die Veröffentlichung und Verknüpfung von Daten im Web hat in den letzten Jahren im Zuge der Linked Data Initiative enormen Zuspruch gefunden. Um das sich auf diese Weise entwickelnde Daten Web jedoch zu einem für alle nutzbaren Ökosystem vernetzten Wissens zu entwickeln sind jedoch noch einige Herausforderungen zu bewältigen: Neben der Verbesserung der Qualität und Kohärenz der Informationen im Daten Web ist insbesondere die Schaffung direkter Mehrwerte für Endanwender notwendig. Bibliotheken, mit ihren gigantischen Wissensbeständen können dazu einen wichtigen Beitrag liefern, wenn z.B. die hochwertigen bibliographischen Informationen mit Hintergrundwissen aus dem Daten Web verknüpft werden. In diesem Vortrag betrachten wir aktuelle Entwicklungen im Kontext des Web der offenen Daten und zeigen Potentiale und Visionen für Anwendungen im Umfeld von Bibliotheken auf.

Eine Annäherung an Open Data aus juristischer Sicht / Stefanie Grunow

Der Bereich Open Data wurde bei den letzten Änderungen des Urheberrechts, des Datenschutzrechts und angrenzenden Rechtsgebieten vom Gesetzgeber nur am Rande wahrgenommen. Eine auch von juristischer Seite her betrachtet klare Strategie zum Umgang mit dem Thema Open Data existiert daher bislang nicht. Der Vortrag soll zunächst einen Überblick über die urheberrechtliche Einordnung von Open Data in die Werkarten des Urheberrechts geben. Insbesondere wird der Schutz von Datenbankherstellern betrachtet und dabei eine Abgrenzung zu den klassischen Werkarten des Urheberrechts vorgenommen. Um Handlungsalternativen hinsichtlich des Umgangs mit freien Daten in der Praxis zu finden, werden die Möglichkeiten und Grenzen von verschiedenen Lizenzen und Waivern erläutert.

Yes We Can! Libraries and the Semantic Web / Karen Coyle

From the book catalogue to the card catalogue to the online catalogue, libraries have adapted their practices to take advantage of new technologies, and have used these advancements to better serve library users. The next step in this evolution is already on the horizon: it is the web of data known commonly as the Semantic Web. Re-imagining library catalogues as a web of data has great potential for library users and all information seekers. Like the web of documents that is the current World Wide Web, the Semantic Web makes connections between resources. The Semantic Web, however, makes those connections meaningful. The transformation to Semantic Web style of metadata will allow libraries to serve users directly on the web, and will make possible an enhanced discovery environment that links documents and data in a rich web of relationships. The transformation of current library data to "linked data," with entities and relationships, has already begun. After a brief introduction to the concepts that underly the Semantic Web, Coyle will show how the library community is developing the structures necessary for the transformation. This development begins with a domain model (FRBR and other FR's), a standardized definition of data elements (DC, RDA, and others), the definition of relationships (FRBR and RDA), and the creation of machine-readable controlled vocabularies (Library of Congress and RDA). Experimentation with new data models, such as in the Open Library and Freebase, illustrate the value of this approach.

Linked-RDA-Data in der Praxis / Sarah Hartmann & Alexander Haffner

Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.

Semantic Web-Aktivitäten im hbz / N.N.

Seit Mitte 2009 setzt sich das hbz mit der Technologie des Semantic Web auseinander. Dieser Vortrag soll einen kurzen Überblick über die Aktivitäten geben. Folgendes wird angerissen: Identifier für Bibliotheken und andere bibliothekarische Institutionen, die Veröffentlichungen von Klassifikationen als SKOS-Daten und nicht zuletzt die Umwandlung von bibliographischen Daten in Linked Data und die Fragen, die dadurch entstanden: Welche Vokabularien sollen eingesetzt werden? Welche Rolle spielt FRBR? Welche Herausforderungen ergaben sich durch das Quellformat MAB2? Außerdem haben die Verbundsbibliotheken und das hbz sich mit der rechtlichen Frage des Open Data auseinandersetzen müssen.

Exposing the University of Economics‘ academic bibliography database as linked data / Jitka Hladká

Academic bibliography of the University of Economics in Prague consists of bibliographic records of publications involving journal articles, conference papers, lecture notes, monographs and monograph chapters created by the academic staff of the university. We would like to discuss the experiences gained in the process of this dataset's transformation from its current data format to RDF-based data. During the course of conversion we will specify the entity types in our data and choose a way to model them. For data description we are going to use the most popular and widely implemented vocabularies and domain ontologies. Next, we will discuss the issues associated with interlinking the data with relevant and well-established datasets constituting a part of the web of data (e.g., DBLP Computer Science Bibliography).

We would like to examine further possibilities of data re-use by making the data suitable for other applications such as citation managers (e.g., Zotero) to generate citations automatically. We are also interested in providing users with the information about availability of a resource as full text or as library holding, so we discuss cooperation with link resolvers (SFX, in our case) as well as other possible ways of linking. In this way, aligned with the concept of the semantic web, we maintain that the potential of the data would be maximized, as the information in bibliographic records would become easy to share, more visible due to incoming links, and more ready to be processed by web applications. We argue that academic bibliography data should be openly available, so it increases transparency of publishing activity of the university's academic staff. Beyond being re-usable, the data can be easily linked to so that they must not be duplicated at multiple locations. Likewise, these features together can provide a few benefits for bibliometric evaluation of science. The adoption of linked data publishing model for academic bibliography datasets involves moving to a more flexible data format for bibliographic data. While linked data is seen as a pragmatic implementation of the semantic web, we argue that it is not possible to implement the library data vision with the MARC, current standard for bibliographic data. Obviously, there is a need for more web-compatible and web-friendly data model. With this in mind, we suggest linked data as a part of the pragmatic implementation of the vision for bibliographic data on the Web.

Semantic-Web-Anwendungen auf Basis des BAM-Portals – Ein Prototyp / Volker Conradt

Das BSZ betreibt BAM, das gemeinsame Portal zu Bibliotheken, Archive, Museen. Das Portal sammelt die Metadaten von diesen drei kulturellen Sektoren, indexiert sie mit Hilfe der technischen Plattform Lucene und macht sie als zentraler Nachweispunkt von Kulturgütern einer breiten Öffentlichkeit zugänglich. Gegenwärtig umfassen die Bestände des BAM-Portals rund 42,8 Millionen Datensätze, davon rund 1,8 Millionen Digitalisate, die von mehreren großen Bibliotheken bzw. Bibliotheksverbünden, 16 Museen und Museumsnetzwerken sowie mehreren Archiven eingebracht werden. Auf Basis dieser Daten erstellt das BSZ zurzeit einen Prototyp, der diese Metadaten über XSLT-Transformationen in RDF-Tripel umwandelt. Die Tripel werden in eine Semantic-Web-taugliche Datenbank integriert und verknüpft. Mit einer prototypischen Implementierung einer Weboberfläche mit Suchformular, können SPARQL-Abfrage-Logik und erste Ergebnisausgaben erprobt werden. Der Vortrag stellt die Vorgehensweise bei der Erstellung dieses Prototyps dar und präsentiert erste Ergebnisse, Erfahrungen und Erkenntnisse.

ZBW Pressearchiv: Linked Data mit OAI-ORE / Joachim Neubert

Das Pressearchiv der ZBW umfasst rund 6 Millionen Artikel. Bis 2005 wurden dort inhaltlich strukturierte Mappen zu Personen, Firmen, Sachthemen und Waren geführt. Um die digitalisierten Bestände unter eindeutigen Adressen zugreifbar und zitierbar zu machen, werden sie derzeit als Linked Open Data aufbereitet. Zum Einsatz kommt der OAI-ORE Standard, der die Adressierung und Beschreibung tief geschachtelter Aggregationen ermöglicht. Anhand des Projektes wird deutlich, wie mit ORE zentrale Probleme aus der Bibliotheks- wie auch der Cultural-Heritage-Welt gelöst werden können. Der W3C-Standard RDFa erlaubte die gradlinige Erstellung einer REST-basierten Webapplikation. Ansätze zur Überwindung von Performance- und Verfügbarkeitsengpässen werden im Vortrag dargestellt. Zugleich wird demonstriert, wie vorhandene Resourcen mit Daten aus der LOD Cloud angereichert werden können, indem z.B. via PND und DBpedia Abstracts aus Wikipedia in die Anzeige integriert werden

Linked Open Projects: Der Linked Data Dienst der UB Mannheim / Kai Eckert & Magnus Pfeffer

Die Universitätsbibliothek Mannheim hat dieses Jahr ihren Linked Data Dienst vorgestellt und damit als erste Bibliothek in Deutschland die Titeldaten ihres Katalogs als Linked Data prototypisch zugänglich gemacht. Der Dienst soll vor allem dazu genutzt werden, Ergebnisse aus Forschungsprojekten der UB Mannheim zur leichten Nachnutzung zur Verfügung zu stellen. Dazu bietet Linked Data die ideale Infrastruktur. Im Rahmen dieses Vortrags werden die technischen Hintergründe des Dienstes kurz vorgestellt und demonstriert, wie sich Ergebnisse einer automatischen Klassifikation und einer automatischen Inhaltserschließung als Linked Data publizieren lassen.

Semantic Web in der bibliothekarischen Ausbildung - Welche Kompetenzen müssen vermittelt werden? / Günther Neher & Dierk Eichel

Semantic Web- und insbesondere Linked-Data-Infrastrukturen eröffnen eine Vielzahl neuer Möglichkeiten der Anwendung klassischer bibliothekarischer, allgemein informationswissenschaftlicher Kompetenzen im Bereich der Organisation von Information und Wissensvermittlung. Die Kombination aus klassischen informationswissenschaftlichen Kompetenzen und belastbaren, anwendungsorientierten Kenntnissen von Semantic-Web-Konzepten und -Infrastrukturen bietet nach Meinung der Autoren ein grosses Anwendungspotential in vielen, auch nicht-bibliothekarischen Bereichen. Die Vermittlung dieser Schnittstellenkompetenz erweist sich in der Lehre jedoch häufig als nichttriviale Gradwanderung. Aus den Erfahrungen entsprechender Lehrveranstaltungen wird in dem Vortrag versucht, aus Dozentensicht (Günther Neher) und aus Studierendensicht (Dierk Eichel), die Frage zu klären, welche Kernkompetenzen zukünftigen "Semantic Web-Bibliothekaren" vermittelt werden müssen und wie dies am besten zu bewerkstelligen ist.