T3N Article

Semantic Web in 1000 Worten

"The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation. " - Tim Berners-Lee http://kill.devc.at/system/files/scientific-american_0.pdf

Zukünftige Anwendungsfelder in CMS

Suchmaschienoptimierung mit RDF und Microformats

Seit Google Mitte 2009 ankündigte, semantische Daten in RDF und Microformaten zukünftig bei den Suchergebnissen, haben die Technologien des Semantischen Web einen neuen Anwendungsfall bekommen: die Suchmaschinenoptimierung.
Zukünftig kündigt Google an, zunächst Daten aus folgenden Kategorien zu beachten: Bewertungen, Personen, Unternehmen (Adressen), Veranstaltungen und Rezepte.
Diese Daten sollen dann gegebenenfalls bei den Suchergebnissen dargestellt werden. Es ist mir jedoch nicht gelungen, ein Beispiel zu finden, bei dem dies schon geschehen wäre.
[1] http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=99170

Semantische Suchmaschinen

Neben der Anreicherung von Suchergebnissen in Klassischen Suchmaschinen wie Google gibt es auch erste Semantische Suchmaschinen im Experimentierstadium. Die wohl bekannteste semantische Suchmaschine, Wolfram Alpha, liefert schon recht ansehnliche Ergebnisse in bestimmten Spezialgebieten. Jedoch sind die Anwendungsfälle semantischer Suchmaschinen noch so speziell, dass diese wohl in kürzerer Sicht die klassischen Suchmaschinen nicht verdrängen werden können. Da Wolfram Alpha jedoch nur Antworten zurückgibt, aber keine Webseiten verlinkt, lässt sich diese Suchmaschine auch nicht für mehr Traffic auf die eigene Seite nutzen. Wolfram Alpha bietet kostenpflichtige Lizenzen an, Suchergebnisse lassen sich dann mit einem REST Framework nutzen und in die eigene Webanwendung integrieren. Eine Nutzung in semantischen CMS wäre dann denkbar.
[2] http://www.wolframalpha.com/

Metadaten, Archivierung von analogen oder digitalisierten Dokumenten

Metadaten waren mit das früheste Anwendungsfeld des semantischen Netzes. Durch Mißbrauch in der Suchmaschinenoptimierung sind diese etwas in Verruf geraten, haben jedoch nach wie vor breite Anwendungsfelder. Weitverbreitet ist die Nutzung von Metadaten in Bezug auf Printdokumente in Bibliotheken, aber auch große Unternehmen müssen sich mit der Wiederauffindbarkeit von Dokumenten beschäftigen. Die Kataloge, Schlagwort- und Personenregister einer Bibliothek können als früher, analoger Vorfahre eines semantischen Netzes angesehen werden.

Bereitgestellt werden die Metadaten von den Bibliotheken heutzutage meist in durchsuchbaren Webportalen, am bekanntesten ist OPAC. Darüber hinaus werden die Metadaten auch zwischen den Bibliotheken ausgetauscht. Als Formate genutzt werden unter anderem Dublin Core und METS / MOTS. Metasuchmaschinen wie der KVK (Karlsruher Virtueller Katalog) ermöglichen wiederum Suchen über die Bestände vieler Bibliotheken.

Mehrere im Bibliotheksumfeld genutzte Portalsoftware beruhen dabei auf TYPO3, so der DFG Viewer [1], der neben der Anzeige von Digitalisierten Dokumenten auch deren Metadaten zur Verfügung stellt und Goobi [2], welches auch die Eingabe von Metadaten (und damit ein echtes Content-Management) unterstützt. Goobi basiert allerdings derzeit zum Teil noch auf Java Servlet Technologie. Zum Zeitpunkt der Goobi Entwicklung war die semantische Unterstützung durch TYPO3 noch nicht weit genug fortgeschritten.

[1] http://dfg-viewer.de/
[2] http://gdz.goobi.org/

Bessere Vernetzung des Contents innerhalb des eigenen Systems (Faceted Browsing)

Das eigene System als Datenquelle für andere Systeme (SPARQL Endpoint)

Stand der Umsetzung in ausgewählten CMS (Was ist in den aktuellen Releases bereits vorhanden? Was ist auf der offiziellen Roadmap? Wie ist der Stand der Diskussionen in den Communities (soweit bekannt)?)

Das Wettrennen der Content-Management Systeme auf das Semantische Web hat begonnen. 2005 wurde in der T3N Nr. 1 noch von der „Semantic Web Ernüchterung“ gesprochen. Doch mittlerweile benötigt vom Blogger bis zum weißen Haus jeder semantische Technologien.

Das teils aus EU-Mitteln finanzierte Projekt IKS will kleine und mittlere Content-Managemant-Systeme beim Sprung in das semantische Netz mit Informationen und Technologien unterstützen.

Zum Stand der Entwicklung in einigen ausgewählten CMS mehr unten.

[1] http://www.iks-project.eu/

Drupal

TYPO3

Wordpress

Auch wenn es sich bei Wordpress eigentlich um eine Blogsoftware handelt, so lässt sich doch Wordpress auch als einfaches Content-Management-System einsetzen. Die Datenstruktur von Wordpress unterstützt semantische Nutzung von Begriffen, so werden Terms (Kategorien und Tags) in einer gemeinsamen Tabelle gespeichert und können flexibel genutzt werden. Das Termsystem von Wordpress ermöglicht Termhierarchien (z.B. Untergruppen) jedoch keine Termnetze. Beziehungen zwischen Terms können nicht verschieden benannt werden.

Bei der Ausgabe semantischer Informationen unterstützt Wordpress FOAF (Friend-Of-A-Friend) bereits seit 2005. In Wordpress können auch Informationen aus Open Calais zum automatischen Tagging von Posts genutzt werden [2]. Es gibt Bestrebungen in der Community, RDFa besser nutzbar zu machen. Dazu gibt es bereits ein erstes Plugin, dass FOAF und Doubling Core Metadaten ausgibt [1].

[1] http://wordpress.org/extend/plugins/wp-rdfa/
[2] http://www.opencalais.com/category/gallery-tags/wordpress

Joomla

Bei Joomla gab es für den Summer of Code 2008 zwei Projekte in Planung und zwar ein Template für Anbindung an Linked Data und ein Template zur Anbindung an Triplify [1]. Weiterentwickelt wurde jedoch nur letzteres Projekt. Dieses liegt derzeit auf Eis und sucht nach Programmierern.

[1] http://docs.joomla.org/Code_04000

Plone

OntoWiki

Semantic-Web-Frameworks und -Services (Überblick über die Frameworks, die von den vorgestellten CMS verwendet werden.)

Erfurt

ARC2

OpenCalais

Ein gutes Beispiel für die Nutzung von semantischen Daten ist der Webservice „Open Calais“ [1]. Erwähnt wurde dieses auch bereits in einem eigenen T3N Artikel [2]. Dieser verfügt sowohl über REST als auch SOAP Schnittstellen. Open Calais kann als Eingabe unstrukturierte Daten in Text, HTML und XML Formaten verarbeiten. Open Calais erkennt im Text genannte Personen, Orte, Ereignisse, Technologien und mehr. Diese werden als RDF oder JSON zurückgegeben. Die semantischen Daten können als Listen zur Verwendung in Metadaten etc. aber auch als direkte semantische Auszeichnungen im Text genutzt werden. Die hierfür genutzen Daten stammen zunächst aus der Linked Data Cloud, es lassen sich jedoch bei Open Calais auch eigene Fakten verwalten.

Leider funktioniert Open Calais derzeit nur in Englisch. Weitere Sprachen sind zwar in Planung, aber noch nicht abzusehen. Angekündigt waren diese für 2009.

Drupal und Wordpress bieten bereits Schnittstellen zu Open Calais an. Durch die REST und SOAP Schnittstellen ist es jedoch möglich, jedes beliebige System anzubinden.

[1] http://www.opencalais.com/
[2] http://www.semantic-web.at/file_upload/3581_tmpphp2wnNoq.pdf

pOWL

RDFlib

Ausblick auf die weitere Entwicklung (Kurze Einschätzung der weiteren Entwicklung im Bereich des Semantic Web im Allgemeinen und innerhalb der vorgestellten CMS im Besonderen. Keine Wertung bezüglich einer Auswahlhilfe eines CMS.)

Link Collection

Use Cases

Here are two links where use cases for Semantic CMS have been discussed in 2009:

http://grep.codeconsult.ch/2009/03/10/looking-for-use-cases-for-a-semantically-enhanced-cms/
http://www.jroller.com/robertburrelldonkin/entry/semantic_content_repositories

http://wiki.iks-project.eu/index.php/User-stories

Other Semantic CMS

The IKS Project - Building an interactive knowledge stack for CMS platforms (Drupal also plays a part here)
http://www.iks-project.eu/
http://drupal.org/node/455860

There is a mailing list for the iks project as well, some use-cases are discussed there as well: http://lists.iks-project.eu/cgi-bin/mailman/listinfo/iks-community

TYPO3, other projects

http://www.technikum-wien.at/fh/institute/information_engineering___security/projekte/?full=227
http://www.mathematik-21.de/publications/060919DMVBonn/060919DMV_Roggenbuck_CMS.pdf
http://groups.drupal.org/node/9711
http://docs.joomla.org/Code_04000

frühere Artikel zum Thema im T3N

http://t3n.de/magazin/semantic-web-ernuchterung-cms-semantik-lernt-219003/
http://t3n.de/news/web-30-forschungsprojekt-semantische-ontowiki-typo3-237937/
http://www.semantic-web.at/file_upload/3581_tmpphp2wnNoq.pdf Open Calais

Open_Calais.png - Open Calais Screenshot (339.9 kB) Lina Wolf, 2010-10-13 10:11

google.png (18.5 kB) Lina Wolf, 2010-10-25 15:29