T3N Article¶
Semantic Web in 1000 Worten¶
"The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation. " - Tim Berners-Lee http://kill.devc.at/system/files/scientific-american_0.pdf
Zukünftige Anwendungsfelder in CMS¶
Suchmaschienoptimierung mit RDF und Microformats¶
Seit Google Mitte 2009 ankündigte, semantische Daten in RDF und Microformaten zukünftig bei den Suchergebnissen, haben die Technologien des Semantischen Web einen neuen Anwendungsfall bekommen: die Suchmaschinenoptimierung.
Zukünftig kündigt Google an, zunächst Daten aus folgenden Kategorien zu beachten: Bewertungen, Personen, Unternehmen (Adressen), Veranstaltungen und Rezepte.
Diese Daten sollen dann gegebenenfalls bei den Suchergebnissen dargestellt werden. Es ist mir jedoch nicht gelungen, ein Beispiel zu finden, bei dem dies schon geschehen wäre.
[1] http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=99170
Semantische Suchmaschinen¶
Neben der Anreicherung von Suchergebnissen in Klassischen Suchmaschinen wie Google gibt es auch erste Semantische Suchmaschinen im Experimentierstadium. Die wohl bekannteste semantische Suchmaschine, Wolfram Alpha, liefert schon recht ansehnliche Ergebnisse in bestimmten Spezialgebieten. Jedoch sind die Anwendungsfälle semantischer Suchmaschinen noch so speziell, dass diese wohl in kürzerer Sicht die klassischen Suchmaschinen nicht verdrängen werden können. Da Wolfram Alpha jedoch nur Antworten zurückgibt, aber keine Webseiten verlinkt, lässt sich diese Suchmaschine auch nicht für mehr Traffic auf die eigene Seite nutzen. Wolfram Alpha bietet kostenpflichtige Lizenzen an, Suchergebnisse lassen sich dann mit einem REST Framework nutzen und in die eigene Webanwendung integrieren. Eine Nutzung in semantischen CMS wäre dann denkbar.
[2] http://www.wolframalpha.com/
Metadaten, Archivierung von analogen oder digitalisierten Dokumenten¶
Metadaten waren mit das früheste Anwendungsfeld des semantischen Netzes. Durch Mißbrauch in der Suchmaschinenoptimierung sind diese etwas in Verruf geraten, haben jedoch nach wie vor breite Anwendungsfelder. Weitverbreitet ist die Nutzung von Metadaten in Bezug auf Printdokumente in Bibliotheken, aber auch große Unternehmen müssen sich mit der Wiederauffindbarkeit von Dokumenten beschäftigen. Die Kataloge, Schlagwort- und Personenregister einer Bibliothek können als früher, analoger Vorfahre eines semantischen Netzes angesehen werden.
Bereitgestellt werden die Metadaten von den Bibliotheken heutzutage meist in durchsuchbaren Webportalen, am bekanntesten ist OPAC. Darüber hinaus werden die Metadaten auch zwischen den Bibliotheken ausgetauscht. Als Formate genutzt werden unter anderem Dublin Core und METS / MOTS. Metasuchmaschinen wie der KVK (Karlsruher Virtueller Katalog) ermöglichen wiederum Suchen über die Bestände vieler Bibliotheken.
Mehrere im Bibliotheksumfeld genutzte Portalsoftware beruhen dabei auf TYPO3, so der DFG Viewer [1], der neben der Anzeige von Digitalisierten Dokumenten auch deren Metadaten zur Verfügung stellt und Goobi [2], welches auch die Eingabe von Metadaten (und damit ein echtes Content-Management) unterstützt. Goobi basiert allerdings derzeit zum Teil noch auf Java Servlet Technologie. Zum Zeitpunkt der Goobi Entwicklung war die semantische Unterstützung durch TYPO3 noch nicht weit genug fortgeschritten.
[1] http://dfg-viewer.de/
[2] http://gdz.goobi.org/
Bessere Vernetzung des Contents innerhalb des eigenen Systems (Faceted Browsing)¶
Das eigene System als Datenquelle für andere Systeme (SPARQL Endpoint)¶
Stand der Umsetzung in ausgewählten CMS (Was ist in den aktuellen Releases bereits vorhanden? Was ist auf der offiziellen Roadmap? Wie ist der Stand der Diskussionen in den Communities (soweit bekannt)?)¶
Das Wettrennen der Content-Management Systeme auf das Semantische Web hat begonnen. 2005 wurde in der T3N Nr. 1 noch von der „Semantic Web Ernüchterung“ gesprochen. Doch mittlerweile benötigt vom Blogger bis zum weißen Haus jeder semantische Technologien.
Das teils aus EU-Mitteln finanzierte Projekt IKS will kleine und mittlere Content-Managemant-Systeme beim Sprung in das semantische Netz mit Informationen und Technologien unterstützen.
Zum Stand der Entwicklung in einigen ausgewählten CMS mehr unten.
[1] http://www.iks-project.eu/
Drupal¶
TYPO3¶
Wordpress¶
Auch wenn es sich bei Wordpress eigentlich um eine Blogsoftware handelt, so lässt sich doch Wordpress auch als einfaches Content-Management-System einsetzen. Die Datenstruktur von Wordpress unterstützt semantische Nutzung von Begriffen, so werden Terms (Kategorien und Tags) in einer gemeinsamen Tabelle gespeichert und können flexibel genutzt werden. Das Termsystem von Wordpress ermöglicht Termhierarchien (z.B. Untergruppen) jedoch keine Termnetze. Beziehungen zwischen Terms können nicht verschieden benannt werden.
Bei der Ausgabe semantischer Informationen unterstützt Wordpress FOAF (Friend-Of-A-Friend) bereits seit 2005. In Wordpress können auch Informationen aus Open Calais zum automatischen Tagging von Posts genutzt werden [2]. Es gibt Bestrebungen in der Community, RDFa besser nutzbar zu machen. Dazu gibt es bereits ein erstes Plugin, dass FOAF und Doubling Core Metadaten ausgibt [1].
[1] http://wordpress.org/extend/plugins/wp-rdfa/
[2] http://www.opencalais.com/category/gallery-tags/wordpress
Joomla¶
Bei Joomla gab es für den Summer of Code 2008 zwei Projekte in Planung und zwar ein Template für Anbindung an Linked Data und ein Template zur Anbindung an Triplify [1]. Weiterentwickelt wurde jedoch nur letzteres Projekt. Dieses liegt derzeit auf Eis und sucht nach Programmierern.
[1] http://docs.joomla.org/Code_04000
Plone¶
OntoWiki¶
Semantic-Web-Frameworks und -Services (Überblick über die Frameworks, die von den vorgestellten CMS verwendet werden.)¶
Erfurt¶
ARC2¶
OpenCalais¶
Ein gutes Beispiel für die Nutzung von semantischen Daten ist der Webservice „Open Calais“ [1]. Erwähnt wurde dieses auch bereits in einem eigenen T3N Artikel [2]. Dieser verfügt sowohl über REST als auch SOAP Schnittstellen. Open Calais kann als Eingabe unstrukturierte Daten in Text, HTML und XML Formaten verarbeiten. Open Calais erkennt im Text genannte Personen, Orte, Ereignisse, Technologien und mehr. Diese werden als RDF oder JSON zurückgegeben. Die semantischen Daten können als Listen zur Verwendung in Metadaten etc. aber auch als direkte semantische Auszeichnungen im Text genutzt werden. Die hierfür genutzen Daten stammen zunächst aus der Linked Data Cloud, es lassen sich jedoch bei Open Calais auch eigene Fakten verwalten.
Leider funktioniert Open Calais derzeit nur in Englisch. Weitere Sprachen sind zwar in Planung, aber noch nicht abzusehen. Angekündigt waren diese für 2009.
Drupal und Wordpress bieten bereits Schnittstellen zu Open Calais an. Durch die REST und SOAP Schnittstellen ist es jedoch möglich, jedes beliebige System anzubinden.
[1] http://www.opencalais.com/
[2] http://www.semantic-web.at/file_upload/3581_tmpphp2wnNoq.pdf
pOWL¶
RDFlib¶
Ausblick auf die weitere Entwicklung (Kurze Einschätzung der weiteren Entwicklung im Bereich des Semantic Web im Allgemeinen und innerhalb der vorgestellten CMS im Besonderen. Keine Wertung bezüglich einer Auswahlhilfe eines CMS.)¶
Link Collection¶
Use Cases¶
Here are two links where use cases for Semantic CMS have been discussed in 2009:
http://grep.codeconsult.ch/2009/03/10/looking-for-use-cases-for-a-semantically-enhanced-cms/
http://www.jroller.com/robertburrelldonkin/entry/semantic_content_repositories
Other Semantic CMS¶
The IKS Project - Building an interactive knowledge stack for CMS platforms (Drupal also plays a part here)
http://www.iks-project.eu/
http://drupal.org/node/455860
There is a mailing list for the iks project as well, some use-cases are discussed there as well: http://lists.iks-project.eu/cgi-bin/mailman/listinfo/iks-community
TYPO3, other projects¶
http://www.technikum-wien.at/fh/institute/information_engineering___security/projekte/?full=227
http://www.mathematik-21.de/publications/060919DMVBonn/060919DMV_Roggenbuck_CMS.pdf
http://groups.drupal.org/node/9711
http://docs.joomla.org/Code_04000
frühere Artikel zum Thema im T3N¶
http://t3n.de/magazin/semantic-web-ernuchterung-cms-semantik-lernt-219003/
http://t3n.de/news/web-30-forschungsprojekt-semantische-ontowiki-typo3-237937/
http://www.semantic-web.at/file_upload/3581_tmpphp2wnNoq.pdf Open Calais