Fachbeitrag Mehr Transparenz in der Energie­forschungsförderung

Öffentliche Schnittstelle: Mit EnArgus.public lassen sich Ergebnisse einer Suche mit Synonymen nach Thema und Bundesland filtern.

Bild: EnArgus
21.10.2014

EnArgus, ein interdisziplinäres Forschungsprojekt von Energieforschern, Informatikern und Linguisten, stellt ein neues Wiki für ausgewählte Themen der Energieforschung bereit: Es ist Basis für ontologiebasierte Suchen in großen Datenbanken von Fördervorhaben.

Am Anfang des EnArgus-Projekts stand der Gedanke, staatliche Förderpolitik in der Energieforschung transparenter zu gestalten und die Bewertung von Technologieentwicklungen zu erleichtern – beides erklärte Ziele des 6. Energie­forschungsprogramms der Bundesregierung. Die Projektpartner entwickelten dazu ein zentrales Informationssystem für Energieforschungsvorhaben. EnArgus bietet Wissenschaftlern, Projektträgern und Politikern sowie der interessierten Öffentlichkeit einen einheitlichen und zentralen Zugang zu Informationen über die Energieforschung in der Bundesrepublik. Darin werden keine neuen Daten erhoben, sondern bestehende Vorhabendatenbasen aus verschiedenen Quellen eingebunden.

Zunächst wurde eine ausführliche Anforderungsanalyse durchgeführt. Dazu wurden durch Befragungen die Anforderungen unterschiedlicher Nutzer (Forscher, Projektträger, Öffentlichkeit) an Projektdatenbanken ermittelt. Typische Fragestellungen der Anwender wurden in detaillierter Form zusammengestellt (etwa Informationslieferung für den Bundesbericht Energieforschung, Erstellung von IEA-Statistiken, Beantwortung von Anfragen aus dem Bundestag, Recherchen von Forschern zu Stand der Technik und Forschung sowie zu möglichen Kooperationspartnern). So entstand eine Liste der Probleme, die bei der Beantwortung dieser typischen Fragestellungen üblicherweise auftreten. Auch die üblichen Vorgehensweisen von Energieforschern bei Recherchen wurden im Rahmen der Anforderungsanalyse dargestellt. Zur Vorbereitung der Evaluation und zum kontinuierlichen Soll-Ist-Vergleich während der Entwicklung wurden dabei auch Muster­recherchen zu Fachthemen erstellt.

Der komplette Anforderungskatalog wurde von verschiedenen Nutzern priorisiert und von den IT-Partnern auf Machbarkeit geprüft und finalisiert. Den verschiedenen Benutzerkreisen wie Projektträgern, Energieforschern, Ministerien und Öffentlichkeit präsentiert sich das System auf unterschiedliche Weise. Kern ist die Fachontologie, die semi-automatisch aus redaktionell erstellten Wiki-Texten abgeleitet wird. Unter einer Ontologie versteht man die Repräsentation von Wissen in einer Form, bei der Systeme auf dieses Wissen zugreifen und es für ihre Aufgabenstellung nutzen können. Für die breite Öffentlichkeit bietet EnArgus.public eine ansprechende und leicht zu bedienende Schnittstelle mit einfachen Suchmöglichkeiten. Energieforschern und Projektträgern dagegen stellt EnArgus.master eine Kooperationsplattform mit vollem Zugriff auf die Funktionalität eines Recherche-Cockpits zur Verfügung. Beide Benutzerkreise haben Zugriff auf das EnArgus.wiki. Alle Benutzerschnittstellen sind webbasiert, ein aktueller Web-Browser genügt. Bei der Auswertung der EnArgus-Informationsbasis spielen effektive und effiziente Suchverfahren eine wichtige Rolle. Die Energieforschungsontologie ist dabei wesentlich, da erst dadurch das System semantisch verwandte Begriffe für erweiterte Suchanfragen anbieten kann.

Das Informationssystem

Der Aufbau der EnArgus-Ontologie erfolgte in Kooperation von Experten aus der Energieforschung und Infor­matikern. Die Energieexperten verfassten Wiki-Fachbeiträge, die das System dann syntaktisch analysiert. Daraus werden teilautomatisch Energiefachbegriffe extrahiert, Relationen zwischen Begriffen identifiziert und in die Ontologie gespeist. Die so resultierende Fachontologie zur Energieforschung wird von den Energieforschungsexperten wiederum evaluiert, um sicher­zustellen, dass sie keine sachlichen Fehler enthält. Das Energieforschungs-­Wiki entstand, indem die Experten zu ihrem jeweiligen Fachbereich Wikipedia-ähnliche Texte erstellten. Damit bietet das Wiki für das EnArgus-System zum einen eine Art Nachschlagewerk. Zum anderen dient es als textuelle Basis zur teilautomatischen Vervollständigung der Energieforschungsontologie. Es wurden zunächst Wiki-Texte zu folgenden Themen erstellt: Elektrische Energiespeicher, fossil befeuerte Kraftwerke, Energieeffizienz in der Industrie, erneuerbare Energien. Im Nachfolgeprojekt EnArgus2.0, mit dem im Juli 2013 begonnen wurde, werden derzeit weitere Themenbereiche aus der Energieforschung erschlossen und aufbereitet.

EnArgus.master bietet den Vollzugriff auf alle Such- und Recherche-Funktionen für registrierte Benutzer, vor allem bei Projektträgern und Ministerien. Das System soll Daten über Energieforschungsvorhaben aus unterschiedlichen externen Daten­quellen importieren, verwalten, darstellen und durchsuchbar machen. Dazu wurde ein flexibles Metadatenkonzept für Vorhabendaten entworfen und implementiert. Auch können Vorhaben-Objekte mit später hinzugefügten Projektergebnissen (Abschlussberichte, Veröffentlichungen, Projektdokumen­tation und so weiter) verknüpft werden. Neben Schnittstellen zum Import von Daten aus externen Datenquellen war dazu eine Datenstruk­tur notwendig, die eine persistente Verwaltung der Daten zu den Forschungsvorhaben ermöglicht. Für die intelligente, seman­tische Suche wurde die EnArgus-Fachontologie angebunden.

Für die Recherche in der Energieforschungslandschaft wurde EnArgus mit einem Werkzeugkasten zur Aufbereitung, Auswertung und Visualisierung von Suchergebnissen ausgestattet. Mit diesem „Recherche-Cockpit“ können komplexe Suchanfragen kombiniert, verschiedene mathematische Auswertungsfunktionen durchgeführt und das Ergebnis der Recherche in Graphen, Diagrammen oder geografischen Landkarten visualisiert werden. So kann beispielsweise auf geografischen Schwerpunktkarten angezeigt werden, wo in der Bundesrepublik (in welchen Bundesländern oder in welchen Kreisen) besonders viel zu einem bestimmten Energieforschungsthema geforscht wird. Über die eingebaute Fachontologie unterbreitet EnArgus bei Eingabe von Fachbegriffen Vorschläge für verwandte Fachbegriffe, wie Synonyme oder Ober- und Unterbegriffe, nach denen dann ebenfalls gesucht werden kann. Einzelne, ungewollte Vorhaben können aus der Trefferliste ausgeschlossen werden oder die Ergebnismenge durch Verfeinerung der Suchanfrage oder Anwendung von Filtern („Facetten-Browsing“) schrittweise eingeschränkt werden. Auswertungen können die Ergebnisse mehrerer Such­anfragen berücksichtigen und diese entweder vereinigt oder als separate Gruppierungen von Forschungsvorhaben berücksichtigen. Forschungsvorhaben aus der Trefferliste können auch nach ihren Eigenschaften, wie etwa nach Kalenderjahr oder nach Zuwendungsempfänger, gruppiert werden.

Der Nutzer erhält direkten Zugriff auf relevante Vorhabendokumente wie Berichte und Veröffentlichungen sowie Referenzen auf Verbundvorhaben und „verwandte Vorhaben“, die dem Vorhaben in Beschreibung und Dokumentation semantisch ähnlich sind. EnArgus.public bietet auch dem nicht registrierten Benutzer Zugang zu öffentlich bereitstehenden Daten. Da nicht alle Vorhaben in der EnArgus-Datenbank frei verfügbar sind und nicht alle Metadaten eines Forschungsvorhabens von der Öffentlichkeit gelesen werden dürfen, muss der Zugriff eingeschränkt werden. Die Suche in EnArgus.public erfolgt in erster Linie über einfache Texteingabe und wird durch ontologiebasierte Vorschläge ergänzt. Der nicht registrierte Benutzer hat Zugang sowohl auf die EnArgus-Ontologie als auch auf EnArgus.wiki.

Das Ziel von EnArgus ist die Konzeption, Entwicklung und Erprobung eines zentralen Informationssystems für Energieforschungsvorhaben aus dem Bereich der Förderung durch Bund und Länder. Zentrale Fragen für die Bewertung des Gesamtsystems sind deshalb, (1) ob das neu entwickelte EnArgus-System nennenswert bessere Ergebnisse als bisherige Suchmöglichkeiten bietet und (2) wie gut die entwickelte Ontologie die betrachteten Energieforschungsthemen abdeckt. Beispielhaft für die Verbesserung der Suchergebnisse sei hier der Vergleich einer Projektsuche in Profi [1] und EnArgus für den Bereich Wind­energie gezeigt. Einen großen Schwachpunkt bisheriger Datenbanken stellt die Auswahl der Suchbegriffe bei einer Recherche für ein Themengebiet oder einer Komponente dar. So führte die Suche nach synonymen Begriffen wie „Wind­energieanlage“ und „Windenergiekonverter“ zu teilweise deutlichen Abweichungen. Um die Güte der ontologiebasierten Suche zu überprüfen, wurden die gewählten Suchbegriffe in der EnArgus-Software einmal mit und einmal ohne Unterstützung der Ontologie eingegeben und mit den Suchergebnissen aus den Musterrecherchen verglichen. Musterrecherchen mit verschiedenen Zielen und Schwerpunkten ergaben folgendes:

  • Die in der Ontologie abgelegten Synonyme können automatisch in die Suche eingebunden werden und verbessern damit deutlich die Anzahl der Treffer.

  • Die Vorschläge der Ontologie helfen sowohl dem Fachfremden bei einer erweiterten Suche (durch die Vorschläge der Ontologie) als auch dem Experten durch die Einbeziehung von semantisch verbundenen Begriffen.

  • EnArgus kann nur so gut sein wie die zur Verfügung stehenden hinterlegten Daten. Eine wirklich breite Ab­deckung aller Energieforschungsprojekte kann nur durch die Erweiterung der Datenbasis gelingen.

Die Suche in EnArgus geht über vergleichbare Angebote hinaus, sowohl in Suchmöglichkeiten, Auswertungswerkzeugen, als auch in der Intelligenz der Suchmaschine. Ein Indikator für die Qualität der in EnArgus erstellten Ontologie zur Suche nach Projekten ist die Abdeckung der betrachteten Energie­forschungsthemen durch die Begriffe der Ontologie. Dies wird überprüft, indem gezählt wird, wie viele Projekte eines vorgegebenen Teils der Leistungsplansystematik [2] durch die Ontologie-Begriffe gefunden werden. Die Abdeckungsquote für die in EnArgus hauptsächlich untersuchten Teile der Leistungsplansystematik liegt bei 86 Prozent. Das bedeutet: 86 Prozent der Projekte der LPS-Bereiche zur Energieforschung, die Gegenstand von EnArgus waren, werden auch gefunden. Diese Abdeckung ist erstaunlich hoch, wenn man bedenkt, dass a) Energieforschung sehr divers ist und die geförderten Projekte auch innerhalb der Bereiche sehr vielfältig sind, b) die Leistungsplansystematik teilweise schlecht eingehalten wird, so dass Projekte in scheinbar unpassende Bereiche eingeteilt sind und c) die Abdeckungsanalyse eher restriktiv ist. Insgesamt ist der Grad der Abdeckung für die in EnArgus bearbeiteten Bereiche also als gut bis sehr gut zu bezeichnen.

EnArgus stellt zusammenfassend ein zentrales Infor­mationssystem für die Energieforschungsförderung dar und erfüllt die gesteckten Ziele: Es werden bei der Suche mit EnArgus mindestens gleich viele, häufig aber mehr Ergebnisse gefunden als in einer einfachen Profi-Suche. Die umfangreichen Möglichkeiten zur direkten Auswertung, Visualisierung und zum Export der Suchergebnisse im Recherche-Cockpit bewirken zudem ein komfortables Arbeiten mit EnArgus und entsprechen den Anforderungen von Ministerien, Projektträgern und Energieforschern. EnArgus kann sowohl von Energieforschern aber durch die Unterstützung durch Ontologie und EnArgus.wiki auch von Fachfremden zielführend angewendet werden.

Verwertung und Ausblick

Das EnArgus-Vorhaben wurde im Juni 2013 abgeschlossen und ein Produktionsserver wurde zum Einsatz beim Projektträger übergeben. EnArgus.public wird derzeit für den Einsatz in der Öffentlichkeit vorbereitet. Bei der beschriebenen Erprobung und Nutzung des Systems zeigte sich bereits die Validität des Ansatzes in Bezug auf Systemantworten für die derzeit abgedeckten Bereiche der Energieforschung. Das Nachfolgeprojekt EnArgus2.0 soll nun den Ausbau des Systems gewährleisten: Dies betrifft Themenfelder aus der Energieforschung, die in Breite und Tiefe umfassender bearbeitet werden, und die technisch-informatische Weiterentwicklung des Gesamtsystems. Die Ergebnisse des laufenden Vorhabens sind Anhaltspunkte für Verbesserungen und Erweiterungen am derzeitigen System.

Weitere Informationen

[1] Profi: Verwaltungsinterne Förderdatenbank des BMBF, die auch von den Projektträgern verwendet wird. Die öffentlich verfügbare Webschnittstelle FöKat (Förderkatalog der Bundesregierung) greift auf Daten aus der Profi-Datenbank zu.
[2] Die Leistungsplansystematik wird von Bundesminis­terien und Projektträgern zur Systematisierung von Forschungsvorhaben verwendet.

Das Projekt EnArgus wird vom Bundesministerium für Wirtschaft und Energie im Rahmen des Energieforschungsprogramms gefördert. Förderkennzeichen 03ET1064A und 03ET4010A.

Webseite: http://enargus.fit.fraunhofer.de

Firmen zu diesem Artikel
Verwandte Artikel