MIA

Informationsmarktplatz für das deutschsprachige Web

Das deutschsprachige Web enthält mehr als sechs Milliarden Webseiten voller öffentlich zugänglicher Informationen, Meinungen und Inhalte. Dieser gewaltige Datenfundus bietet ein außerordentliches Potenzial für die Markt- und Trendforschung, den Vertrieb von Nachrichten und für intelligente Geschäftsentscheidungen (Business Intelligence). Um dieses Potenzial nutzbar zu machen, entwickelt das Projekt MIA einen Cloud-Marktplatz für Informationen und Analysen auf Basis der Daten des deutschen Webs. MIA stellt den Datenbestand, eine Plattform zur Verarbeitung und einen Marktplatz zum Vertrieb von Daten und Anwendungen bereit. Die geplante Marktplatz-Infrastruktur umfasst die Bereitstellung, Veredelung, Vermarktung sowie die Abrechnung von Daten und Mehrwertdiensten. Über diese Plattform sollen Cloud-Anbieter Analysewerkzeuge entwickeln und über den Marktplatz bereitstellen können, die Anwender dann flexibel und kosteneffizient nutzen können. So können auch mittelständische Unternehmen gängige Analysewerkzeuge nutzen und damit beispielsweise Produkte und Dienstleistungen gezielter an Kundenwünsche anpassen.

Eine Datenbank für alle deutschsprachigen Web-Inhalte

Bisher mussten Unternehmen für eine Analyse der Daten des deutschen Web eine eigene Infrastruktur aufbauen, die Daten selbst sammeln und speichern und schließlich Analysewerkzeuge entwickeln. MIA will hingegen einen Großteil der relevanten deutschsprachigen Netzinhalte in einer speziellen Datenbank (Data Warehouse) zusammenfassen. Außerdem werden die gesammelten Textdaten mit Informationen über ihre Herkunft, ihren Inhalt und ihre sprachliche Struktur angereichert. So können die Daten einer Vielzahl von Unternehmen als Grundlage von Analysen zur Verfügung stehen. Dazu ist die Entwicklung von Datenstrukturen und Algorithmen nötig, die auch hohe Datenmengen bewältigen können. Herausforderungen liegen dabei in der Verbesserung der Ressourcenzuordnung in Cloud-Architekturen und in der Parallelisierung von Rechenjobs in verteilten Systemen. Kurze Datenzugriffs- und Ausführungszeiten sollen eine hohe Benutzerinteraktivität sicherstellen.

Marktplatzteilnehmer kombinieren Daten und Algorithmen zu neuen Dienstleistungen

Auf Basis dieses Data Warehouse schafft MIA einen Cloud-Marktplatz, über den Informationen, Softwarekomponenten und Analysen elektronisch gehandelt werden können. Unternehmer können sich darauf konzentrieren, Lösungen zu entwickeln, die das implizite und unstrukturierte Wissen der von MIA gesammelten Daten durch algorithmische Verfahren explizit und damit nutzbar machen. Beispielsweise könnte ein Softwareanbieter eine Softwarekomponente für das Text-Mining auf dem Marktplatz als Basis-Werkzeug anbieten.

Dann kann ein Marktforschungsunternehmen Nutzungsrechte an dieser Technologie erwerben und das Basis-Werkzeug auf unternehmensspezifische Fragestellungen anpassen. Damit können mit ausgewählten Web-Daten detaillierte Analysen erstellt und auf dem MIA-Marktplatz als Beratungsdienstleistung vertrieben werden. Zusätzlich ist es möglich, die Web-Daten mit kundeneigenen Daten zu verknüpfen um besonders kundenspezifische Analysen zu erhalten.

MIA senkt die Eintrittsbarrieren für den Geschäftsbereich der Datenanalyse

Durch das zentrale Data Warehouse und den Marktplatz müssen Datenanalysten wie Marktforschungs- und Beratungsunternehmen nicht in eine eigene aufwändige Infrastruktur investieren. Stattdessen können sie über die Cloud flexibel Analysewerkzeuge nachfragen, die genau auf ihre Bedürfnisse zugeschnitten sind. Unternehmen können dadurch kostengünstigere und spezifischere Analysen erhalten, wodurch Barrieren für Innovationen und den Eintritt in neue Märkte gesenkt werden. Das Projekt betrachtet prototypisch drei Anwendungsfälle: die Branchen Medien, Marktforschung und Beratung – unter besonderer Berücksichtigung der hierfür spezifischen Anforderungen an Datenschutz und Datensicherheit am Standort Deutschland.

Ausgangssituation

• Deutschsprachiges Web bietet großen Datenschatz für verschiedenste Analysen
• Erfassung, Analyse und Verwertung dieser Daten sind aufwändig
• Verschiedene Algorithmen zur Analyse von Webinhalten sind nicht zentral zugängig

Zielsetzung

• Zentraler Informationsmarktplatz für das Handeln von Daten, Analyseverfahren und Beratungsdienstleistungen
• Datenanalysen werden vereinfacht und vergünstigt
• Marktplatzteilnehmer kombinieren existierende Daten und Algorithmen zu neuen Diensten

 

Grafik zum MIA Marktplatz