Interview mit Prof. Dr. Hermann Helbig

Interview mit Prof. Dr. Hermann Helbig

„NATÜRLICHSPRACHLICHE KOMMUNIKATION MIT WISSENSBASEN UND DATENBANKEN“

Der Dresdner Datenbankstammtisch an der HTW Dresden wurde von unserem Firmengründer, Jürgen Bittner, ins Leben gerufen, um neueste Entwicklungen und Trends in der Datenbankwelt zu diskutieren.

Anlässlich des 215. Datenbankstammtisches wird Herr Prof. Dr. Hermann Helbig, ein international bekannter und anerkannter Forscher für Künstliche Intelligenz, am 25.04.2018 zum Thema „Natürlichsprachliche Kommunikation mit Wissensbasen und Datenbanken“ referieren. Im Vorfeld haben wir mit Herrn Prof. Helbig ein kurzes Interview zum Thema geführt:

SQL Projekt AG:

Herr Prof. Helbig wir freuen uns auf Ihren Vortrag im Dresdner Datenbank-Stammtisch am 25.04.2018 zum Thema „Natürlichsprachliche Kommunikation mit Wissensbasen und Datenbanken“. Der Titel berührt einen Jahrzehnte-alten Wunschtraum vieler Datenbänker nach Endnutzernähe, wie heute z. B. auch Self-service-BI. Frühe Prognosen zur Verfügbarkeit von natürlichsprachlichen Interfaces für Datenbanken in den 1990-er Jahren blieben weitgehend unerfüllt. Woran liegt es, dass diese wichtigen Technologie-Bereiche in der Praxis noch relativ weit auseinander liegen?

Prof. Helbig:

Zum einen dürfte dies an den verschiedenen ‚Kulturen‘ in der KI-Welt bzw. Datenbankwelt und in den unterschiedlichen Anwendergewohnheiten in beiden Bereichen gelegen haben. Zum anderen standen einfach noch nicht genügend ausgereifte computerlinguistische Verfahren mit ausreichender semantischer Tiefe zur Verfügung. Bezüglich des letztgenannten Punktes hat sich in den letzten Jahren mit dem Einsatz der MultiNet-NLP-Technologie der SEMPRIA GmbH die Situation stark verbessert.

SQL Projekt AG:

Ihre Technologieansätze gehen über die Funktionalität und Effizienz der bekannten Suchmaschinen weit hinaus. Können Sie den Unterschied kurz beschreiben?

Prof. Helbig:

Traditionelle Suchmaschinen wie Google sind Wort-orientiert. Sie sind nicht in der Lage:

die Mehrdeutigkeiten von Wörtern aufzulösen oder etwa Metonyme zu deuten.
semantische Relationen zwischen den Suchbegriffen der Anfrage zu entdecken, geschweige denn in der Suche zu berücksichtigen.
die Suchergebnisse für weitere semantische Sprachverarbeitung und logische Inferenzverfahren aufzubereiten und für diese nachgeschalteten Prozesse zur Verfügung zu stellen.
aus computerlinguistischer Sicht sind die traditionellen Suchmaschinen oberflächenorientiert (das betrifft auch die angebotenen Spracherkenner und Automatischen Übersetzungsprogramme).
Suchmaschinen wie SEMPRIA Search, die auf der Basis von Mehrschichtigen Erweiterten Semantischen Netzen arbeiten (kurz: MultiNet) sind demgegenüber semantisch orientiert und besitzen die vorher erwähnten Nachteile nicht.

SQL Projekt AG:

Klassische Datenbanken sind Schema-basiert und die zugrunde liegenden Datenmodelle, hauptsächlich das Relationenmodell verfügen nur über eine begrenzte Semantik. Kann diese begrenzte Semantik im Rahmen ihrer Technologie genutzt werden und ist die Weiterentwicklung von Datenmodellen sinnvoll?

Prof. Helbig:

Aus theoretischer Sicht beruht die dem Relationenmodell zugrunde liegende Coddsche Relationenalgebra auf einer extensionalen Definition von Relationen, während semantische Netze vorwiegend mit einer intensionalen Beschreibung von Relationen arbeiten. Beide können aber miteinander in Verbindung gebracht werden (s. Helbig, 1982, http://pi7.fernuni-hagen.de/publikationen/iics_de.html)

Ich glaube, dass beide Ansätze noch eine Weile koexistieren werden. Man sollte auch nicht vergessen, dass viele Informationen primär gar nicht in Natürlicher Sprache vorliegen, sondernhäufig in tabellarischer Form (die zudem meist viel kompakter ist). Eine generelle Weiterentwicklung traditioneller Datenmodelle in Richtung auf Wissensrepräsentations-Modelle halte ich nicht für erfolgversprechend.

Es kommt aber meines Erachtens darauf an, nicht den einen Ansatz gegenüber dem anderen als Konkurrenz zu behandeln, sondern eher Schnittstellen (Natürlichsprachliche Interfaces) zwischen beiden zur Verfügung zu stellen.

SQL Projekt AG:

Im Vortrag werden Sie auch auf Anwendungsbeispiele eingehen. Könnten Sie bitte schon einige wichtige Anwendungsgebiete nennen?

Prof. Helbig:

Natürlichsprachliche Frage-Antwort-Systeme
Semantisch orientierte Suchmaschinen im Web
Natürlichsprachliche Interfaces zu Datenbanken
Automatische Übersetzung
Opinion Mining bzw. Sentiment Analysis
Automatische Abstract-Generierung (Textkomprimierung) u.a.

SQL Projekt AG:

Ein aktuell zunehmend wichtiges und aufwandsintensives Thema ist der Datenschutz. Die Berücksichtigung von Zugriffsrechten dürfte auch die natürlichsprachliche Kommunikation betreffen. Mit zusätzlichen Selektionskriterien ist das Problem wahrscheinlich noch nicht bewältigt. Sehe ich das richtig?

Prof. Helbig:

Ich glaube, hier können die KI-Systementwickler viel von den Datenbankfachleuten lernen (gerade, was die Einhaltung und Überwachung von Zugriffsrechten anbelangt). Unabhängig davon haben beide Bereiche viele gemeinsame Aufgaben (wie Kryptifizierung der gespeicherten bzw. zu übertragenden Daten, Schutz vor Hacker-Angriffen im Web usw.).

Ungeachtet dessen, ist die Datensicherheit bei NLP-Anwendungen besonders schwierig zu wahren, da ohne geeignete Schutzmaßnahmen praktisch jeder die Daten lesen kann. Eine weitere Besonderheit bei Sprachverarbeitungssystemen (insbesondere bei semantisch-orientierten Verfahren) besteht darin, dass nicht nur das abgefragte oder zu bearbeitende Datenmaterial einen großen wirtschaftlichen Wert darstellt. Es müssen darüber hinaus auch die äußerst wertvollen umfangreichen Computerlexika, das zum Sprachverstehen erforderliche Hintergrundwissen usw. vor unerlaubtem Zugriff gesichert werden.

SQL Projekt AG:

Vielen Dank für Ihre interessanten Ausführungen. Wir freuen uns auf Ihrem Beitrag zum 215. Datenbankstammtisch am 25.04.2018 an der HTW Dresden.

Die Fragen stellte Jürgen Bittner

Seien Sie dabei und diskutieren Sie mit

Weitere Informationen

215. Datenbankstammtisch an der HTW Dresden

„NATÜRLICHSPRACHLICHE KOMMUNIKATION MIT WISSENSBASEN UND DATENBANKEN“

Seien Sie dabei und diskutieren Sie mit

215. Datenbankstammtisch
an der HTW Dresden