Relevante Unterlagen finden und zusammenfassen mit KI
Auch wenn das Lastenheft überschaubar ist, so türmt sich daneben ein immer größerer Berg auf an relevanten Unterlagen. Das sind zum einen Standards, die berücksichtigt werden müssen, zum anderen die mitgeltenden Unterlagen. Das können schnell hunderte oder sogar tausende von Seiten Text sein.
Experten machen sich über viele Jahre mit den relevanten Unterlagen vertraut und kennen die Inhalte gut genug, um nicht alles nachschlagen zu müssen. Neue Mitarbeiter haben es da deutlich schwerer. Diese fragen dann gerade Anfangs bei jeder Kleinigkeit die Experten, die dadurch wieder weniger Zeit für andere Dinge haben.
Heute geht es um ein Thema in eigener Sache: Ich entwickle ein KI-System, das dieses Problem löst. Nächste Woche (15.7., 16:00) veranstalte ich dazu ein Webinar auf englisch, übernächste Woche (22.7., 16:00) auf deutsch. Im Folgenden ein paar Details.

Das Problem
Durch steigende Komplexität und Complianceanforderungen wächst der Berg der relevanten Unterlagen. Das passiert nun schon seit Jahrzehnten. Durch Vernetzung und den vermehrten Einsatz von Software hat sich das Wachstum allerdings in den letzten Jahren beschleunigt.
Auch die aus Versäumnissen resultierenden Gefahren haben sich verschärft: Vergleichsweise harmlos sind Vertragsstrafen. Schlimmer ist es, wenn Audits wiederholt werden müssen und sich dadurch die Markteinführung eines Produkts verzögert. Der GAU ist ein Recall, oder sogar durch Produktmängel verursachte Todesfälle.
KI kann Dokumente lesen
Eine mögliche Lösung ist der Einsatz von Natural Language Processing (NLP). Hierbei analysiert ein KI-System die relevanten Dokumente. Die Herausforderung ist nun, den Nutzer mit diesem Wissen zu unterstützen.
Ich arbeite aktuell an Semiant, einem KI-gestützten Qualitätsassistenten, der das machen soll. Semiant erkennt Konzepte in Texten und deren Zusammenhänge. Wie so ein System Entwickler unterstützen könnte ist im Titelbild gezeigt: Der Nutzer muss zunächst den Kontext festlegen. Am einfachsten geschieht dies durch das Markieren einer Anforderung. Damit kann die KI nun die einzelnen Kapitel in den Standards und relevanten Unterlagen bezüglich ihrer Relevanz bewerten.
Da einzelne Kapitel sehr lang sein können, erstellt Semiant für jedes relevante Kapitel eine Zusammenfassung aus 1-2 Sätzen. Die Liste von Kapiteln und Zusammenfassungen wird dann dem Nutzer präsentiert. Dieser kann bei Bedarf über eine entsprechende Verlinkung direkt zu dem entsprechenden Kapitel springen.
Zwischenschritt Domänenmodell / Glossar
Das hier beschriebene System ist sehr ambitioniert. Als Zwischenschritt generiert Semiant zunächst ein Domänenmodell aus Texten natürlicher Sprache. Ein Domänenmodell erkennt wichtige Konzepte in Texten und wie diese Zusammenhängen. Ein einfaches, aus einem Domänenmodell ableitbares Ergebnis ist ein Glossar. Das ist heute schon möglich, und ich suche nach Interessenten, die dies ausprobieren möchten.
Möchten Sie Semiant ausprobieren? Dann schreiben Sie mir eine kurze Nachricht.
Michael Jastram
Ansonsten werde ich die Lösungen auch nächste und übernächste Woche in Webinars vorstellen, wie eingangs beschrieben.