Posts Tagged ‘artificial intelligence’

h1

Daten als Ausgangspunkt von Innovation – Big Data?

2. Februar 2014
fury

fotolia_52537005_xswutc2a9-olly-fotolia-com

Das statistische Herausfiltern von potentiellen Terroristen hat sich nicht bewährt. Der unschuldige Berliner Dozent, der in seinem Fach-Blog zufälligerweise die selbe Formulierung verwendete wie in einem Bekennerschreiben, wurde 6 Monate überwacht, Telefone abgehört und bespitzelt – er wartet nach Jahren noch auf eine Entschädigung. Auch der Mieter im Haus über einer „verdächtigen“ Person, dem von der Vega um 3 Uhr in der Früh die Türe eingetreten wurde, ja der wartet auch vergeblich. OK, war halt das falsche Stockwerk… Das bisschen nackt an der Wand stehen hat auch noch keinem geschadet…

OK, also beim Suchen von seltenen singulären Merkmalen (Terrorist) hat die Statistik ein Problem. Tatsächlich liegt das an dem riesigen Merkmalsraum den Menschen durch ihr Verhalten zeigen. Mit anderen Worten, man kann Menschen nicht durch wenige (100 oder 300) Merkmale charakterisieren. Allein das Foto Ihrer Oma hat 3MByte – das heißt, dass alleine das Erscheinungsbild (nur von einer Seite) 3,000.000 Farbpunkt  Information benötigt.

Es ist ja tatsächlich verführerisch die Verfahren, die für das Aufsuchen von „Ausreißern“ in technischen Daten bewährt sind, in der Verbrechensbekämpfung zu verwenden. Der Unterschied ist (sollte) aber augenfällig sein: Ein Wert des Druckes hat einen „Verhaltensraum“ von 1 – es kann nur der Druck variieren. Selbst wenn wir in einem technischen System andere Parameter dazunehmen, sind das viel weniger als Parameter notwendig wären um einen Menschen zu charakterisieren. Deswegen funktioniert das (oft!). Diese Verfahren kann man nun sehr gut zur Innovation einsetzen: Systeme die Wälzlager überwachen und nur bei Bedarf einen Austausch anmelden – im Gegensatz zu periodischem Austausch.  Oder das Herausfinden ob ein Baum rotfaul ist oder nicht (ein ehemaliges Projekt von uns). Amazon demonstriert das auch sehr selbstbewusst „Diese Produkte könnten Sie auch interessieren…“. Und ich kann nur persönlich sagen – die Dinger interessieren mich auch – das ist eine Innovation. Der Fall der 12-Jährigen, die sich im Internet gerne Babykleidung ansah und der dann zur Geburt gratuliert wurde… das ist keine Innovation, das ist Blödheit. Oder anders ausgedrückt „technisch machbare Ignoranz“. Aber auch hier: die Verhaltensmannigfaltigkeit von Menschen ist (zum Glück) zu groß für eine statistische Datenbankabfrage.

Was, nach unserer Erfahrung, sehr gut funktioniert ist das Aufsuchen von Zusammenhängen in technischen Systemen: z.B. wahrscheinliche Ausfälle aus Betriebsdaten ermitteln oder aus den Betriebsdaten der Produktionsanlage und den Daten der Qualitätssicherung fundamentale Hinweise für Qualitätssteigerung oder Ressourceneinsparung zu liefern.

Die Erfahrung zeigt jedoch: viele Daten und die Statistik alleine reicht nicht. Da wird oft Unsinn gefunden (wie Storchpopulation und Geburtenhäufigkeit) oder nichts gefunden. Warum wird nichts gefunden? Weil der Statistiker oft keine Sachkenntnis über das System hat und weil er selten Kenntnisse über fundamentale Zusammenhänge besitz. Also beispielsweise der Zusammenhang zwischen einem Produktausfall und Belastung mit Vibration, also von Resonanzphänomenen. Oft führt hier der Weg über die mathematisch, physikalische Konstruktion von Sekundärmerkmalen, die dann plötzlich Zusammenhänge offen legen.

Das mit der „normalen“ Statistik nur lineare Abhängigkeiten abgebildet werden ist ein weiteres Problem, das kann man mit künstlicher Intelligenz umgehen kann.

Klar ist: Daten können zum Auffinden von Zusammenhängen sehr gut verwendet werden – solche Zusammenhänge münden tatsächlich oft in Innovationen. Aber bitte Vorsicht: trauen Sie nie einer „black box“ (einem Verfahren, das Sie nicht durchschauen), fordern Sie Verständlichkeit und diskutieren Sie das Verfahren mit Kollegen aus der Praxis.

Viel Erfolg

Gottfried Schaffar

h1

Innovation und künstliche Intelligenz

11. Dezember 2009

Fällt einem nichts ein – Ruf nach künstlicher Intelligenz?

Kann man mit Methoden der künstlichen Intelligenz zu Innovationen kommen? Das ist eindeutig mit „ja“ zu beantworten, wenn es sich um Prozesse handelt, bei denen die Zusammenhänge nicht von vorneherein erkennbar sind. Ein typisches Beispiel: In einer Fertigung kommt es manchmal zu kleineren oder größeren Qualitätsschwankungen. Die Anzahl der beteiligten Prozessparameter ist meist hoch und unübersichtlich. Es kann also nicht unmittelbar gesagt werden, welche Einflussgrößen beziehungsweise – noch komplizierter – welche Kombinationen von Einflussgrößen die Störungen verursachen. Beispielsweise kommt es bei der Extrudierung von Getreide nicht nur auf die Prozessparameter des Extruders wie Druck, Geschwindigkeit, Temperatur etc. an, sondern auch auf die Analysequalität des eingesetzten Rohmaterials, die Lagerdauer, Feuchtigkeit etc. Mit den aufgezeichneten Daten der Vergangenheit kann nun mit Methoden der künstlichen Intelligenz eine „Erklärung“ erzeugt werden, warum oder besser unter welchen Umständen der Prozess Probleme macht oder nur manchmal funktioniert. Mitunter kommt es hier zu verblüffenden Resultaten: ein Problem tritt nur dann auf, wenn draußen die Sonne scheint weil, wie sich nachher herausstellt, die Sonne eine Maschine erwärmt, oder ein Problem tritt nur dann auf, wenn ein bestimmter Mitarbeiter die Maschine bedient.

Entscheidungsbaum

Diese Problemlösungen können technisch durch die Erzeugung eines Entscheidungsbaumes mit Hilfe von Methoden des Maschinenlernens erzielt werden. Der Vorteil dieser speziellen Vorgangsweise liegt darin, dass man das gewonnene Resultat auch mit dem Werkmeister diskutieren und auf physikalische Sinnhaftigkeit untersuchen kann. Außerdem kann mit mathematischen Methoden errechnet werden, mit welcher Fehlerquote man bei neuen Fällen rechnen muß.

Beispiele

Auf diese Weise haben wir beispielsweise untersucht, worin sich der Klang einer rotfaulen Fichte von der einer gesunden Fichte unterscheidet. Dies führte zur Entwicklung des „elektronischen Spechtes“ als zerstörungsfreies Diagnoseverfahren von Fichten. Aber auf diese Weise lassen sich auch Lötprobleme, Verformungsprobleme und vieles andere mehr untersuchen. Wir gehen sogar noch weiter: Selbst wenn ein physikalisch–technisches Modell eines Prozesses besteht, erweist es sich oft als außerordentlich hilfreich, wenn der Prozess zusätzlich mit Methoden der künstlichen Intelligenz untersucht wird. Es gibt tatsächlich Fälle, in denen die so gefundene Lösung genauer, schneller oder einfacher ist.

Diese Methoden lassen sich auch ausgezeichnet im nicht-technischen Bereich einsetzen, um beispielsweise bei Mailings diejenigen Adressen zu selektieren, die mit einer wesentlich höheren Wahrscheinlichkeit auf die Zusendung reagieren werden. Auf diese Art und Weise haben amerikanische Firmen die Rücklaufquoten verdreifacht. Eine amerikanische Restaurantkette plant sogar ihren kurzfristigen Personalbedarf mit den Methoden der künstlichen Intelligenz, um in keinem Fall zu viele Mitarbeiter einzuberufen, aber auch nicht zu wenige.

Im Prinzip könnte man all diese Probleme auch beispielsweise durch den Einsatz von neuronalen Netzen lösen. Es scheint sogar, dass die Vorhersagegenauigkeit von neuronalen Netzen einen Hauch besser ist als etwa die Anwendung eines Entscheidungsbaums. Was jedoch in der Praxis gegen die Verwendung von neuronalen Netzen spricht, ist die Unmöglichkeit, das im neuronalen Netz gespeicherte Wissen auf Sinnhaftigkeit überprüfen und diskutieren zu können, weil es nicht einfach in menschlich lesbare Form zu übersetzen ist. Im Falle eines Entscheidungsbaumes sind die Grenzen des Einsatzes überschaubar, ein neuronales Netz kann theoretisch in einem „nächsten“ Bearbeitungsfall plötzlich etwas ganz Unsinniges errechnen, was zwar in der Praxis selten vorkommt, alleine die Möglichkeit irritiert.

Kann man mit Methoden der künstlichen Intelligenz zu Innovationen kommen? Das ist eindeutig mit „ja“ zu beantworten, wenn es sich um Prozesse handelt, bei denen die Zusammenhänge nicht von vorneherein erkennbar sind. Ein typisches Beispiel: In einer Fertigung kommt es manchmal zu kleineren oder größeren Qualitätsschwankungen. Die Anzahl der beteiligten Prozessparameter ist meist hoch und unübersichtlich. Es kann also nicht unmittelbar gesagt werden, welche Einflussgrößen beziehungsweise – noch komplizierter – welche Kombinationen von Einflussgrößen die Störungen verursachen. Beispielsweise kommt es bei der Extrudierung von Getreide nicht nur auf die Prozessparameter des Extruders wie Druck, Geschwindigkeit, Temperatur etc. an, sondern auch auf die Analysequalität des eingesetzten Rohmaterials, die Lagerdauer, Feuchtigkeit etc. Mit den aufgezeichneten Daten der Vergangenheit kann nun mit Methoden der künstlichen Intelligenz eine „Erklärung“ erzeugt werden, warum oder besser unter welchen Umständen der Prozess Probleme macht oder nur manchmal funktioniert. Mitunter kommt es hier zu verblüffenden Resultaten: ein Problem tritt nur dann auf, wenn draußen die Sonne scheint weil, wie sich nachher herausstellt, die Sonne eine Maschine erwärmt, oder ein Problem tritt nur dann auf, wenn ein bestimmter Mitarbeiter die Maschine bedient.

Diese Problemlösungen können technisch durch die Erzeugung eines Entscheidungsbaumes mit Hilfe von Methoden des Maschinenlernens erzielt werden. Der Vorteil dieser speziellen Vorgangsweise liegt darin, dass man das gewonnene Resultat auch mit dem Werkmeister diskutieren und auf physikalische Sinnhaftigkeit untersuchen kann. Außerdem kann mit mathematischen Methoden errechnet werden, mit welcher Fehlerquote man bei neuen Fällen rechnen muß.

Auf diese Weise haben wir beispielsweise untersucht, worin sich der Klang einer rotfaulen Fichte von der einer gesunden Fichte unterscheidet. Dies führte zur Entwicklung des „elektronischen Spechtes“ als zerstörungsfreies Diagnoseverfahren von Fichten. Aber auf diese Weise lassen sich auch Lötprobleme, Verformungsprobleme und vieles andere mehr untersuchen. Wir gehen sogar noch weiter: Selbst wenn ein physikalisch–technisches Modell eines Prozesses besteht, erweist es sich oft als außerordentlich hilfreich, wenn der Prozess zusätzlich mit Methoden der künstlichen Intelligenz untersucht wird. Es gibt tatsächlich Fälle, in denen die so gefundene Lösung genauer, schneller oder einfacher ist.

Diese Methoden lassen sich auch ausgezeichnet im nicht-technischen Bereich einsetzen, um beispielsweise bei Mailings diejenigen Adressen zu selektieren, die mit einer wesentlich höheren Wahrscheinlichkeit auf die Zusendung reagieren werden. Auf diese Art und Weise haben amerikanische Firmen die Rücklaufquoten verdreifacht. Eine amerikanische Restaurantkette plant sogar ihren kurzfristigen Personalbedarf mit den Methoden der künstlichen Intelligenz, um in keinem Fall zu viele Mitarbeiter einzuberufen, aber auch nicht zu wenige.

Im Prinzip könnte man all diese Probleme auch beispielsweise durch den Einsatz von neuronalen Netzen lösen. Es scheint sogar, dass die Vorhersagegenauigkeit von neuronalen Netzen einen Hauch besser ist als etwa die Anwendung eines Entscheidungsbaums. Was jedoch in der Praxis gegen die Verwendung von neuronalen Netzen spricht, ist die Unmöglichkeit, das im neuronalen Netz gespeicherte Wissen auf Sinnhaftigkeit überprüfen und diskutieren zu können, weil es nicht einfach in menschlich lesbare Form zu übersetzen ist. Im Falle eines Entscheidungsbaumes sind die Grenzen des Einsatzes überschaubar, ein neuronales Netz kann theoretisch in einem „nächsten“ Bearbeitungsfall plötzlich etwas ganz Unsinniges errechnen, was zwar in der Praxis selten vorkommt, alleine die Möglichkeit irritiert.