Industrial AI verglichen mit Finance: Die entscheidenden Unterschiede in Echtzeit und Regulatorik

Shownotes

Die meisten Unternehmen übersehen die winzigen Hinweise in ihren Daten, die – wenn sie entdeckt werden – ihre Geschäftsabläufe revolutionieren können – und doch entgehen so vielen täglich diese Signale.

In dieser Folge zeigen Aleksander und Tobias, wie kleine Anpassungen und übersehene Details bei Data-Science-Projekten oft den größten Unterschied ausmachen – und warum das Verstehen der subtilen Signale in Ihren Daten zu bahnbrechenden Erkenntnissen führen kann. Sie erfahren:
Wie scheinbar triviale Details in realen Projekten ganzen Branchen Millionen eingespart haben.
Die Bedeutung von Signalen im Vergleich zu Rauschen und wie man zwischen beiden unterscheidet, um intelligentere Vorhersagen zu treffen.

Konkrete Konzepte wie „Signal“ und „Rauschen“ in Daten sowie praktische Beispiele aus der Fertigungsindustrie und der Finanzbranche.
Warum so viele Dateninitiativen aufgrund übersehener Zusammenhänge und falscher Signale scheitern und wie man diese Fallstricke vermeiden kann.
Die praktischen Unterschiede zwischen industrieller KI und Finanz-Data-Science, insbesondere in Bezug auf Echtzeitverarbeitung, Sicherheit und Regulierung.

Wer diese Signale übersieht, riskiert, Wettbewerbsvorteile zu verpassen – oder schlimmer noch: kostspielige Fehler in kritischen Systemen zu begehen. In einer Welt, in der Daten im Überfluss vorhanden sind, ist das Wissen darum, worauf man achten muss und wie man diese Daten interpretiert, der Schlüssel zur Wertschöpfung.

Diese Folge ist ideal für Datenwissenschaftler, Ingenieure und Führungskräfte aus der Industrie, die tiefere Einblicke gewinnen oder häufige Fallstricke vermeiden möchten – sie bietet die Rahmenkonzepte und praktischen Erkenntnisse, die Sie benötigen, um diese winzigen Signale zu erkennen, bevor es Ihre Konkurrenz tut. Mit Tobias Quadfasel, einem erfahrenen Datenwissenschaftler mit Erfahrung in der Industrie und im Finanzsektor, der praktisches Wissen aus unzähligen Projekten weitergibt, ist diese Folge nicht nur Theorie – sie ist ein Leitfaden für intelligentere und sicherere datengestützte Entscheidungsfindung. Sind Sie bereit, die Signale zu erkennen, die andere übersehen? Klicken Sie auf „Play“ und verändern Sie Ihr Verständnis von Daten für immer.

Transkript anzeigen

00:00:01: Moin Tobi!

00:00:03: Moin Alex, na?

00:00:06: Schön mal wieder dabei zu sein.

00:00:08: Ja schon ein bisschen her.

00:00:10: willkommen in der neuesten Folge des Idiopodcasts.

00:00:14: die letzte ist ja mittlerweile schon gefühlt in halbes Jahr drei Vierteljahr her vielleicht sogar noch länger.

00:00:22: von daher cool dass wir das Projekt mal wieder fortführen.

00:00:25: Ja, also für mich ist das ja auch immer so eine Herzensangelegenheit weil ich ja über den Podcast zur Alio gekommen bin.

00:00:34: Genau, der hat ja historische Relevanz für dein Leben.

00:00:38: Genau auf jeden Fall und deswegen finde es auch cool dass es weitergeht und ja hoffe natürlich dass wir unsere Zuhörer Weiterhin begeistern können von Machine Learning und Data Science Use Cases.

00:00:56: Und den verschiedenen Themen, die wir so besprechen.

00:00:59: Auf jeden Fall!

00:00:59: Ich finde das immer ganz spannend wie manchmal so eine kleine Idee dann so große Auswirkungen haben kann.

00:01:04: Wir hatten uns irgendwann mal gedacht kommen wir versuchen mal irgendwie so ne Podcast Folge zu drehen.

00:01:08: Und da hast du den glaube ich relativ früh irgendwo aufgeschnappt obwohl wir noch so gefühlt dreizig Hörer hatten vielleicht deutschlandweit.

00:01:15: Da hast du dich bei uns beworben weil du den gut fandest was dann ja lang bei uns.

00:01:19: Das ist schon ganz spannend, wie so kleine Sachen dann doch viel ausmachen können und kleine Ideen.

00:01:25: Ja ich habe auf jeden Fall alle Folgen gehört bevor ich mich hier beworben hatte.

00:01:30: Ich kannte mich da tatsächlich schon ganz gut aus und es gab ja auch coole Insights über Elio und über das Unternehmen.

00:01:35: Und das fand ich natürlich auch als Bewerber einfach sehr spannend.

00:01:39: aber auch die Data Science Themen was so gemacht wird welche Methoden eingesetzt werden usw.

00:01:46: Es ist natürlich auch ein cooler Überblick Genau.

00:01:50: Ja, die kleinen Sachen, die viel ausmachen, das gibt's glaube ich auch dann an Data Science-Projekten also als Anekdote wahrscheinlich auch viel.

00:01:57: am Ende des Tages hatten wir ja auch schon öfters Projekte, auch du, wenn ich mich nicht täusche wo man länger am Problem gesessen hat und dann am Ende Kleinigkeiten irgendwo den Unterschied gemacht haben oder?

00:02:10: Genau!

00:02:12: Das ist ganz oft so dass man Vielleicht zum Beispiel, wenn man jetzt am Anfang das Lignal noch nicht so sieht.

00:02:17: Dass man erst mal rumsucht, woran Leaks versuchten Verständnis zu entwickeln.

00:02:22: Verschiedene Sachen probiert mit den Domänexperten natürlich dann nochmal viel redet und so weiter.

00:02:30: Und dann irgendwann kommt die durchschlagende Idee... Wie gesagt manchmal ist es nur eine Kleinigkeit oder eine kleine Sache, die man übersehen hat.

00:02:41: Und plötzlich sieht der Use Case ganz anders aus.

00:02:43: also dass Genau.

00:02:45: Gibt's auf jeden Fall häufiger mal!

00:02:47: Ich find es immer ganz gut, so Begriffe manchmal ein bisschen zu erklären weil nicht jeder Zuhörer ja immer voll aus dieser Data Science-Welt kommen muss.

00:02:55: Was ich eben signal gesagt

00:02:56: habe... Sorry, sorry dafür wenn ich jetzt hier ein bisschen happenlöre oder so, danke gerne sagen.

00:03:01: Ich finds ganz cool da immer dann ein bisschen tiefer einzusteigen.

00:03:03: aber ich finde Signal auch ein unglaublich schönes Wort.

00:03:05: irgendwie ist das ein sehr elegantes Wort für das was man da macht.

00:03:09: vielleicht magst du mal ein bisschen erklären was man darunter versteht in unserer Welt?

00:03:14: Ja, das ist glaube ich auch von Data Scientist zu Datascientist unterschiedlich.

00:03:18: Also... Ich sage es immer mal so wenn ich jetzt keine Ahnung mehr irgendwie eine Regressionsanalyse angucke also wenn ich versuche irgendeine Variable vorherzusagen aus bestimmten Features sag' ich jetzt mal oder aus bestimmter Merkmalen und Ich sehe da am Ende, dass ich da schon sozusagen von vornherein mit einem Modell eine gute Prognose machen kann.

00:03:46: Dann natürlich noch nicht perfekt.

00:03:48: aber so, das man sagt okay über einen Daumengepalt, der sieht erst mal ganz gut aus dann würde ich es als Data Science sagen, da ist also in den Daten ein Signal, also ein Zusammenhang den ich erkenne.

00:04:03: Ja, also ich muss immer einen Zusammenhang haben zwischen den Merkmalen die ich zur Verfügung habe und am Ende dem sogenannten Target.

00:04:10: Also der Zielvariant, die ich vorher sagen will.

00:04:13: Und ja keine Ahnung zum Beispiel... Artok fällt mir jetzt irgendwie ein wenn nicht jetzt den Demand vorhersagen will, den ich in Zukunft habe anhand bestimmter Kriterien, keine Ahnungen.

00:04:32: zum Beispiel Ich habe jetzt ein Unternehmen, was Eis herstellt.

00:04:37: Da wird wahrscheinlich die Temperatur oder die Jahreszeit in große Koalitionen haben mit den Sales sozusagen und mit dem Verkäufen.

00:04:49: Meistens ist das halt nicht so offensichtlich.

00:04:53: aber dann sehe ich eben einen Signal.

00:04:55: Ich sehe ja einen Zusammenhang zwischen den Merkmalen, die ich habe und dem, was ich vorher sagen möchte.

00:04:59: Das würde ich jetzt mal als Signal bezeichnen einfach.

00:05:03: Das Gegenteil von Signal ist ja ein bisschen das Rauschen.

00:05:05: Man versucht ja quasi im Rausche der Daten, das Signal zu entdecken und eigentlich ist das ganze Jahr wenn man das in Worte übersetzt die vielleicht im Alltagsgebrauch vom Nicht-der-Inter Scientist auf das Vorkommen ja Kausalität und Korrelation am Ende des Tages.

00:05:20: Am Ende viele Dinge korrelieren in irgendeiner Form.

00:05:23: da gibt es auch immer so lustige Geschichten wie zum Beispiel Die Anzahl der Heidtode ist gleichzeitig gestiegen mit der Anzahl, der Hausverkäufe in den USA oder sowas.

00:05:34: Was natürlich nichts miteinander zu tun hat.

00:05:35: aber wenn man die Charts aneinander packst dann kann man den Eindruck erwecken als gäbe es da einen sehr starken Zusammenhang.

00:05:43: Jetzt natürlich so als der lustiges Beispiel.

00:05:47: Und im Endeffekt ist die Aufgabe ja an vielen Stellen aus diesen ganzen möglichen Korrelation und möglichen Zusammenhängen und Daten, die vielleicht relevant haben das herauszufinden was wirklich relevant ist und eine Vorhersage ermöglicht.

00:06:03: in deinem Demandbeispiel.

00:06:05: Das hatten wir auch schon ein paar mal.

00:06:07: da hat so ein Unternehmen natürlich sehr viele unterschiedliche Daten von Wetter, wie du es gerade schon gesagt hast über vielleicht Branchenentwicklung von Kundenbranchen.

00:06:18: Über vielleicht unterschiedliche Einflüsse die man tracking kann zum Beispiel Aktienkursen unternehmen und manches davon hat vielleicht wirklich einen direkten Rücken Rückantwort darauf, warum der Dimand Hocher niedrig ist.

00:06:33: Aber vieles davon hat ja auch einfach gar keine Aussage gekraft oder hat vielleicht mal punktuell korreliert aber Ist nicht wirklich ein relevanter Datenpunkt um das vorher zu sagen.

00:06:43: da kann man dann auch schnell im nächsten Jahr in die irre geleitet werden wenn man sich darauf verlässt.

00:06:47: Das ist glaube ich so der ausschlaggebende Punkt da oder?

00:06:50: Genau es gibt auf was man öfters mal hat zum Beispiel man sieht irgendwie eine Korrelation Na, unter Gruppe zum Beispiel von Datenpunkten die sich aber nicht ich generalisieren lässt auf alle Datenpunkte die man hat.

00:07:05: So was gibt es z.B auch manchmal dass man vielleicht sich durch Zufall irgendwie gerade eine Gruppe anguckt wo das irgendwie einigermaßen gut hinhaut.

00:07:13: Aber wenn wir das jetzt sagen das Modell deploy dann in Produktion für alle Daten Punkte das da nicht mehr funktioniert.

00:07:21: zum Beispiel das gibt's halt auch zum Beispiel öfters mal oder eben, was du auch angesprochen hast.

00:07:28: Es gibt ja auch manchmal so Kost-Korrelationen also dass man zum Beispiel mehrere Variablen hat die aber letztendlich die gleiche Informationen beinhalten.

00:07:39: und da versucht man eben beispielsweise in der Regierungsanalyse versucht man solche sogenannten Cross-Correlations rauszuarbeiten das man nur die eine Variable hat die diese Information beinhaltet.

00:07:55: Und oft hat man ja auch Informationen, die sich gar nicht verändern und dadurch eigentlich keine Aussagekraft haben.

00:08:00: Wenn man einen Sensorwert hat der durchgehend vierundzwanzig Grad anzeigt dann ist er für eine Vorhersage erstmal relativ irrelevant und bringt im Modell nicht viel da eigentlich nur Schwankungen unterschiedlichen Informationsgehalt haben.

00:08:13: das sind alles natürlich so spannende Alltags Sachen mit denen man sich beschäftigt.

00:08:18: ein bisschen überleitend zum Thema des heutigen Podcasts und zwar hatten wir uns hier vorgenommen den Bereich Industrial AI, Industrial Data Science Arbeit mit Daten in Industrie unternehmen kann man auch einfach sagen zu vergleichen.

00:08:33: Mit mehr administrativen und Büro orientierten Data Use Cases vielleicht auch Air Compliance und Governance Lasting use cases wie zum Beispiel in der Versicherungs- und Bankenwelt.

00:08:46: du warst ja in beiden Welten eine Zeit lang unterwegs, darum habe ich dich hier einmal als Opfer auserwählt.

00:08:55: Für den Podcast um ein bisschen darüber zu reden fangen wir vielleicht mal mit einer leichten Einstiegsfrage an wie korreliert denn Spaß in beiden Branchen mit der Projektarbeit im Data Science Umwelt?

00:09:10: Also als Data Scientist machen wir das Arbeit mit Daten natürlich so oder so Spaß.

00:09:17: Das sind einfach sehr andere Probleme häufig.

00:09:22: Also die Use Cases unterscheiden sich sehr stark voneinander und es sind auch unterschiedliche, unterschiedliche Schwerpunkte oft.

00:09:32: Wie du eben schon sagtest in der Finanzwelt ist natürlich das Thema Governance so ein bisschen das A und O oder so.

00:09:38: Und das ist einfach super wichtig.

00:09:40: Das muss man immer mitdenken, weil die Unternehmen gewisse regulatorische Pflichten haben, die einfach da sind.

00:09:51: Und genau auf der anderen Seite im Industrial AI Bereich gibt es dann wieder ganz andere Probleme.

00:10:01: zum Beispiel was da oft auch eine Herausforderung ist so ein bisschen dieses Real-Time Problem weil da brauchen wir ja oft mit Sensoren arbeiten, dann wollen wir ja wirklich auch eine real-time prediction zum Beispiel haben.

00:10:14: Das hat dann noch die Pläume und dann noch so ein paar Fallstricke wie

00:10:18: z.B.,

00:10:18: da kriege ich das Ganze irgendwie auf die Edge, dass es eben auch im Werk läuft usw.

00:10:24: Wie mache ich das mit dem Training?

00:10:25: Trainiere ich jetzt auch real time Daten oder krigiere ich das irgendwie?

00:10:28: weil natürlich müssen die Datenmengen dann auch irgendwie überschaubar bleiben und so.

00:10:33: also sind irgendwie so ganz unterschiedliche Probleme aber es gibt sicherlich Gemeinsamkeiten.

00:10:41: Und ich denke, die werden wir jetzt im Laufe der Zeit vielleicht auch so ein bisschen rausarbeiten.

00:10:45: Das sind Gemeinsamsamkeiten und das sind Unterschiede aber Spaß macht auf jeden Fall beides.

00:10:50: Es gibt unterschiedliche Herausforderungen und dieser Abwechslungsreichtum ist glaube ich auch das was ich hier als Data Scientist gerade bei Alio auch so spannend finde.

00:10:58: Deswegen war nicht ganz cool.

00:11:01: Lass uns mal über die Gemeinsamenkeiten sprechen!

00:11:03: Ich habe eine Sache im Kopf wo ich sage, dass würde ich als große Gemeinsamt sehen.

00:11:09: Aber bevor ich die jetzt nenne, würde mich interessieren was du da so im Kopf hättest.

00:11:12: Wenn du den Punkt nennen müsst ist der die größte Gemeinsamkeit?

00:11:18: Also Data Science technisch jetzt so rein von dem Problematiken her sind die Use Cases zumindest die wir jetzt überarbeitet haben schon recht verschieden.

00:11:26: aber was halt wo?

00:11:27: vielleicht ich jetzt eine... also erstmal grundsätzlich ist die Gemeinschaft das beide Branchen sehr viele Daten zur Verfügung haben einfach.

00:11:36: Die sehen zwar anders aus dass eben viel so Sensordaten, Maschinendaten.

00:11:44: Messungen von irgendwelchen Produkten oder ähnliches und auch welchen physikalischen Variablen.

00:11:53: Und in der Versicherungs- oder Finanzwelt vor allem in einer Versicherung Welt sind das eben Häufig.

00:12:01: Personendaten einfach,

00:12:02: aber

00:12:03: auch Leistungsdaten.

00:12:04: Welche Leistungen wurden abgerufen?

00:12:06: Sprich mal von Bestandsschadendaten.

00:12:11: Und es sind sehr viele Daten mit einem hohen Informationsgehalt die man sozusagen fürs Unternehmen nutzen kann wo es dann eben unterschiedliche Herausforderungen gibt.

00:12:24: und eine weitere Gemeinsamkeit die ich sehen würde ist halt am Ende vielleicht so Menschlich, also wenn man solche Data Science Use Cases dann am Ende umsetzt zum Beispiel.

00:12:37: Dann heißt es ja immer wie wird das am Ende auch angenommen?

00:12:40: Also das ist ja auch ein wichtiges Problem dass man halt eben alle so mitnimmt die am ende den das z.B.

00:12:50: das Machine Learning Modell oder die prediction irgendwie in der Produktion nutzen sollen Und dass das eben auch verwendet wird.

00:12:58: Also, dass es nicht einfach am Ende irgendwie ein Dashboard ist was dann vielleicht mal einmal in der Woche jemand reinguckt aber es wird halt im Ende gar nicht so richtig angenommen.

00:13:07: man macht sich den Aufwand, man baut ein schönes Modell Man setzt die Newscase um und am ende arbeiten die Leute trotzdem so nach Bauchgefühl weiter weil sie ihm sagen okay ich habe jetzt irgendwie schon zwanzig Jahre hier im Unternehmen Großerfahrung und ich lasse mir jetzt von einem Modell nicht irgendwie sagen wie ich XYZ zu machen habe.

00:13:26: Das ist glaube ich in beiden Fällen, also in beiden Branches eigentlich jetzt mal ähnlich sozusagen wie nämlich die Leute mit und habe ich sozusagen die Leute, die das am Ende nutzen sollen dann auch im Fokus von Anfang an.

00:13:46: Also ein ganz wichtiger Punkt.

00:13:49: Ja cool, coole Einschätzung.

00:13:52: Wenn ich die größte Gemeinsamkeit benennen müsste Dann wäre es, dass es in beiden Branchen vielleicht sogar egal welcher Branche ist.

00:14:04: Manchmal überraschend ist wie hemmtärmlich dann doch viele Sachen bisher gemacht wurden und umgesetzt sind.

00:14:11: so in meiner Als ich noch ganz jung war vor vielen Jahren in meiner beruflichen Navi-Enaivität hat man von außen auf so einen Konzern geschaut und sich gedacht, wow da arbeiten nur Leute die alles vororganisieren komplett durchstrukturieren.

00:14:28: Die haben richtig gute IT Systeme, die haben Geld wie heu und investieren da richtig.

00:14:35: Und am Ende des Tages wenn man hinter die Kulissen schaut dann besteht vieles doch aus Excel Einzelpersonen, von denen viel abhängt und sehr viel Ducktape und sehr viele Wissen in den Köpfen.

00:14:47: Dass dann in so einem Projekt auch gar nicht so leicht zu durchdringen ist in vielen Fällen und teilweise mit den meisten Aufwand erzeugt.

00:14:57: Durch diese Strukturen, diese Entscheidungen dieser Arten was du dokumentieren vielleicht auch die Fehler der Vergangenheit Daten aufzunehmen, Prozesse aufzonehmend durchzusteigen und da Lösungen für zu finden.

00:15:09: Das ist glaube ich etwas was fast überall so der Fall ist egal wie groß das Unternehmen ist.

00:15:16: am Ende haben große Unternehmen mehr Kapazität um solche Probleme zu lösen aber die haben auch mehr Probleme Die die die Lösungskapazität steigt aber die Problemmenge und Größe steigt auch.

00:15:28: von daher hast du Egal ob das Unternehmen jetzt ein hundert Mitarbeiter, Mittelständler ist oder einen DAX-Konzern.

00:15:35: Oft hinter den Kulissen sehr wilde Situationen mit denen du dann als Data Scientist eine Lösung bauen musst.

00:15:44: Ja also das ist definitiv ein Problem da.

00:15:49: ich bin jetzt nicht darauf gekommen aber es ist genau richtig.

00:15:54: Es gibt super viele Kopfmonopole Es gibt super viele Excel-Lösungen in Marke Eigenbau, sage ich jetzt mal so.

00:16:09: Die dann bei denen sich vielleicht nur wenige Personen auskennen und das ist tatsächlich auch ein Grund weswegen es bestimmte auch regulatorische Auflagen gibt dann zum Beispiel bei, bei Versicherungs- oder Bankenunternehmen.

00:16:30: Wo es dann eben, ich weiß nicht ob du das schon mal von der IDV gehört hast?

00:16:34: Das heißt individuelle Datenverarbeitung und da ist es zwar festgelegt dass eben gerade aus solchen kleinen Tools solche Excel Tours oder auch kleine Tabellen die man die vielleicht nur ein, zwei Leute betreffen, die aber in der Produktion wichtig sind.

00:16:51: Dass sie eben ganz genau dokumentiert werden müssen.

00:16:54: Wer hat da Zugriff drauf?

00:16:55: Es muss immer noch eine zweite Person geben, die sozusagen Zugriffsversteht was dieses Tool beinhaltet und so weiter.

00:17:04: damit nicht wenn jetzt eine Person mal ausfällt dann kritische Tools einfach fehlen bestimmte Prozesse, Kernprozess und Unternehmen dann nicht mehr laufen.

00:17:20: Und nur weil es diese Regulierung gibt heißt das ja nicht dass das auch immer der Fall ist am Ende des Tages.

00:17:27: Es gibt überraschenderweise schon einige sehr große Unternehmen, die mit einer Excel-Datei, die jemand vor zehn Jahren gebastelt hat, der nicht mehr im Unternehmen ist und die keiner richtig versteht komplett ausgesteuert werden.

00:17:38: Und auf deren Ergebnisse und Basis der Vorstand jeden Monat Entscheidungen trifft, Investitionen tätigt, Investitions zurückhält... Das ist schon manchmal verrückt wie die Welt dann so aussieht!

00:17:54: Also nach meiner Erfahrung aus der Versicherungsbranche ist es aber schon so, dass mehr darauf geachtet wird, dass diese Regulatorik auch umgesetzt wird.

00:18:04: Weil einfach wenn die das nicht machen dann hast du halt eben die Aufsichtsbehörden.

00:18:09: also da kann halt die Barfin kommen und auch entsprechend Strafen verhängen was natürlich für ein Unternehmen auch einfach ein großes Risiko ist auch finanziell.

00:18:18: Gleichzeitig ist das ja auch so ein Prozess sowas in irgendeiner Form zu migrieren Das geht ja nicht von heute auf morgen teilweise die Arbeitslast, die dann dahinter steckt so etwas in eine moderne Datenplattform zu bringen oder zumindest mal wie du gesagt hast, zu dokumentieren und nachvollziehbarer zu machen.

00:18:34: Die ist ja oft enorm in so historisch gewachsenen Situationen.

00:18:40: Ja auf jeden Fall definitiv.

00:18:43: Was sind denn aus deiner Sicht die größten Unterschiede zwischen industrial Projekten und finance Projekte?

00:18:53: Ich habe es schon ein bisschen vorhin gesagt, also in den Industrieprojekten, in denen wir jetzt viel zu tun hatten ging es vor allen Dingen um Sensor-Daten in irgendeiner Form.

00:19:07: Das heißt wenn wir jetzt irgendwie eine Prozessoptimierung oder ähnliches eben machen dann schauen wir vor allem auf die Sensor Daten und Maschinendaten.

00:19:17: das heißt wir sind in der Regel im Real Time unterwegs.

00:19:21: Das ist im Versicherungs- und Finanzbereich nicht so stark der Fall.

00:19:26: Es gibt sicherlich Einzelfälle, weiß ich nicht... Ich denke jetzt mal bei Banken ist vielleicht dieses Thema Algorithmic Trading oder sowas vielleicht mal irgendwie relevant.

00:19:38: oder es gibt ja auch im Versicherungsbereich so Telematik-Tarife, wo man dann irgendwie anhand von Fahrverhalten kriegt.

00:19:47: Man hat nochmal ein Bonus in der Kfz-Versicherung oder sowas.

00:19:52: Das ist vielleicht schon eher so realtermäßig aber es ist halt sehr selten.

00:19:55: also die meisten Use Cases sind eigentlich mit Daten, die einer längerfristigen Frequenz aufgezeichnet werden.

00:20:04: ... monatlich dann einmal im Batch oder so die Daten verarbeitet.

00:20:11: Das heißt, diese Real-Time-Problematik hat man eher in Industrial Use Case und ich würde vielleicht auch sagen... ... dass in der Versicherungswelt natürlich ist der Overhead, sage ich jetzt mal mit Regulatorik es halt einfach noch mal eine... Alleinstellungsmerkmal.

00:20:37: Das muss man einfach sagen, weil man eben immer gerade bei Versicherungen auch oder wenn man jetzt zum Beispiel in der Krankenversicherung ist oder so dann hat man einfach häufig mit personenbezogenen Daten zu tun und auch mit Daten die z.B.

00:20:52: als besonders schützenswert eingestuft sind wie Gesundheitsdaten, Krankheitsdaten.

00:20:59: genau wir haben Wir müssen auf den EU AI-Akt achten.

00:21:04: Wir müssten auf DSGVO achten, wir mussten auf DORA achten... Das ist der Digital Operations Resilience Act, der auch nochmal verschiedene Rahmenbedingungen vorgibt

00:21:19: usw.,

00:21:20: das ist natürlich noch mal sehr speziell für den Finanzbereich und das muss man in so einem Data Science Use Case auch immer mit bedenken.

00:21:29: Es gibt natürlich use cases, wo was weniger kritisch ist.

00:21:32: Das heißt nicht überall so aber genau es wird da einfach immer mehr Wert drauf gelegt.

00:21:38: Ich glaube zum Thema real time um dann nochmal einen Schritt zurückzugehen ich glaube in seltensten Fällen braucht man wirklich realtime.

00:21:46: selbst bei dem Beispiel das du eben genannt hast mit telemetrischen Daten Da berechnest du ja auch nicht Minuten genau ändert sich dein Tarif ständig und du zahlst dann Euro mehr, der dir abgebobiert oder nicht.

00:21:55: Am Ende des Tages funktioniert das ja... Ich hab so einen Tarif nicht ich weiß es nicht aber wenn ich jetzt raten müsste hätte ich gesagt dass wird vielleicht auf Wochenebene akkrigiert oder auf Monatsebene oder auf Jahres-Ebene sogar und dann wird halt einmal ausgewertet war deinen Verhalten irgendwie in fünf Stufen eher aggressiv eher zurückhaltend oder irgendwas dazwischen?

00:22:15: verschiebt sich der Tarif vielleicht irgendwo im drei Prozentbereich in den Stufen.

00:22:18: Irgendwie sowas könnte ich mir vorstellen, wenn ich jetzt einfach raten müsste ohne es selber mal gesehen zu haben und dafür brauchst du ja eigentlich auch gar nicht real-time Daten dann kannst du aggregieren und eigentlich so... Ich meine für ein Techie ist Real Time natürlich super spannend weil das technologisch mit Streaming und allem was da dranhängt immer sehr cool ist glaube ich mit sowas zu arbeiten.

00:22:39: Aber ich glaube als Unternehmen willst du tendenziell, wenn es nicht zwingend notwendig ist, Video-Time auch eher vermeiden.

00:22:44: Weil's meistens mehr Kosten und mehr Probleme mit sich bringt als dass das ein Spaßfaktor ist.

00:22:50: Er freut sich auf nur der Techie dran wahrscheinlich.

00:22:54: Was vielleicht auch noch einen Unterschied ist, der mir gerade einfällt so... Wenn wir jetzt Modellen in das Spielbereich geployen, dann können wir relativ schnell sehen wie sich das Modell verhält.

00:23:08: Also wie das Model sozusagen auf neuen Daten die reinkommen performt und diese Zyklen sind typischerweise ein bisschen länger in der Finanzbranche.

00:23:24: Hier ist mal ein Extrembeispiel was ich eigentlich auch nicht Also was ich nicht ganz so gut eignet, weil man da eben auch wieder regulatorisch ein bisschen.

00:23:36: Ja limitiert ist.

00:23:37: aber wenn ich jetzt zum Beispiel ein bestimmtes Risiko.

00:23:40: Quantifizieren will mit einem machine learning Modell oder sowas z.B.

00:23:43: Kreditausfallrisiko oder so ja also ich habe jetzt Person X also ich trainiere jetzt noch Modell auf meinen historischen Daten und Jetzt kommt ein neuer Kunde und da soll ich anhand irgendwelcher Merkmale dieses Modell eben sagen, wie wahrscheinlich ist das Kreditausfallrisiko.

00:24:03: Da muss ich im Zweifel ziemlich lange warten ob das dann tatsächlich eintritt oder nicht?

00:24:08: Das ist halt auch noch mal so einen Punkt die Zyklen sind einfach so ein bisschen länger Und es ist halt schwieriger nochmal wirklich die Performance in einem Deployment sich anzuschauen.

00:24:24: Wobei es ja auch ein bisschen drauf ankommt, das kann ja auch immer in diesem Bereich durchaus der Fall sein was man schon um die Productive Quality machen möchtest und dann irgendwann ein Fehler-Ereignis zwölfmal im Jahr auftritt und du das vorher sagen möchtes dann kriegst du da auch nicht im Optimalfall nicht sofortiges Feedback willst du ja nicht der ständig den Fehler auftritt.

00:24:41: aber kannst du ja auch da so ein bisschen Data Scarecity und Event Scarecity haben auf die du trainierst oder gegen die du in irgendeiner Form arbeitest.

00:24:49: Aber klar, im Grunde hast du in der Produktion viel schnellerer Feedback-Zyklen.

00:24:53: Da stimme ich auf jeden Fall zu und das ist auf jeden fall ein Unterschied.

00:24:57: Ich glaube was auch nennen... Was da so ein bisschen reinspielt ist auch etwas was David immer gesagt hat.

00:25:02: er findet Industrial Use Case ist immer ein bisschen charmanter weil dort die Attribution im Kern leichter ist von Effekten.

00:25:11: Du hast halt, wenn du um den Fließband hast und sagst das läuft jetzt so schnell durch.

00:25:16: Und so oft haben wir das angehalten dann kannst du relativ gut messen wie Perfomant dein Modell war und relativ gut Benchmarken ob du besser geworden bist oder schlechter.

00:25:28: Wenn du jetzt in eher Marketing Sales menschlichen, menschlicheren Use Case unterwegs bist.

00:25:38: Obwohl zum Beispiel sagst ich möchte vorhersagen wie welche Rabattcalls jetzt die besten sind, die für diese Versicherungskategorie mehr Leute zu uns locken dann hast du teilweise so viele Einflussfaktoren, die da rein spielen in so eine Entscheidung ob ich jetzt kaufe und nicht kaufe?

00:25:59: Wie schnell ich bin kaum kontrollierbar sind und oft gar nicht sichtbar sind, dass es halt viel schwieriger ist eine klare Attribution zu machen.

00:26:11: Hat mein Modell jetzt wirklich einen Mehrwert gebracht oder war das eigentlich vielleicht trotz des schlechten Modells gut wegen anderen Effekten?

00:26:19: Oder andersherum... Das ist natürlich so im Industrial Bereich wo du einfach sagen kannst da sind jetzt drei Produkte mehr rausgekommen und sonst sind immer drei weniger raus gekommen schon deutlich, deutlich angenehmer oder eine klare Messung vornehmen kannst.

00:26:32: Ich sage vorher in dem Bereich wird ein Fehler stattfinden und dann guckst du hat er stattgefunden oder nicht?

00:26:37: Weil du kannst messen.

00:26:38: hat der pH Wert gepasst.

00:26:40: wenn ich vorher sage oder nicht Du hast halt eher die Wahrheit.

00:26:44: Und in anderen Use Cases oder mehr menschlich orientierten Use Case, saleslastigeren use cases Hast du oft eher so ne Theoretische Wahrheit oder etwas, was du für die Wahrheit hältst.

00:26:56: Aber wo du selber ein bisschen entschieden hast, was die Wahrhalt ist und wo jemand anders vielleicht gesagt hätte ne die Wahrheits sieht ein bisschen anders aus macht das Sinn?

00:27:04: Das ist genau ein sehr wichtiger Punkt.

00:27:06: und dass es irgendwie gleichzeitig eine gemeinsame Unterschiede ist natürlich auch ganz klar.

00:27:13: Du hast das würde ich noch ein bisschen weiterspinnen als das was David gesagt hat.

00:27:17: Du hast natürlich im Industrial AI Bereich Hast du einfach die Physik Regelwerk, also zum Beispiel wenn ich jetzt eine bestimmte Produkteigenschaft messe.

00:27:34: Dann wissen die Fachleute vor Ort ja wenn hier die Temperatursensor hoch geht dann muss diese Eigenschaft auch hoch gehen oder runtergehen.

00:27:47: Ich sage es mal zum Beispiel so was wie eine Feuchte oder sowas.

00:27:51: Ja, ich messe die feuchte von irgendwas und weiß nicht wenn ich irgendwie mit der in dem Prozess mehr Temperatur hoch gehe Dann sollte irgendwie dann verdampft das Wasser und dann muss sich feuchter runtergehen.

00:28:02: Ein ganz einfach physikalischer Prozess.

00:28:05: So dass ist eben auch immer etwas was uns bei den Kunden auch immer sozusagen ja auffällt Dass sie wollen Das Modell auch wirklich diese physikalischen Regeln, denen halt auch wirklich folgt.

00:28:22: Dass man auch wirklich dann im Modell sehen kann okay es ist eben so wie man das physikalisch erwartet und nicht dass das Modell irgendwelche Zufallingssprünge macht oder so.

00:28:32: also wenn man da ein zu komplexes Modell verwendet, was sich vielleicht irgendwie nicht linear verhält in einem bestimmten Region oder irgendein Entscheidungsbaum basiertes Modell wo man dann zwischendurch solche Treppenstufen hat.

00:28:49: Das mögen die gar nicht sondern die wollen halt wirklich sehen das Modell folgt den Erwartungen, folgt dem Regeln der Physik sozusagen und das ist wiederum eine Gemeinsamkeit weil sozusagen häufig gerne auch einfache interpretierbare Modelle gesehen werden.

00:29:07: Also, Modelle die jemand in der Produktion jetzt auch verstehen kann mit einfachen Inputs jetzt nicht irgendwie das fünf Billionen Parameter-Modell, irgendwie die Black Box sollen einfache nachverziehbare Entscheidungen und das würde ich wiederum sagen ist auch in der Versicherungswelt so.

00:29:31: also da werden typischerweise so Modelle, so Blackbox-Modelle auch nicht so gern gesehen.

00:29:40: Weil man da die Entscheidung eben nicht so oder die Prognose nicht so gut nachverziehen kann und man da eben aufgrund der erhöhten Sicherheitsanforderungen sage ich jetzt mal von so einer Prognese dann da auch ein bisschen versucht gegen anzuarbeiten.

00:29:58: Ja was mir ja auch noch einfällt ist das es schon sehr cool ist, im Industrial-Bereich auch so ein bisschen zu sehen dass es eine physische Realität gibt von den Dingen die man macht und beeinflusst in irgendeiner Form.

00:30:11: Das ist natürlich... Man sitzt ja sowieso den ganzen Tag vor dem PC und auf dem Stuhl und hat irgendwie mit digitalen Themen zu tun und oft bleibt das hier auch rein digital.

00:30:22: ich finde das schon immer sehr cool auch mal so eine Produktion zu sehen vielleicht auch zu sehen okay da wird jetzt etwas gesteuert anders entschieden Läufen jetzt die Säcke in eine andere Richtung, weil mein Modell das vorher gesagt hat.

00:30:33: Ich glaube dass es auch ganz cool einfach so aus der Sicht von jemanden deren solchen Projekten arbeitet.

00:30:39: ich weiß nicht wie du das siehst

00:30:42: Ja auf jeden Fall also Das ist ja auch immer ein bisschen so die Challenge an sozusagen am Ende als man quasi wirklich auch die Realität Das Modell, die Realität am Ende auch abbildet.

00:30:56: Manchmal machen die Modelle ja auch irgendwie was wo man sich denkt, was ist denn jetzt hier los?

00:31:04: Das kann ja eigentlich nicht sein und manchmal fallen einem dann noch so Sachen auf in den Daten an zum Beispiel, wo dann auch selbst die Daten eben unphysikalisch sind oder so.

00:31:12: Das heißt, manchmal ist da sogar auch noch ein Learning für den Kunden dabei.

00:31:17: aber ich sage mal, ich komme auch aus der Physik.

00:31:19: Ich bin immer ein großer Fan von ja, von physikalisch inspirierten Modellen auch.

00:31:29: Genau also von daher ist das für mich auch ein super spannendes Thema.

00:31:32: definitiv

00:31:33: Ja und im Prinzip leite es so bisschen zum Punkt über den ich eben noch anbringen wollte aber vergessen habe.

00:31:41: Ich glaube die Unterschiede was Governance & Compliance angeht sind gar nicht so gigantisch.

00:31:47: Die haben nur andere Ausprägungen.

00:31:49: Weil was du an der Stelle mit DSGVO und personenbezogenen Daten hast, die haste tatsächlich in industrial ARUs Cases eher selten.

00:32:00: Das ist ganz angenehm weil du da dieses Thema größtenteils ausklammern kannst.

00:32:04: Sie können natürlich trotzdem sensible Daten sein.

00:32:06: wurden Unternehmen überlegt wollen wir in den Cloud packen wie können wir die schützen?

00:32:11: Aber am Ende des Tages ist ein Sensor wert kein personenbezogenes Datum.

00:32:15: Das heißt, die DSGVO hat damit überhaupt rein gar nichts zu tun und findet keinerlei Anwendung.

00:32:21: Und das vereinfacht einige Prozesse.

00:32:26: Am Ende ist es dann bisschen die Frage des Unternehmens selber welche Sicherheitsstufe sie diesen Daten zuweist und wie vertraut ich sie behandeln möchte?

00:32:36: Aber du hast halt diese ganze physische Komponente am Ende des Tages, die du in anderen Branchen eher nicht hast.

00:32:42: Das heißt wenn du zum Beispiel Modell entwickelst das aus der Cloud heraus Maschinen steuert dann hast natürlich eine große Security-Komponentin.

00:32:52: was ist?

00:32:52: Wenn das in irgendeiner Form gehängt wird da ein Sicherheitsvorfall entsteht und dann Angreifer vielleicht Maschidenparameter in irgeren Form verändern kann die zu einem physischen Problem im schlimmsten Fall, wenn wir jetzt um ihn Hochos-Szenario versuchen zu skizzieren.

00:33:10: Die Maschine explodiert und alle sterben dem ganzen Berg.

00:33:13: Und drumherum ist das Wasser verseucht und die ganze Stadt ist auch hoch!

00:33:18: Ist natürlich absurd in den allermeisten Fällen, wenn mir nicht gerade über einen Kernkraftberg oder so reden... Aber im Kern hast du halt diese ganze physische Sicherheitskomponente wo du dich dann mit Themen wie the militarized zone IT, OT, Security und all solchen Themen beschäftigt es mit, wie du schon gesagt hast, Edge-Modulen.

00:33:38: Das hat mir jetzt ein bisschen aus der Perspektive von Aufwand und Komplexität beleuchtet.

00:33:41: Aber das sind natürlich Aussicherheitsaspekte.

00:33:44: Und da stellen sich halt viele Fragen in der IT-Architektur... ...in der Security-Archeitektor die dann auch nicht immer ganz trivial sind.

00:33:52: Von daher würde ich sagen beide Beide Wochen schon haben so ein bisschen ihre Schwerpunkte, was Governance Compliance angeht.

00:34:02: Nur in unterschiedlichen Bereichen und im Finance Bereich wäre es aus meiner Sicht der Schwerpunkt halt einfach.

00:34:11: zum einen das ganze Thema personenbezogene Daten ist natürlich sehr sehr gewichtig weil es oft sehr sensible Daten sind Und sehr sensible Informationen von Personen, von Privatkunden in den meisten Fällen.

00:34:24: Was natürlich auch noch mal ein ganz anderes Verhältnis ist als im BtoB und stark rechtlich geschütztes in der EU was auch gut so ist!

00:34:33: Und du hast halt irgendwo das ganze Thema Governance Security Nachvollziehbarkeit von Prozessen, Fairness auch über ein EUI Act.

00:34:42: Das Nachteil Modelle einzelne Personen nicht benachteilen aufgrund von Eigenschaften für die sie nichts können.

00:34:50: Da sind alles Aspekte wo du dir im Industrial Bereich weniger Gedanken drum machen musst aber halt da mit anderen Themen konfrontiert bist.

00:34:57: Genau also klar das Thema Security sozusagen beides im Sinne ist auf jeden Fall für beide Seiten relevant, auch wenn ich mir jetzt vorstelle zum Beispiel du hast gerade das Atomkraftwerk eingesprochen aber z.B.

00:35:12: auch so Wenn wir jetzt in den Bereich Aviation zum Beispiel sind da ist es natürlich auch super wichtig dass wenn ich da irgendwie was predicte Dass das dann nicht irgendwie am Ende dazu führt dass irgendwie ein Flugzeug wie abstürzt oder sowas.

00:35:32: Und wenn jetzt das predictive maintenance Modell irgendwie sagt, ja lass mal das Teilen erst zwei Monate später austauschen.

00:35:40: Dann fällt das aus und das Flugzeug ist auf dem Boden oder stürzt ab oder so.

00:35:46: Da gibt es auch ganz klare sicherheitskritische Anforderungen.

00:35:49: Was du gesagt hast gerade bei Maschinendaten eben ITOT die militarized zone mit AirGaps und so weiter, also da muss man sich natürlich über die gesamte Infrastruktur nochmal viel mehr Gedanken machen.

00:36:03: Weil klar wenn am Ende wir zum Beispiel ein Modell regeln, da hatten ja auch schon Newscases das Modell haben was tatsächlich Maschinen steuert automatisiert dann ist es natürlich klar dass wenn das irgendwie gehackt wird oder eine Prediction macht, die irgendwie eine Anomalie ist.

00:36:29: Dass das auch kritisch werden kann auf jeden Fall und deswegen haben wir da natürlich auch meistens dann trotzdem noch irgendwie so ein human in the loop.

00:36:37: Das heißt, wir haben irgendwie im Shopfloor dann noch jemanden der dann zur Not auch diese Regelung wieder auch manuell zurückstellen kann oder so als letzte Instanz irgendwie.

00:36:50: Da sind die Unternehmen dann auch entsprechend sicherheitsbewusst.

00:36:53: Und genau, auf der anderen Seite...

00:36:56: Wenn es überhaupt eine Automatisierung gibt.

00:36:58: Viele Industriei-Use-Cases sind ja eher Assistenzsysteme für einen Human in Deload und bessere Entscheidungen zu treffen.

00:37:07: So oft kommt's hier gar nicht vor dass wirklich ein Maschinenleunigenmodell rein auf Basis von Predictionsmaschinen live steuert.

00:37:15: Gab es durchaus die Use Cases?

00:37:17: hier und da immer mal wieder, aber es ist jetzt eher die Ausnahme als die Regel.

00:37:22: Und oft eher dann Stage drei, Stage vier, Stage fünf eines Projekts und nicht Stage eins oder Stage zwei.

00:37:30: Auf jeden Fall!

00:37:30: Klar, genau.

00:37:30: Also kommt

00:37:31: vor.

00:37:32: Genau.

00:37:34: Und das kommt dann eben auch... dann erst vor, wenn man sich wirklich sehr sicher ist, dass das Modell wirklich sehr stark validiert hat.

00:37:41: Wenn man über längere Zeiträume das auch schon mal vielleicht deployed hatte oder so und die man irgendwie wirklich stark vertraut.

00:37:46: Und wie gesagt selbst, dann ist dann meistens noch ein Mensch irgendwo da der das Ganze dann auch regelmäßig kontrollieren kann.

00:37:57: Genau auf der anderen Seite hast du ihm gesagt im Versicherungsbereich oder generell auch im Finanzbereich ja DSGVO ist sicherlich ein wichtiges Thema.

00:38:08: Viel ist auch grundsätzlich, also regulatorisch generell.

00:38:11: es gibt ja bestimmte Berichtspflichten, Rechenschaftspfichten und so weiter.

00:38:16: Auch Dinge die zum Beispiel bei Dora dann auf die Technologie ganz klar hin führen wo sie immer auch ganz klar um Technologie geht, auch im Cloud und Drittanbieter

00:38:28: usw.,

00:38:28: mit entsprechenden Pflichten Ja die Botte nix sage ich jetzt mal so ein wesentlichen oder die Security Aspekte, die man da immer.

00:38:40: Wenn ich

00:38:41: jetzt raten müsste ist überhaupt wie kannst du gerne in Frage stellen würde ich sagen dass du in der Finanzbranche auch tatsächlich eher mal in eine volle Automatisierung gehst als im Industrial Bereich weil du da oft mit.

00:38:54: oft ist das Ziel von solchen Use Cases im AI Bereich in der Finance Branche ja auch repetitive Arbeit zu reduzieren und großer Prozessmengen beherrschbar zu machen, wenn ich zum Beispiel Achtzigtausend Anfragen pro Monat bekomme zur Versicherungsthemen das zu automatisieren oder die Arbeit zumindest deutlich zu verringern.

00:39:19: und da ist meine Vorstellung zumindest dass man da viel schneller in eine Vollautomatisierung reingeht.

00:39:25: Natürlich gibt es in Onger Form da auch einen human-ended Loop oder die Möglichkeit nochmal ein Fall nachzu... bearbeiten oder nochmal anzuschauen, wenn sich jemand beschwert.

00:39:35: Aber im Großen und Ganzen ist der Benefit und der Value ja oft dann doch... vor allem in der Vollautomatisierung und nicht nur in der besseren Entscheidung, weil in der Produktion ist es ja öfter so dass einzelne Personen auf dem Shopfloor dann Entscheidungen treffen müssen die dann einen großen Impact haben.

00:39:50: zum Beispiel wie mache ich die Parametrisierung der Maschine?

00:39:53: Wie lange lasse ich ein Prozess laufen usw.

00:39:56: Und in der Feindsbereiche ist es sehr oft so das es Prozesse gibt die vielleicht von hundert Mitarbeitern oder zweihundert Mitarbeiter betreut werden.

00:40:02: um das in Masse runter zu arbeiten glaube ich das ist schon viel schneller und mit einem viel klareren ziel in diese vollautomatisierung reingeht, weil der personal auch wanns da vor allem der painpoint ist.

00:40:16: Ja und nein also es kommt einfach auf den newscase an.

00:40:20: also du hast jetzt quasi die sach bearbeitung eben beschrieben.

00:40:26: Da versucht man natürlich genau wie du sagst oder da sind wir.

00:40:31: Also sind viele versichern auch schon relativ weit.

00:40:33: das nennt sich dann dunkelverarbeitung ist eben sozusagen sowas wie automatisierte.

00:40:38: Eine leistungsabrechnungen von einer gerechten Rechnung oder so, dass das schon maximiert wird und das ist sicherlich auch durch den Einsatz von LLMs oder sonstigen AI Modest dann vielleicht noch mal sogar besser möglich weil die dann eben nochmal andere Datenquellen anzupfen können kombinieren können Und dass man das eben noch weiter hoch bekommt, um Personal zu entlasten.

00:41:11: Ich glaube da geht es auch gar nicht so um die Einsparung an sich sondern vor allem in die Entlastung weil es ist doch ziemlich viel Arbeit auch da und es werden ja in den nächsten Jahren gehen da einfach sehr viele Mitarbeiter dann in der Rente, weil wir einfach die Altersstruktur haben in Deutschland.

00:41:29: Da geht's eher darum da nochmal Potenziale zu heben und diese Quote noch mal zu erhöhen.

00:41:35: Aber es gibt natürlich auch die klassischen MAUS-Case, wenn ich jetzt zum Beispiel ... Ich sage sagen wir mal Churnmodel ist ja immer so das wie wahrscheinlich ist das jetzt dass jemand die Versicherung storniert und irgendwie eine andere Versicherung geht oder sowas?

00:41:53: Das ist dann eher ein klassischerer Machine Learning Use Case der natürlich dann auch irgendwo Entscheidungen vielleicht ein Stück weit automatisiert oder aber im Wesentlichen erst mal auch informiert.

00:42:10: Ja, sehe ich auf jeden Fall.

00:42:11: Natürlich das habe ich nicht weit genug gedacht.

00:42:14: Natürlich gibt es da auch Unterschiede und ganz unterschiedliche Bereiche in die man reingehen kann und möchte an der Stelle.

00:42:25: Vielleicht so ein bisschen zum Abschluss der Folge zu kommen, da wir uns eine Langsam.

00:42:32: Es geht

00:42:32: auch mal sehr schnell!

00:42:34: Langsam

00:42:34: als ich anheben.

00:42:35: Ja, ist ja immer ein gutes Zeichen wenn sich das anfühlt, dass es so schnell gehen würde.

00:42:41: Du hattest ja eine kurze Pause bei Alio bis jetzt wieder da.

00:42:47: Bis hast du dich natürlich auch wieder voll in Projekte reingestürzt gleich paar spannende Sachen zu tun gehabt, dadurch sind wir auch auf die Idee für den Podcast gekommen mal so die zwei verschiedenen Welten ein bisschen zu vergleichen.

00:43:01: Wo sind Gemeinsamkeiten?

00:43:03: Wo sind Unterschiede?

00:43:05: vielleicht mal so.

00:43:06: abschließende Frage um den Podcast abzurunden was macht ihr momentan an deiner Arbeit am meisten Spaß?

00:43:16: also für mich ist es so dass Zwei Dinge immer wichtig sind, dass erstes so eine Abwechslungsreichtung.

00:43:22: Also es ist immer wieder neue Projekte gibt mit unterschiedlichen Anforderungen neuen Daten irgendwie neuen Herausforderungen wie man die Daten jetzt die Daten Pipelines richtig aufbaut, die Daten säuber hat auch in der Algorithmik.

00:43:40: also welche Machine Learning Modelle ergeben jetzt für den News Case und so weiter.

00:43:45: also der Abwechslungsreichtum, auch gerade hier bei Elio im Projektgeschäft finde ich.

00:43:51: Das ist das was mir extrem viel Spaß macht und diese Verbindung zwischen sozusagen Data Science & Data Engineering.

00:44:01: Also wir sind ja hier bei elio immer ein bisschen Ich weiß nicht wie heißt das immer Data Cowboys oder so.

00:44:07: Wir sind ja so ein bisschen Mädchen für alles.

00:44:09: na also wir machen natürlich schraube ich an den Modellen rum und mache ganz viele Data Science Studien, gucke mir, mach explorative Datenanalyse und so, guck mehr Verteilung an.

00:44:21: Und basiere darauf dann sozusagen am Ende die Modelle, macht die Modellierung.

00:44:26: aber wir machen eben auch das ganze Deploy mit die Cloud Infrastruktur und jetzt eben auch auf Databricks mit irgendwie Asset Bandits oder Declarative Automation Bandits wie sie als heißen Also sozusagen diese Verbindung zwischen Modellierung auf der einen Seite, also Data Science und dem Engineering der Technik auf der anderen Seite.

00:44:49: Das finde ich super spannend.

00:44:50: wie lässt man so ein Maschinenlearning-Usecase wirklich end to end um?

00:44:55: Und dann auch noch im Industriebereich dann auf der Edge usw.

00:44:59: nochmal ganz andere Probleme mit dazukommen.

00:45:01: Also das ist schon wirklich sehr spannend!

00:45:04: Ja es ist auch glaube ich das Problem was jetzt viele Juniors momentan im Jobmarkt haben, dass die Anforderungen an die Umsetzung immer breiter werden und die Profile, die man eigentlich braucht vom Know-how her immer breitwerden.

00:45:19: Früher war es halt so dann war es da halt Java entwickelt und dann gab es einen Cloud Engineer oder ein Data Engineer und dann gabs den und denen und denen Und die Unternehmen gehen immer mal hin zu sagen eine Person soll eher in die Breite gehen was das Wissen angeht als die Tiefe.

00:45:34: Dann hast du noch das ganze Thema, dass AI jetzt ein Senior schon deutlich effizienter macht.

00:45:40: Gerade einfache oder aufwendige Tasks halt oft vielleicht mittlerweile schon komplett abgenommen werden können durch AI Coding und Coding Agents.

00:45:49: Und man sich dann auch die Dinge, die vielfach wissen erfordern konzentrieren kann.

00:45:56: Es gibt viele Aspekte, die Junior ist gerade sehr schwierig machen in den Jobmarkt reinzukommen und Fuß zu fassen für viele Unternehmen sehen, dass sie den Value, den Sie früher von einem Junior hatten jetzt erst mal die ersten ein zwei Jahre gar nicht bekommen diese einfachen Aufgaben abzunehmen.

00:46:13: und worüber dann jemand auch gelernt hat und tiefer heimgekommen ist.

00:46:16: Und vor allem erstmal viel auch betäunen müssen unterstützen müssen damit die Person Value bringen kann.

00:46:24: das heißt das erste Mal wahrscheinlich wenn eine neue Personsteam dazu kommt eher Kapazität weg geht weil erfahrene Leute sich darum kümmern müssen, als dass sie dazukommt.

00:46:31: Weil Probleme trotzdem dann auch... war schon immer so das Betreuung notwendig war.

00:46:36: aber früher hat die Person an zumindest noch viele Probleme gelöst und quasi die Fußsoldatenarbeit gemacht, sage ich mal, aber liebevoll gemeint.

00:46:45: Und mittlerweile hat sich dieses Kostenlutzenverhältnis halt so sehr verschoben, dass dieser Juniormarkt glaube ich weltweit extrem zusammengebrochen ist auf dem Jobmarkt.

00:46:55: Das finde ich immer noch sehr spannend wie sich das die nächsten Jahre entwickeln wird, ob es dann irgendwann doch wieder einen Run-off-Juniors geben wird weil die Unternehmen sehen okay unsere Seniors gehen auch irgendwann in Rente, irgendwann die Menschen werden halt älter, das ist biologische Wahrheit und wenn kein Nachwuchs nachkommt, ist ja auch eine physikalische Gesetzmäßigkeit dass das irgendwann zum Problem wird.

00:47:20: Das kann mir auch vorstellen, dass wir vielleicht mal so einen großen Gap haben wo irgendwie Leuten wirklich viel Arbeitserfahrung fehlt den sie sonst früher eigentlich gesammelt hätten.

00:47:28: Gleichzeitig hast du natürlich die Möglichkeit heutzutage in der Welt mit AI, die sich so schnell in neue Themen reinzufuchsen, dich so schnell mit neuen Sachen zu beschäftigen das auszuprobieren dort erste Schritte zu machen und was auszupprobieren und da drin zu lernen wie nie zuvor.

00:47:45: von daher bleibt es sehr spannend

00:47:48: Auf jeden Fall, das ist ja sehr viel Aspekt angesprochen.

00:47:53: Also ich glaube diesen Junior Gap wird es wirklich irgendwann geben weil du brauchst auch für neue Seniors wieder Material sag' ich jetzt mal was an gelernt wird und sonst sitzen dann die Seniors alle irgendwann auf den guten Stellen und bewegt sich gar nichts mehr und dann kriegst du halt sonst auch keine Seniors mehr.

00:48:15: Von daher ist das ja irgendwie eine gewisse Notwendigkeit auch, da auch trotzdem weiter zu machen.

00:48:20: Auch wenn man da vielleicht als Unternehmen erstmal investieren muss.

00:48:26: Das ist sicherlich ne Problematik die ich auf jeden Fall auch sehe.

00:48:31: Grundsätzlich hat sich auch das Bild des Data Scientists relativ stark gebannt glaube ich auch im Laufe der Zeit.

00:48:36: früher eher so jemand, der wirklich so nur an den Modellen rumschraubt.

00:48:43: Parameter optimiert vielleicht auch mal ein Paper Lease oder so und das gibt es vielleicht auch in paar größeren Unternehmen auch noch.

00:48:54: aber ich glaube mittlerweile ist dieses T-Shaped Profil extrem gefordert weil ein Data Scientist muss einfach auch mittlerweile die Fähigkeiten mitbringen.

00:49:03: So ein Modell nicht irgendwie keggelmäßig zu bauen, sondern auch wirklich das Ganze in Produktionen zu deployen auf einer Infrastruktur.

00:49:19: Und sogar diese ganzen MLA-Obsgeschichten, die dahinter noch sind.

00:49:23: Was ist mit Retraining?

00:49:24: Was ist irgendwie mit Drift Detection und so was?

00:49:28: Also diese ganze Aspekte mitbeachten!

00:49:31: Vor allem auch diese menschliche Komponente mit den Domänexperten zu reden, zu beraten, Stakeholder in die richtige Richtung zu lenken

00:49:38: und kommunizieren

00:49:39: richtig einzuordnen.

00:49:40: Die ist immer mindestens genauso wichtig wie früher.

00:49:44: Und das Problem bin mir gar nicht so sicher ob es diesen Junior Gap geben wird.

00:49:48: Das ist eine Möglichkeit aber ich bin da sogar skeptisch Weil ich glaube, der Jobmarkt insgesamt verkleinert sich einfach im IT-Bereich.

00:49:56: Ich glaube es wird nie wieder so viele Stellen geben wie sie mal gefragt waren weil die Möglichkeit Leute effizienter zu nutzen in Projekten halt so groß ist wie noch nie.

00:50:06: Es ist halt tatsächlich so dass jetzt zwei drei Mann Teams die Arbeit machen können von dem was vor neun Leuten gemacht haben Und viele Rollenbilder ändern sich auch, wie du gesagt hast.

00:50:15: Dieser Business-Analyst, der einfach die Fachabteilung kommt und sagt, sag mir mal, wie viel Umsatz wir vor drei Jahren gemacht haben mit denen und den Kunden?

00:50:23: Und dann eine SQL Kirby schreibt dazu.

00:50:25: Ich glaube nicht dass es den jemals wieder geben wird.

00:50:27: ich glaube den gibt's zum Teil noch weil Unternehmen langsam sich adaptieren aber der wird immer mehr verschwinden und dann auch wenn er einmal verschwunden ist nie wiederkommen Weil du heutzutage halt solche Sachen einfach mit AI und aus der Verabteilung selber machen kannst.

00:50:39: Und die Adaption ist in vielen Unternehmen langsam, viele werden auch noch in fünf oder zehn Jahren so arbeiten wie vor zehn Jahren aber an vielen Stellen bewegt sich auch was und ich glaube die Zukunft lässt sich da schwer aufhalten.

00:50:50: Ich glaube dieses enorme Bedarf an IT-Fachkräften An reiner Manpower Den wird es so nicht unbedingt nochmal geben und ich Glaube dass das vielleicht so sein wird überschaubare Bedarf, den es in Zukunft noch gibt.

00:51:06: Mit einfach den extrem talentierten Leuten die wirklich diese ganze Bandbereite abdecken können an Kommunikation, Engineering, Data Science und Datenverständnis größtenteils gefüllt werden kann.

00:51:20: weil davon gibt es halt nicht so viele die das alles in einer Person abbilden können, aber die dies abbilden können machen dann jetzt die Arbeit von neuen Leuten im Zweifelsfall wo früher neue Leute gebraucht wurden.

00:51:31: Wie gesagt ich mal gucken vielleicht wird der Run auf Personal doch nochmal stärker wenn dann irgendwie auch mehr Startups aus dem Boden sprießen noch mehr Technologie unternehmen durch Vibe Coding entstehen da kann es ja noch andere von dieser Innovation abhängige Effekte geben, die man da vielleicht gar nicht einrechnet.

00:51:50: Aber ich glaube der Drop-Markt wird sich auf weniger Leute an die die Anforderungen dafür viel höher sind und bisschen fokussieren in Zukunft.

00:52:01: Kann sein!

00:52:02: Ich glaube so mit Prognosen.

00:52:04: also wir gucken ja alle gerade... Also es ist ja wirklich einen riesen Umbruch und ich glaub keiner weiß genau wie sich das entwickelt.

00:52:12: Es gibt ja auch dieses Ist das nicht das Simpsest-Paradox, dass wenn sozusagen es wird ist quasi günstiger oder einfacher Software zu verstellen gibt's halt einfach mehr Software.

00:52:20: Und dann gibt es am Ende vielleicht doch wieder mehr oder zumindest genauso viele Leute die das dann normal sind kann ja auch sein und das wissen wir einfach nicht.

00:52:30: Das wird sich dann eben in Zukunft zeigen.

00:52:34: Und ja ich sag mal für Data Scientist, wie gesagt wenn man dieses T-Shap Profiler mitbringt glaube ich dass man da auch in Zukunft dann noch gefragt sein wird eben insbesondere auch was du gesagt hast.

00:52:44: Mit diesem ganzen Consulting Mindset auch menschlich die Dinge zu erklären und sozusagen nicht nur in Produktionen zu bringen sondern auch dafür zu sorgen das es genutzt wird und dass die Potenziale gehebelt werden

00:53:01: auf jeden Fall kickelt, ich spreche auch mit anderen Dienstleisten und anderen Agenturinhabern.

00:53:08: Da treffe ich momentan eigentlich an allen Ecken auf das gleiche Mindset.

00:53:12: Auf gar keinen Fall wollen wir wachsen im Personal.

00:53:15: Wir wollen die Mannschaft so behalten wie sie ist wenn jemand geht.

00:53:17: es ist auch nicht dramatisch und wir sind fest davon überzeugt dass wir mehr als früher schaffen können mit weniger Leuten um das jetzt schon tun.

00:53:27: Das Mindset treff' ich an ganz vielen Stellen und auch viele Mittelständler die sich wenn man über AI Strategie, Datenstrategie spricht was ist ein euer Ziel?

00:53:35: Und im Endeffekt ist das Ziel ganz oft mit der gleichen Mannschaft mehr schaffen oder dass gleiche schaffen und nicht mehr Leute bedürftigen.

00:53:43: Das macht, glaube ich diesen ganzen Arbeitsmarkt ja auch in Deutschland generell super schwach ist momentan und keine Anzeigen von Erholung zeigt schwierig.

00:53:51: Ich habe auch viele Freunde im jüngeren Alter die vielleicht gerade mit dem Master durch sind und ihren ersten Job suchen und seit einem Jahr Bewerbungen schreiben wie wild und überall abgelehnt werden sehr verzweifelt sind.

00:54:03: Von daher glaube ich, dass wird nochmal sehr spannend wie sich das Ganze entwickelt und große Herausforderungen mit sich bringen.

00:54:09: Meine Prediction war ja immer schon vor fünf Jahren, dass AI und KI irgendwann so gut wird, dass wir ein bisschen in der dystopischen Welt landen, dass viele Leute gar keinen Job mehr haben, sich irgendwie über eine Automation-Steuer staatlich finanziert werden müssen und dann so die Dystopie ist was mache ich mir dem einer ganzen Freizeit?

00:54:25: Und wie fülle ich mein Leben aus?

00:54:28: Mal gucken

00:54:29: ob es sich das noch bewahrheitet.

00:54:33: Ja und wir wissen ja auch nicht, das muss ja eben aussehen.

00:54:35: Das ist jetzt eine ziemliche Disruption Und wir wissen gar nicht was es in Zukunft dann für neue Jobs geben wird.

00:54:41: Also häufig ist das so dass es dann aus einem neuen Disruption ein neues Ökosystem erwächst.

00:54:49: Dann gibt's wieder andere Sachen zu tun.

00:54:51: Ich höre auch viele Tech-Podcasts privat.

00:54:56: Da gibts selbst immer dieses Beispiel das früher Leute gesagt haben, ja es gibt ja Compiler.

00:55:03: Und weil es Compiler gibt wird es in Zukunft keine Entwickler sozusagen mehr geben.

00:55:10: Das

00:55:11: geht bis auf die Dampfmaschine zurück und ganz viele Sachen.

00:55:15: da müssen wir nicht mal in der IT-Welt bleiben.

00:55:17: Das wurde aber jeder industriellen Revolution oder Produktivitätsteigerung gesagt dass jetzt alle arbeitslos werden.

00:55:23: Empirisch müsste man eigentlich davon ausgehen dass es dann irgendwie weitergeht weiterhin auch Leute braucht, die machen dann halt mal andere Sachen.

00:55:32: Mal sehen vielleicht wird es auch anders kommen.

00:55:35: aber als Data Scientist und Physiker stützt ich mich da ganz gerne auf die empirische Emidens.

00:55:43: Das stimmt, du kennst das Konzept vom Black Swan oder?

00:55:48: Ja ja!

00:55:49: Aber

00:55:49: gut wir haben jetzt die Zeit schon ein bisschen überstreckt und waren noch mal.

00:55:53: einen kleinen Ausflug in eine andere Thematik aber hat Spaß gemacht.

00:55:56: Auf jeden Fall Dann bringen wir das ganze Podcast Thema bei Elio mal wieder an den Start in den nächsten Wochen, dass man öfters von uns hört.

00:56:04: Und ich würde sagen nehmen wir das als Schlusswort mit.

00:56:08: Alles klar ja vielen Dank dir und vielen Dank, dass sich mal wieder als Gast jetzt hier auch dabei sein durfte.

00:56:13: Macht mir auf jeden Fall Spaß!

00:56:14: Ja gerne!

00:56:16: Dann auch danke an die Zuschauer.

00:56:18: ihr könnt mal wieder mit mehr von uns rechnen hoffentlich in den nähsten Wochen und Monaten.

00:56:22: Von daher hoffe ich, dass ihr dran bleibt, dass es Spaß hat und lasst gerne Feedback da.

Shownotes

Transkript anzeigen

Neuer Kommentar