Data Science in Wissenschaft und Industrie - Unterschiede und Gemeinsamkeiten
Shownotes
Takeaways
-Der Wechsel von der Wissenschaft zur Industrie kann herausfordernd sein. -Die Promotion erfordert Durchhaltevermögen und hohe Belastbarkeit. -Data Science erfordert sowohl technische Fähigkeiten als auch -Kommunikationskompetenz. -Teamarbeit ist in der Industrie oft strukturierter als in der Wissenschaft. -Die Nutzung von KI in der Forschung eröffnet neue Möglichkeiten. -Praktische Erfahrungen sind entscheidend für den Erfolg in der Industrie. -Die Fähigkeit, komplexe Probleme zu lösen, ist in beiden Bereichen wichtig. -Ein gutes Verständnis von Statistik ist für Data Scientists unerlässlich. -Die Arbeitskultur in der Industrie ist oft dynamischer und schneller. -Die Vielfalt der Projekte in der Industrie kann sehr bereichernd sein.
Transkript anzeigen
00:00:00: Hallo Tobi!
00:00:02: Ja moin, moin David!
00:00:04: Moin, schön dich zu sehen.
00:00:06: Ein ganz besonderer Podcast,
00:00:08: ohne Janis.
00:00:10: Ohne Janis.
00:00:12: Und ich hab die Ehre,
00:00:14: heute dich hier zu interviewen.
00:00:16: Wie fühlst du dich?
00:00:18: Wie fühlst dich das an?
00:00:20: Ja, ist mega spannend.
00:00:22: Auch ziemlich witzig,
00:00:24: dass ich jetzt hier bei dem Podcast bin,
00:00:26: über den ich überhaupt zu Alio gekommen bin damals.
00:00:28: Und der ist tatsächlich,
00:00:30: dieses Jahr bei meinem Spotify Wrapped,
00:00:32: auch Platz 3 der Podcast,
00:00:34: geschafft hat.
00:00:36: Ja, also ich glaub,
00:00:38: mehr Commitment geht nicht.
00:00:40: Obwohl zwei Plätze nach oben sind noch frei,
00:00:42: aber genau,
00:00:44: nee, ich bin super spannend
00:00:46: und freue mich heute dabei zu sein.
00:00:48: Sehr gut, das heißt,
00:00:50: unser Ziel für nächstes Jahr,
00:00:52: Alientern steht,
00:00:54: einen Platz in deiner Wrappedlist nach oben.
00:00:56: Genau, mindestens.
00:00:58: Aber das heißt auch,
00:01:00: dass du nicht so viele Podcasts
00:01:02: eigentlich hören kannst,
00:01:04: weil wir gar nicht so viele folgen,
00:01:06: wenn das für Platz 2 reicht.
00:01:08: Das stimmt, das stimmt.
00:01:10: Also meine Podcastliste
00:01:12: beschränkt sich auf
00:01:14: sehr wenige Ausgewählte,
00:01:16: die ich dafür dann aber regelmäßiger höre.
00:01:18: Man muss ja auch immer dazu kommen,
00:01:20: das ist ja immer auf die Zeit.
00:01:22: Lieber nicht öffentlich wie viele Podcast-Minute
00:01:24: ich letztes Jahr hatte.
00:01:26: Aber ich bin großer Geschichten
00:01:28: als der Geschichte-Fan.
00:01:30: Hab ich auch schon von gehört.
00:01:32: Als wir zusammengekommen.
00:01:34: Mit dir mach ich wahrscheinlich heute keinen Schand vorgeblänken.
00:01:36: Das verschieben wir dann auch.
00:01:38: Ja, ich glaub, das ist auch besser so.
00:01:40: Was hat sich uns vorgenommen?
00:01:42: Wir haben ja beide in den gleichen Untergrund.
00:01:44: Beide mit einem Physik-Doctor
00:01:48: zu Elio bekommen
00:01:50: und haben uns gedacht,
00:01:52: es ist auch eine schöne Folge
00:01:54: für das Jahresende.
00:01:56: Das muss man zu vergleichen.
00:01:58: Wie war eigentlich das Leben
00:02:00: an der Uni? Wie ist das Leben bei Elio?
00:02:02: Wie fühlt sich das an?
00:02:04: Das soll ein bisschen unser Thema sein.
00:02:06: Vielleicht auch Empfehlungen
00:02:08: für andere Leute mit einem
00:02:10: ähnlichen Werdegang
00:02:12: oder für Unternehmen wie Elio macht das Sinn.
00:02:14: So Leute wie uns einzustellen.
00:02:16: Ja.
00:02:18: Genau, damit wir dich mal kennen,
00:02:20: ich war ja jetzt schon öfter im Podcast.
00:02:22: Was ist denn dein Hintergrund eigentlich?
00:02:24: Genau, also du hast das schon richtig gesagt.
00:02:28: Wir kommen beide aus der Physik.
00:02:30: Bei mir ist es
00:02:32: die experimentelle Teilchenphysik.
00:02:34: Das heißt, ich habe
00:02:38: promoviert an der Universität Hamburg
00:02:40: im Institut für Experimentalphysik
00:02:42: in einer Arbeitsgruppe,
00:02:44: die Teil des CMS-Experiments am Zern ist.
00:02:46: Das ist also eines der großen Experimente
00:02:48: am weltbössten Teilchenbeschleuniger
00:02:50: LHC.
00:02:52: Und genau, mein Thema
00:02:54: war da eben, wie wir die
00:02:56: Anomalieerkennung
00:02:58: verbessern können
00:03:00: beim CMS-Experiment
00:03:02: mit KI-Methoden.
00:03:04: Ich habe mich da also
00:03:06: sehr intensiv auch schon seit dem Master
00:03:08: mit diesem Thema beschäftigt.
00:03:10: Und habe das Ganze dann
00:03:12: in derselben Arbeitsgruppe dann auch in der Promotion
00:03:14: fortgeführt
00:03:16: und
00:03:18: mein
00:03:20: konkretes Thema ging
00:03:22: um Anomalie-Detection.
00:03:24: Das heißt, wie können wir
00:03:26: ohne spezifische Annahmen
00:03:28: über unser Signalmodell tatsächlich
00:03:30: mit
00:03:32: einem nicht überwachten
00:03:34: Maschinenlearningschema
00:03:36: die Anomalie
00:03:38: in Teilchenphysikalischen Daten besser erkennen?
00:03:40: Das hört sich ja sehr, sehr fancy an.
00:03:44: Sehr cool an.
00:03:46: Was bedeutet das
00:03:48: eine Anomalie?
00:03:50: Eine Anomalie, wenn du die detektierst, hast du dann
00:03:52: ein Teilchen gefunden?
00:03:54: Genau, das wäre natürlich der Idealfall.
00:03:56: Also
00:03:58: irgendwie etwas, also was man letztendlich macht
00:04:00: ist es bei uns jetzt konkret
00:04:02: so eine Mischung gewesen
00:04:04: aus generativen
00:04:06: Modellen, Maschinenlearningmodellen
00:04:08: und
00:04:10: Klassifikationsmodellen. Das heißt
00:04:12: man will ja immer was Neues
00:04:14: entdecken. In der Teilchenphysik
00:04:16: hat man vielleicht auch, schon mal gehört
00:04:18: wenn man jetzt nicht Teilchenphysiker ist, dass
00:04:20: aktuell das Standardmodell der Teilchenphysik
00:04:22: ist, die das berühmte.
00:04:24: Und was man eben machen kann, ist man kann
00:04:26: solche generativen Modelle trainieren.
00:04:28: Das ist letztendlich das auch was
00:04:30: hinter so Sachen
00:04:32: wie Stable Diffusion
00:04:34: oder so was steckt, so bei Bildgenerierung
00:04:36: usw.
00:04:38: Man kann solche Modelle trainieren auf den
00:04:40: Klassik-Feyer-Daten und lernt
00:04:42: quasi so ein Hintergrundmodell.
00:04:44: Und dann kann man am Ende
00:04:46: so ein Klassik-Feyer trainieren
00:04:48: der dann sozusagen
00:04:50: alles erkennt, was sich unterschiedlich
00:04:52: verhält. Und das ist ja dann wiederum ein
00:04:54: neues Signal. Also wir wollen quasi gucken
00:04:56: wie können
00:04:58: wir Teilchen oder wie können wir
00:05:00: Ereignisse, Kollisionsereignisse
00:05:02: in unserem Detektor
00:05:04: detectieren, die sich unterschiedlich
00:05:06: von unserem Hintergrund behalten, den
00:05:08: generativen Modell gelernt haben.
00:05:10: Und im Idealfall kommt dann dabei raus, dass
00:05:12: wir ein neues Teilchen entdeckt haben. Aber da
00:05:14: müssen dann natürlich schon sehr strenge
00:05:16: Kriterien erfüllt sein,
00:05:18: damit wir ja wirklich mit Sicherheit sagen können,
00:05:20: es handelt sich jetzt ja wirklich um neue Physiken.
00:05:22: Ich gehe mal davon aus, du hast
00:05:24: kein neues Teilchen entdeckt,
00:05:26: sonst hätte ich schon ein neues Teilchen entdeckt.
00:05:28: Sonst geht es vielleicht schon
00:05:30: als Quad-Parsilvison,
00:05:32: obwohl es wahrscheinlich nicht nach mir
00:05:34: benannt worden wäre, selbst wenn, aber
00:05:36: leider haben wir in unseren Daten
00:05:38: mit der Methode
00:05:40: kein neues Teilchen entdeckt, aber
00:05:42: wir konnten sozusagen unsere
00:05:44: Sensitivität, es wird uns auch
00:05:46: Simulationen verglichen
00:05:48: mit verschiedenen Modellen, konnten wir unsere Sensitivität
00:05:50: im Vergleich zu herkömmlichen
00:05:52: nicht KI basierten Methoden deutlich verbessern.
00:05:54: Wir müssen an der Stelle
00:05:56: aufpassen, dass wir nicht zu sehr abdriften.
00:05:58: Wir hatten ja in meiner letzten
00:06:00: Podcastfolge Alex mit seiner Freundin
00:06:02: getrot, die dann immer ausschaltet.
00:06:04: Wenn es zufällig wird.
00:06:06: Ich finde das natürlich schon
00:06:08: sehr spannend und
00:06:10: vielleicht noch die eine Frage dazu.
00:06:12: Hab ich das richtig verstanden?
00:06:14: Das ist ja eigentlich
00:06:16: neuer Ansatz
00:06:18: mit der KI und mit generativer KI also
00:06:20: vorher, habe ich ja mehr oder weniger
00:06:22: eine Theorie gehabt
00:06:24: und habe gewusst, was ich suche,
00:06:26: weil ich quasi gesagt habe, die Theorie sagt mir voraus,
00:06:28: ich muss irgendwo ein bestimmtes
00:06:30: Signal detektieren können
00:06:32: und dann versuche ich eben genau genug zu messen
00:06:34: um das zu finden. Und ihr sagt jetzt,
00:06:36: wir machen das anders.
00:06:38: Wir benutzen quasi GenAI
00:06:40: und wir lassen
00:06:42: wir versuchen damit einfach
00:06:44: etwas, wie lieb ich, neues zu finden,
00:06:46: ob das jetzt von der Theorie vorhergesagt wurde
00:06:48: oder nicht.
00:06:50: Genau, das hast du ganz richtig verstanden.
00:06:52: Also
00:06:54: das ist sozusagen ein ganz anderer
00:06:56: Ansatz, als wenn man
00:06:58: sein Signal oder sag ich mal die Theorie
00:07:00: seines Signals schon kennt.
00:07:02: Das ist das Typische. Der Theoretiker
00:07:04: geht zum Experimental Physiker und sagt, guck mal
00:07:06: in den Odeon Variablen
00:07:08: da könnte sich ein Teilchen irgendwie
00:07:10: verstecken, nach meiner Theorie
00:07:12: und wir
00:07:14: gehen sozusagen von der
00:07:16: anderen Seite ran und sagen,
00:07:18: wir wollen nicht davon abhängig
00:07:20: sein, dass sich sozusagen in Theoretika
00:07:22: schon mal das richtige Modell überlegt hat.
00:07:24: Sondern wir wollen also sagen, ohne
00:07:26: oder möglichst ohne Modellannahmen
00:07:28: sozusagen reingehen
00:07:30: und
00:07:32: suchen nach irgendetwas, was anders auslädt
00:07:34: als der Hintergrund. Und dazu nutzen wir
00:07:36: auch GenAI. Solche Modell, sogenannten
00:07:38: Modellunabhängigen suchen, gab es auch schon vorher
00:07:40: in der Teilchenphysik, aber da wurden die
00:07:42: mit Simulationen gemacht
00:07:44: und die Simulationen in der Teilchenphysik,
00:07:46: gerade beim Standardmodell
00:07:48: in bestimmten Bereichen sind nicht ganz so exakt
00:07:50: und deswegen haben wir hier das quasi
00:07:54: direkt auch auf Daten trainieren können.
00:07:56: Das heißt, wir haben das quasi so
00:07:58: ein data driven approach gemacht,
00:08:00: was auch nochmal eine Verbesserung
00:08:02: in der Methodik darstellt.
00:08:04: Es ist natürlich schon
00:08:06: sehr spannend,
00:08:08: sehr cool
00:08:10: auch, dass man sieht, ich meine
00:08:12: hat es ja auch an
00:08:14: Physiknobelpreis gesehen, wie
00:08:16: eng dann auch Physik und
00:08:18: Grundlagenforschung mit
00:08:20: KI verbandelt ist,
00:08:22: wie man dann vielleicht manchmal doch
00:08:24: eher in der Wirtschaft kennt
00:08:26: oder auch...
00:08:28: Genau.
00:08:30: So und jetzt
00:08:32: saßt du hier cutting edge
00:08:34: Teilchenphysik,
00:08:36: coole Physikexperimente
00:08:38: und dann hast du dir gedacht
00:08:40: "Aliot, das ist es.
00:08:42: Mein Ding mit Podcast, da muss ich
00:08:44: wie kamst du hin zu dem
00:08:46: Wechseln?"
00:08:48: Also das war eigentlich auch so ein bisschen
00:08:50: Zufall.
00:08:52: So eine Mischung aus Podcast
00:08:54: und Social Media.
00:08:56: Also es gibt
00:08:58: in Hamburg so ein KI
00:09:00: in Kubathor, sag ich jetzt mal.
00:09:02: Arik heißen die,
00:09:04: wo wir auch Mitglied sind
00:09:06: mit Aliot und die haben
00:09:08: eine Podcast-Folge
00:09:10: auf LinkedIn geteilt
00:09:12: und das war
00:09:14: ziemlich genau vor einem Jahr
00:09:16: so
00:09:18: für zwischen den Jahren, sagt mir,
00:09:20: wir hören hier
00:09:22: unseren Mitgliedern von Aliot,
00:09:24: die haben ein Podcast gemacht,
00:09:26: eine neue Podcast-Folge, könnt ihr mal reinhören
00:09:28: und
00:09:30: das fand ich so spannend,
00:09:32: dass ich
00:09:34: im Prinzip alle Verquiktbeantfolgen
00:09:36: auch gleich gehört habe
00:09:38: und
00:09:40: vielleicht deswegen auch Platz 3
00:09:42: und
00:09:44: genau, hab mich dann einfach
00:09:46: spontan beim Janis gemeldet
00:09:48: und dann bin ich mit der
00:09:50: Mitte fristig fertig mit meinem Doktor.
00:09:52: Wie sieht es aus, könnt ihr noch Leute gebrauchen
00:09:54: und ja, dann nahmen die Dinge
00:09:56: ihren Lauf
00:09:58: und genau, so bin ich
00:10:00: dann endlich zu Aliot gekommen, hab dann
00:10:02: das übliche Verfahren durchlaufen
00:10:04: mit
00:10:06: Bewerbungen, Tech-Interview
00:10:08: und so weiter, was ja auch schon in diesem Podcast
00:10:10: besprochen wurde,
00:10:12: wie das für uns läuft
00:10:14: und
00:10:16: du kannst bestätigen,
00:10:18: wir haben nicht gelogen,
00:10:20: wir machen das wirklich so.
00:10:22: Genau, es läuft genauso.
00:10:24: Ja,
00:10:26: sehr gut, das gibt uns
00:10:28: jetzt glaubwürdig.
00:10:30: Weiß nicht, ob die eine oder andere
00:10:32: Aufgabe vielleicht schon mal verändert wurde, aber
00:10:34: wer weiß.
00:10:36: Ich plane auch mal ein Update für nächstes Jahr.
00:10:38: So, muss man ja auch sagen,
00:10:40: Tech-GVT
00:10:42: macht auch die Aufgaben
00:10:44: schwieriger.
00:10:46: Man sollte die nicht
00:10:48: einfach Pasten und von Tech-GVT
00:10:50: lösen lassen können, das ging früher mal.
00:10:52: Ja,
00:10:54: ich weiß halt noch, bei mir
00:10:56: für mich war
00:10:58: dann relativ schnell im Verlauf
00:11:00: der Promotion klar,
00:11:02: das würde mal in Richtung Wirtschaft gehen,
00:11:04: weil man in der Wissenschaft
00:11:06: dann irgendwo
00:11:08: weil so, soll man das eine Kleser in der Decke nennen,
00:11:10: aber so eine gewisse
00:11:12: Perspektivlosigkeit/
00:11:14: sehr hohe Risikogereitschaft
00:11:16: haben muss, wenn man nach dem Doktor
00:11:18: noch da bleiben will. Das war bei dir so ähnlich, oder?
00:11:20: Ja, das ist sehr schön formuliert, genau.
00:11:22: Ja, man muss halt schon,
00:11:24: wenn man jetzt wirklich langfristig
00:11:26: in der Wissenschaft bleiben will
00:11:28: auch nach seinem Doktor, muss man
00:11:30: schon einen sehr langen Atem
00:11:32: und, weil ich mal eine sehr hohe
00:11:34: Leidensfähigkeit auch ein Stück weit mitbringe,
00:11:36: weil
00:11:38: natürlich die Rahmenbedingungen
00:11:40: nicht optimasen, es gibt
00:11:42: wenige festzustellen,
00:11:44: auf die sich sehr viele
00:11:46: auch sehr schlaue Leute
00:11:48: bewerben.
00:11:50: Und ja, es wird dann eben auch
00:11:52: verlangt, dass man zum Beispiel auch
00:11:54: internationalen Erfahrungen sammelt,
00:11:56: dann muss man typischerweise dann auch mehrere
00:11:58: sogenannte Postdocs machen, schließt sich dann
00:12:00: eben an die Promotion an, wenn man in der Wissenschaft bleibt.
00:12:02: Und
00:12:04: genau, ich wollte eben auch
00:12:06: so ein bisschen lokaler hier
00:12:08: in der Großraum Hamburg
00:12:10: bleiben und das war für mich
00:12:12: eben klar und deswegen
00:12:14: war für mich dann der Schritt
00:12:16: ja, sag ich mal
00:12:18: logisch irgendwo an dem Punkt.
00:12:20: Und ich hatte mich auch schon vorher aber
00:12:22: immer viel mit Data Science
00:12:24: beschäftigt und hatte auch Lust
00:12:26: tatsächlich
00:12:28: das ganze Mal in einem praktischen
00:12:30: Umfeld anzuwenden
00:12:32: und das ganze live zu sehen
00:12:34: und auch mal ein Modell live
00:12:36: zu deployen und zu gucken, was das so macht.
00:12:38: Und hatte
00:12:40: mich auch schon vorher viel mit
00:12:42: Data Science im Allgemeinen auch neben der Promotion
00:12:44: beschäftigt.
00:12:46: Gab von der Uni so
00:12:48: Data Science
00:12:50: Schools
00:12:52: und die habe ich auch alle
00:12:54: im Prinzip mitgenommen, wo man auch nochmal so allgemeiner
00:12:56: über Data Science was gelernt hat.
00:12:58: Und
00:13:00: ja, habt auch so
00:13:02: online Kurse belegt
00:13:04: im Bereich auch Sequel
00:13:06: und so Sachen, die man so in der Uni vielleicht nicht so lernt
00:13:08: und hatte mich da schon
00:13:10: so ein bisschen auf einen
00:13:12: beruflichen Wechsel vorbereitet.
00:13:14: Ja, ich glaube, da kommen wir gleich nochmal zu
00:13:16: was eigentlich so
00:13:18: technische Skills
00:13:20: und Unterschiede sind, aber
00:13:22: vielleicht nochmal
00:13:24: chronologisch gegangen.
00:13:26: Kannst du ein bisschen
00:13:28: beschreiben, wie das
00:13:30: für dich war. Also ich weiß bei mir noch
00:13:32: die Promotion ist ja auch schon
00:13:34: etwas, wo man leid geprüft ist.
00:13:36: Und ich habe noch keinen getroffen,
00:13:38: der ein Doktor gemacht hat, der da nicht
00:13:40: zwischendurch mal an einer gewissen emotionalen
00:13:42: Grenze angekommen ist.
00:13:44: Und auch dieses
00:13:46: drei Jahre, manche
00:13:48: fünf Jahre, manche sechs Jahre lang auf einen
00:13:50: Ziel hinarbeiten.
00:13:52: Dann bewirbt man sich
00:13:54: wo ich die präfe, dann
00:13:56: bewirbt man sich
00:13:58: geht
00:14:00: man sich in die Wissenschaft und auf einmal
00:14:02: ist man nicht mehr in drei Jahreszyklen,
00:14:04: sondern in
00:14:06: drei Monatszyklen, bis hin
00:14:08: zu drei Wochenzyklen
00:14:10: und in unserem Fall
00:14:12: Projektgeschäft.
00:14:14: Ist ja schon ein gewisser Sprung ins kalte Wasser.
00:14:16: Wie hast du den erlebt?
00:14:18: Ja.
00:14:20: Also ich habe den schon
00:14:22: sag ich mal stark
00:14:24: erlebt,
00:14:26: weil ich
00:14:28: auch auf einem Projekt saß,
00:14:30: als ich angefangen
00:14:32: habe.
00:14:34: Allerdings habe ich das eher so,
00:14:36: ich war ja schon von vornherein
00:14:38: darauf eingestellt,
00:14:40: gewesen, dass es im Projektgeschäft
00:14:42: immer so läuft.
00:14:44: Auch so hat sich ja eben auch schon in den
00:14:46: vorherigen Gesprächen so
00:14:48: rausgestellt.
00:14:50: Und ja,
00:14:52: von daher hatte ich in dem Moment,
00:14:54: auch gerade wenn man so neu anfängt,
00:14:56: vielleicht noch mal mehr elan,
00:14:58: hatte ich da
00:15:00: auch wirklich
00:15:02: eine große Lust drauf,
00:15:04: mich da auch stark einzubringen.
00:15:06: Aber natürlich klar, die Mühlen
00:15:08: in der Universität
00:15:10: malen meistens ein bisschen langsamer.
00:15:12: Nichtsdestotrotz gibt es da natürlich auch
00:15:14: wieder richtiges. Das ist ja entsprechend
00:15:16: der Stressrohr.
00:15:18: Findest
00:15:20: in Projektgeschäft
00:15:22: bei Alio vielleicht nochmal
00:15:24: ein ticken Planbarer.
00:15:26: Also natürlich hat man
00:15:28: auch sehr enge Zyklen,
00:15:30: aber das weiß man
00:15:32: halt.
00:15:34: Man weiß halt, okay, wir haben dann
00:15:36: und dann immer unser Weekly,
00:15:38: oder bis dann muss irgendwie was fertig
00:15:40: werden, wenn man mal ein Projektplan hat, irgendwie.
00:15:42: Und
00:15:44: was für mich so ein bisschen
00:15:46: der Hauptstressor bei der Uni war,
00:15:48: ich weiß nicht, was dir da ging, war, dass halt viele
00:15:50: Sachen so ad hoc
00:15:52: oder zwischendurch gekommen sind.
00:15:54: Also jetzt muss ich nochmal schnell
00:15:56: eine Präsentation machen,
00:15:58: eine wissenschaftliche,
00:16:00: oder jetzt wollen wir dazu aber auch nochmal
00:16:02: was publizieren oder so, und dann muss man sich
00:16:04: dann doch eben wieder nochmal ran setzen,
00:16:06: man ist zwar sehr eigenständig,
00:16:08: aber es kommen eben auch viele Sachen so ad hoc rein.
00:16:10: Und das fand ich wiederum
00:16:12: da eingehend ein bisschen stressiger.
00:16:14: Und im Projektgeschäft kann man sich dann
00:16:16: ein bisschen mehr darauf einstellen,
00:16:18: weil man das ja auch entsprechend plant.
00:16:20: Also ich weiß noch,
00:16:22: ich denke, das wird sehr unterschiedlich sein,
00:16:24: aber ich weiß noch,
00:16:26: was ich mal ein Doktor angefangen habe.
00:16:28: Ich hatte dann das Thema
00:16:30: auch aus der Masterarbeit mehr oder weniger mitgenommen
00:16:32: und dann eben größer aufgezogen.
00:16:34: Aber ich glaube,
00:16:36: da hat man schon die ersten Wochen
00:16:38: damit verbracht, Literatur zu lesen,
00:16:40: Ideen zu sammeln,
00:16:42: vielleicht mal Reinigkeiten auszubewühren,
00:16:44: aber ich würde sagen
00:16:46: mit einem sehr breiten
00:16:48: Start und nicht mit der
00:16:50: höchsten
00:16:52: Geschwindigkeit, was jetzt das Erzielen
00:16:54: von irgendwelchen Delirables
00:16:56: und Outputs angeht.
00:16:58: Und das ist dann natürlich
00:17:00: im Projektgeschäft anders.
00:17:02: Also ich war ja eng dabei bei dir.
00:17:04: Das war ja auch
00:17:06: ein neues Thema, was du gemacht hast.
00:17:08: Du hast dich dann mit
00:17:10: Produktionsoptimierung beschäftigt.
00:17:12: Du hast da auch ein bisschen dich eingelesen,
00:17:14: aber du hast
00:17:16: mehr nach
00:17:18: einer Woche
00:17:20: ein erstes sichtbares Ergebnis.
00:17:22: Also das Ganze
00:17:24: versuchen so zu streamline
00:17:26: und dann vielleicht an der einwandenden Stelle
00:17:28: nicht so weit in die akademische Tiefe zu gehen,
00:17:30: aber so schnell das man was sieht,
00:17:32: das ist ein Unterschied.
00:17:34: Genau, das vielleicht wenn wir nachher nochmal ein bisschen genauer
00:17:36: auf die Unterschiede und Gemeinsamkeiten
00:17:38: eingehen,
00:17:40: wäre das auch ein Punkt,
00:17:42: den ich definitiv nochmal
00:17:44: ausstellen würde.
00:17:46: Klar,
00:17:48: man hat eben diese Regelmäßigkeit an Deliverables,
00:17:50: die man eben auch haben muss.
00:17:52: Bei uns war es zum Beispiel eine Arbeitsgruppe zwar auch so,
00:17:54: dass wir also an der Uni
00:17:56: jede Woche eine Präsentation
00:17:58: hatten, um über unseren aktuellen Stand
00:18:00: manchmal zu berichten, aber es ist natürlich
00:18:02: nicht, sozusagen
00:18:04: man muss jetzt irgendwie
00:18:06: das neue beste Modell jede Woche irgendwie
00:18:08: haben oder sowas,
00:18:10: sondern das ist eher ein kontinuierlicher Prozess.
00:18:12: Aber es kann natürlich am Ende dann eben auch
00:18:14: sozusagen
00:18:16: recht high stakes sein,
00:18:18: und man hat schon viele Monate an etwas gearbeitet
00:18:20: hat in der Wissenschaft
00:18:22: und sich dann zum Beispiel irgendwie rausstellt,
00:18:24: dass man das hier eben
00:18:26: es doch nicht so probizieren kann,
00:18:28: weil zum Beispiel irgendwo ein Bug war,
00:18:30: ein Code oder
00:18:32: weiß ich Dinge dann doch nochmal
00:18:34: anders rauskristallisiert haben, als man ursprünglich dachte.
00:18:36: Und das ist dann eben auch nochmal
00:18:38: zu jetzt sicher
00:18:40: Stress und es kann eben dann auch noch mal problematisch sein.
00:18:42: Ich weiß nicht wie
00:18:46: deine Wahrnehmung gewesen
00:18:48: gerade auch an der Uni
00:18:50: ich hatte bei mir schon
00:18:52: auch weite
00:18:54: Teile der Promotion das Gefühl
00:18:56: im Endeffekt war das mein Projekt.
00:18:58: Ich meine man hat dann
00:19:00: ein paar Kollaborationspartner, aber jeder
00:19:02: hat auch so ein bisschen seinen eigenen Rhythmus
00:19:04: und wer es oft von dem
00:19:06: jeweiligen Promotionsplan abhängig den man
00:19:08: eben hat. Und dann kann es ja auch schon mal passieren,
00:19:10: dass du sehr lange auf andere
00:19:12: warte bist und da kommt halt nichts
00:19:14: oder
00:19:16: du hast selber einen Bug
00:19:18: und es gibt aber niemanden
00:19:20: dem mit dir an deinem Code
00:19:22: arbeitet, der dir hilft.
00:19:24: Ich hatte das Gefühl, dass man da schon auch
00:19:26: recht stark einzelkämpfer war
00:19:28: und auch in der Verarbeitung
00:19:30: alleine war auch wohingegen,
00:19:32: wird es ja bei Eddie ein bisschen versuchen
00:19:34: im Team gemeinsam
00:19:36: aufzufangen mit einem
00:19:38: Ansprechpartner
00:19:40: und mit einem Project Buddy, der einem hilft
00:19:42: und auch ich finde die Kunden
00:19:44: ein höheres Interesse an der Mitwirkung haben
00:19:46: einfach weil sie Geld dafür bezahlen
00:19:48: und
00:19:50: schnell dann auch Ergebnisse sehen wollen
00:19:52: würdest du das teilen oder
00:19:54: war das bei dir anders?
00:19:56: Ich habe vielleicht
00:19:58: eine etwas ungewöhnliche Promotion
00:20:00: vielleicht als die meisten
00:20:02: Doktoranden gehabt
00:20:04: ich habe ja schon gesagt
00:20:06: dass ich bei CMS promoviert habe
00:20:08: ist also eine sehr große
00:20:10: Forschungskooperation
00:20:12: und auch unser Thema
00:20:14: spezifisch haben wir eher in einem Team
00:20:16: bearbeitet und zwar
00:20:18: hatten wir einen
00:20:20: Postdoc der sozusagen ein bisschen der
00:20:22: die Leitung von dem Team
00:20:24: übernommen hat könnte man so sagen
00:20:26: und wir waren
00:20:28: zwei Doktoranden die konkret
00:20:30: daran gearbeitet haben
00:20:32: weil das Thema an sich
00:20:34: so
00:20:36: komplex war, dass wir gesagt haben
00:20:38: da oder mein Prof
00:20:40: gesagt hat da müssen mehrere Leute sich
00:20:42: daransetzen
00:20:44: und von daher hatten wir schon
00:20:46: zumindest innerhalb dieses kleinen Teams
00:20:48: recht regen austausch, haben uns gegenseitig geholfen
00:20:50: hatten auch schon so ein bisschen
00:20:52: sag ich mal so Sachen wie CodeReview
00:20:54: gemacht, dass wir halt also
00:20:56: wir hatten auf GitHub ein Repository
00:20:58: wo wir dann gemeinsam
00:21:00: mit der Bank gearbeitet haben
00:21:02: und auch FullRequest gemacht haben
00:21:04: die wir kommentiert haben und so
00:21:06: was ich natürlich super fand weil ich dadurch
00:21:08: schon ein vortehrter vielleicht
00:21:10: gegenüber Doktoranden die nur allein an ihrem Code
00:21:12: arbeiten
00:21:14: und
00:21:16: genau von daher ist das
00:21:18: bei mir vielleicht ein bisschen anders
00:21:20: gewesen und auch sonst wenn man irgendwelche
00:21:22: Fragen hatte, konnte man meist
00:21:24: oder kannte man jemanden der
00:21:26: einen sagen konnte wer bei einem bestimmten
00:21:28: weiterhelfen kann
00:21:30: innerhalb der Kollaboration also das war schon
00:21:32: eine coole Sache
00:21:34: vom Teamwork her sag ich jetzt mal
00:21:36: aber es ist natürlich da, würde ich direkt gehen
00:21:38: bei den allermeisten Doktorandinnen und Doktorandinnen
00:21:40: ist das
00:21:42: vermutlich anders
00:21:44: Ja, wir hören sich gut an bei dir
00:21:46: das hört sich kreif an
00:21:48: das heißt du würdest auch so sagen
00:21:50: von der Arbeitskultur
00:21:52: und Arbeitstechnik so was wie
00:21:54: agiles Arbeiten
00:21:56: gibt's die ICD, meist nicht irgendwelche Scraps.
00:22:00: Die Rang-Beschicht hatte dir auch ein Project-Bord.
00:22:02: Hat sich da schon vieles überschnitten,
00:22:04: mit dem wie du es jetzt bei Alio kennen gelernt hast?
00:22:07: Oder wie ist da der Vergleich?
00:22:10: Also es war schon nochmal rudimentärer,
00:22:13: würde ich sagen, als bei Alio.
00:22:15: Also wir haben jetzt keine Sprint-Plannings
00:22:17: oder sowas jetzt in der Forschung gemacht.
00:22:19: Aber es war schon so, dass wir in Prinzip
00:22:22: wie so ein Weekly hatten,
00:22:24: wo wir unsere Updates konkret
00:22:27: sozusagen in unserem Team besprochen haben.
00:22:29: Und auch geplant haben,
00:22:32: woran wir als nächstes arbeiten.
00:22:34: Und ja, eben besprochen haben,
00:22:38: okay, gibt es noch ein Pull-Request,
00:22:40: den man mal besprechen muss oder so.
00:22:42: Also wir haben das so ein bisschen lockerer gehandhabt,
00:22:45: wir haben jetzt kein konkretes Fremdwerk,
00:22:47: agile Fremdwerk oder sowas benutzt.
00:22:49: Aber ich sag mal, es kam dem vielleicht schon ein bisschen näher,
00:22:53: als wenn man jetzt ganz alleine
00:22:55: an seinem Projekt gesessen hätte, möglicherweise.
00:22:58: Ja, ich meine, also Text-Scrum habe ich auch noch mit erlebt.
00:23:03: Also gibt es vielleicht, aber ich glaube,
00:23:06: es ist nicht so häufig.
00:23:08: Ja, spannend.
00:23:10: Und neben der reinen Art des Arbeitens,
00:23:13: wie würdest du denn die Skills so vergleichen?
00:23:15: Du hast ja eben schon gesagt,
00:23:17: du hast dich neben der Uni weitergebildet.
00:23:20: Das liegt jetzt nahe,
00:23:22: du musst dir Dinge noch nebenher dazuschaffen.
00:23:25: Aber einiges bringt man ja auch schon mit als ausgebildeter Physiker,
00:23:30: oder wie würdest du da so die Balance sehen?
00:23:33: Genau.
00:23:35: Also ich würde sagen, es ist teils teils.
00:23:38: Also das Tooling ist auf der einen Seite schon recht data-science,
00:23:45: würde ich sagen.
00:23:47: Also man hat so, also zum Beispiel,
00:23:49: Python ist so bei uns der absolute Standard.
00:23:52: Jetzt habe ich im Prinzip seit mein Bachelor auch schon gemacht,
00:23:56: weil man damit einfach super Datenanalyse machen kann.
00:24:00: Und die Daten, die man auch jetzt,
00:24:02: sag ich mal, in seiner Bachelorarbeit, Masterarbeit,
00:24:05: aber eben auch Promotion so analysiert.
00:24:08: Das läuft alles in Python, Visualisierung,
00:24:12: mit Mudplotlib und ja auch einige Machine Learning-Frameworks,
00:24:19: habe ich natürlich benutzt, wie zum Beispiel Pytorch
00:24:23: oder eben Tensoffloh und so, da kannte ich mich eben auch schon vorher mit aus.
00:24:27: Das lag jetzt bei mir im Spezifischen daran,
00:24:29: dass ich halt auch wirklich konkret KI auch in meiner Doktorarbeit benutzt habe.
00:24:36: Jetzt vielleicht auch andere, wo es noch nicht so ist.
00:24:39: Aber von daher habe ich jetzt so rein von den Frameworks und vom Tooling,
00:24:43: denke ich schon, auch einiges mitgebracht.
00:24:45: Was vielleicht noch fehlt, ist, also wenn man jetzt experimentelle Daten hat,
00:24:56: dann ist es häufig so, dass da die Unis oder die Forschungskollaboration,
00:25:02: an denen man Teil hat, dass sie ihre eigenen Datenpipelines
00:25:07: und Datenstorages usw. zur Verfügung stellen.
00:25:13: Das gilt auch für so Rechencluster, wo man dann Machine Learning-Modell
00:25:18: drauf trainieren kann und so, das ist alles irgendwie,
00:25:22: ja sage ich mal, Custom implementiert,
00:25:26: während das natürlich in der Wirtschaft alles oder das meiste über die Cloud läuft,
00:25:32: Stichwort eben ever oder auch Databricks oder sowas,
00:25:36: das haben wir jetzt zum Beispiel in der Forschung ja nicht so benutzt
00:25:39: und auch SQL habe ich jetzt nicht so in der Forschung direkt benutzt,
00:25:44: sondern da hatten wir dann einfach unsere eigenen spezifischen Systeme
00:25:48: in der Teilchumsik, die wir da verwendet haben
00:25:52: und deswegen habe ich da auch noch so einen zusätzlichen Kurs gemacht,
00:25:55: weil ich eben wusste, dass so SQL auch so ein bisschen bread and butter
00:25:58: einfach für ein Data Scientist ist.
00:26:00: Ja, ja, die Erfahrung habe ich so wenig gemacht.
00:26:03: Ich glaube, gerade auf amerikanische Cloud-Provider,
00:26:08: da hat man eher in der Uni ein Problem mit aus Datenschutzbründen und so Geschichten,
00:26:12: deswegen sind es da, glaube ich, eher die Rechenzentren in solchen Fällen
00:26:17: und genau SQL habe ich auch, ich habe niemanden kennengelernt,
00:26:21: jetzt, dass ich mich erinnern würde, der bei uns auch in der Uni SQL gemacht hat.
00:26:26: Wobei ich jetzt persönlich sagen würde,
00:26:29: für das, was wir benötigen, hinterher als Data Scientist,
00:26:32: wir sind jetzt nicht, also wir beide jedenfalls nicht die Hardcore Data Engineers,
00:26:37: da schafft man sich so auch ganz gut drauf.
00:26:41: Genau, das ist ja so ein grundsätzliches Problem,
00:26:44: wie stark man jetzt das Tooling auch so in einem Profil bewertet.
00:26:48: Es ist vielleicht eine Frage, an der sich die Geister auch so ein bisschen scheiden.
00:26:55: Also ich finde, wenn man ein guter Data Scientist ist,
00:26:59: kann man sich solche Tools auch recht gut selber aneignen.
00:27:03: Die meisten davon sind auch hervorragend dokumentiert,
00:27:07: im Gegensatz zu einiger Software, die so an der Uni entwickelt wird.
00:27:11: Und ich denke, bei Data Science ist es dann eher wichtig,
00:27:17: dass man sich schnell in komplexe Probleme einarbeiten kann,
00:27:21: eine gute Problemlösungskompetenz hat,
00:27:24: als dass man jetzt fünf Jahre Erfahrung mit Databricks hat,
00:27:27: das ist meine persönliche Meinung.
00:27:29: Bei solchen Dingen kann man auch dann eben,
00:27:33: gerade wenn man ein kompetentes Team hat,
00:27:35: recht schnell lernen oder sich selbst draufschaffen.
00:27:39: Ja, das sehe ich ähnlich.
00:27:42: Also ich habe das auch so gesehen,
00:27:46: ist auch eigentlich eine spannende Frage,
00:27:48: würdest du deine Zeit an der Uni mit drauf rechnen,
00:27:52: als Berufserfahrung als Data Scientist,
00:27:55: oder startet die bei dir mit deiner Einstellung bei England?
00:27:59: Also ich würde es schon mit drauf rechnen,
00:28:03: weil ich schon wirklich sehr konkret mit KI,
00:28:07: mit Datenauswertung, also Daten vom RHC,
00:28:11: das sind eben gigantische Mengen an Daten
00:28:16: und komplexen Daten, die man da bearbeitet.
00:28:19: Und das ist im Prinzip wie ein Data Science Projekt.
00:28:22: Ob man jetzt, sozusagen anomaly detection
00:28:26: in einem wirtschaftlichen Bereich,
00:28:29: irgendwie bei Credit Scores oder irgendwelchen Überweisungen macht,
00:28:34: oder ob man jetzt eben das neue Teilchen detektiert,
00:28:37: ist dann vielleicht letztes sogar ein bisschen komplizierter nochmal.
00:28:41: Also ich würde da schon sagen,
00:28:43: dass man das als Berufserfahrung anerkennen sollte,
00:28:48: weil man eben genau das als Data Scientist
00:28:52: eben am Ende auch macht,
00:28:54: vielleicht mit ein bisschen anderen Tooling,
00:28:57: aber vielleicht kommt das dann auch auf die konkrete Promotion,
00:29:02: sage ich jetzt mal an, wie es gelaufen ist,
00:29:04: aber im eibren konkreten Fall würde ich das schon bejahen.
00:29:08: Es ist relativ wenig Reibung hier in unserem Gespräch,
00:29:11: da sind wir überall auf einer Linie.
00:29:14: Das Lustige ist, wir können an der Stelle mal ein Shout-out an Daniel machen,
00:29:20: unseren Sales Chef.
00:29:23: Das war der erste Alien-Mitarbeiter, mit dem ich Kontakt hatte damals
00:29:28: bei meiner Bewerbung, und ich weiß gar nicht, ob ich das mal zählt habe,
00:29:31: ich habe ja bei uns den Wann gebrochen für die Leute mit einer Promotion.
00:29:36: Der ist mir noch sehr kritisch beim ersten Gespräch begegnet,
00:29:40: mit so ein paar Vorurteilen gegenüber den Wissenschaftlern,
00:29:44: der dann auch die Frage ist,
00:29:47: das ist das eigentlich Data Science Berufserfahrung,
00:29:49: oder ist da jemand nur ewig an der Uni geblieben?
00:29:52: Ich glaube, es ist genau das, was du sagst.
00:29:54: Eigentlich arbeitet man de facto als Data Scientist.
00:29:57: Ich würde sagen, man kann jedes Paper wie ein Data Science Projekt betrachten,
00:30:02: und man muss auch ganz viele Dinge machen.
00:30:05: Domänenwissen aufbauen, also gerade in interdisziplinären Projekten,
00:30:09: die wir hier von mir viel kommunizieren,
00:30:11: mit Leuten gemeinsame Lösungen erarbeiten, eine Lösung präsentieren.
00:30:16: Da sauber arbeiten, man hat vielleicht nicht so diese Themen,
00:30:22: rund um die ICD, um das Deployment, wirklich ein Production Model,
00:30:28: das sind so Themen, die da vielleicht nicht so viel vorkommen.
00:30:31: Das hat vielleicht dann doch mehr einen Studiencharakter,
00:30:35: einen Biosy-Charakter, so was, aber kommt auch darauf an,
00:30:38: gibt es auch unterschiedliche Varianten.
00:30:41: Ich glaube, das ganz Entscheidende ist eben,
00:30:43: dass man das so wie wir es jetzt versuchen, kommunizieren kann.
00:30:46: Weil in dem Moment, wo man dann, oder als ich damals,
00:30:49: das dem Daniel so erzählt habe, hat er dann auch schon sich die Notiz gemacht,
00:30:53: könnte doch gehen.
00:30:54: Also einfach, indem man, verdeutlicht, ich bin jetzt nicht jemand,
00:30:59: der hier jetzt erstmal die Tür zu macht und ein halbes Jahr lang
00:31:02: mit Schüft und Papier auf seinem Problem rumkaut,
00:31:04: und es dann hinterher nicht vorstellen kann,
00:31:06: sondern es braucht auf diese kommunikativen Skills,
00:31:10: die Teppelskills vielleicht auch in Projekten,
00:31:14: das ist das, was wir auch brauchen.
00:31:15: Es ist ja auch das, was du sehr gut in deinem ersten Projekt gemacht hast,
00:31:19: in dem du dann einfach dich anpasst an ein Projekt,
00:31:23: eine eigene Lösung findest,
00:31:25: und die Leute aktiv ansprichst und kommunizierst.
00:31:28: Wir haben uns überlegt, das so und so zu machen,
00:31:30: weil das für euch aus dem und dem Grund am besten ist.
00:31:33: Es gibt in der Promotion mehr Kommunikation als man denkt.
00:31:37: Also man muss ja wirklich auch regelmäßig
00:31:39: seine Ergebnisse kommunizieren,
00:31:42: aufwissenschaftlichen Konferenzen, zum Beispiel gegenüber Leuten,
00:31:47: die vielleicht jetzt nicht ganz so konkret in dem Projekt drin stecken,
00:31:51: wie man selbst, oder gegenüber dem Prof,
00:31:54: oder auch, was ja auch ein wesentlicher Teil ist,
00:31:57: gegenüber anderen Studierenden.
00:31:59: Wenn man jetzt zum Beispiel ein Master Studenten betreut,
00:32:01: oder ein Bachelor Studenten betreut,
00:32:03: wenn man zum Beispiel Übungsgruppen betreut,
00:32:07: ich habe zum Beispiel auch Übungsgruppen
00:32:10: zur statistischen Datenanalyse betreut und so.
00:32:13: Und auch da ist es natürlich super wichtig,
00:32:15: solche komplexen Sachen auch unterzubrechen
00:32:17: und auch weiterzugeben.
00:32:18: Und das ist eben auch ein sehr wichtiger kommunikativer Skill,
00:32:21: der, ja, denke ich auch relevant ist für die Projekte bei Alienium.
00:32:26: Genau, also kommunizieren, ja.
00:32:30: Ich glaube, was sich ändert, ist so ein bisschen die Perspektive
00:32:35: und die Starkrichtung, auf die man hinwirkt.
00:32:39: Also am Ende eines Projektes wird niemand von dir
00:32:42: einen 40-seitigen Bericht erwarten,
00:32:45: indem du drei statistische Tests gemacht hast
00:32:48: und alle Metriken deines Modells aufschlüsst,
00:32:52: sondern im Endeffekt, gerade wenn das auf das Ziellevel geht,
00:32:55: geht es am Ende um Executive Summary,
00:32:58: dann ist die Frage, hast du die Projektziele erreicht,
00:33:01: hast du einen Business Value generiert, solche Themen.
00:33:04: Was aber nicht heißt, dass man umgenauert sein sollte.
00:33:07: Also auch das kann man ja statistisch begründen,
00:33:11: kann das vernünftig herleiten, aber man muss es,
00:33:15: ich würde sagen, vielleicht noch ein bisschen prägnanter darstellen
00:33:18: und mit einem weniger wissenschaftlichen als mit einem Monetäern
00:33:22: und zeitlichen.
00:33:24: Genau, das Ende ist das Wissenfabliche,
00:33:27: sozusagen rückt vielleicht in der Präsentation ein bisschen
00:33:30: in den Hintergrund, aber ich würde schon grundsätzlich sagen,
00:33:33: dass es eine Gemeinsamkeit von Wissenschaft und Wirtschaft,
00:33:37: dass man sozusagen einfach schon Strukturen in Daten erkennen möchte,
00:33:43: um in irgendeiner Form daraus Erkenntnisse zu gewinnen,
00:33:47: Prozesse zu verbessern etc.
00:33:49: Und das eben auch, das ist auch meine tiefe Überzeugung natürlich
00:33:52: als Wissenschaftler irgendwo mit wissenschaftlichen Methoden.
00:33:55: Also wir reden immer viel auch im Podcast über dieses Bauchgefühl,
00:34:00: das spielt natürlich auch eine Rolle, Domänen wissen,
00:34:03: Leute, die schon 20, 30, 40 Jahre im Unternehmen arbeiten.
00:34:06: Aber auf der anderen Seite auch zu sagen,
00:34:08: wir gucken uns trotzdem die Daten ganz genau an,
00:34:12: wir gucken uns unsere Modelle ganz genau an
00:34:14: und schauen auch mit statistischen Methoden drauf,
00:34:17: sozusagen ob wir eine signifikante Veränderung zum Beispiel haben.
00:34:21: Und das sehe ich eben als eine Gemeinsamkeit,
00:34:28: damit man quasi nicht einfach nur rät,
00:34:32: sondern wirklich anhand der Daten Schlüsse zieht,
00:34:35: die am Ende das Unternehmen dann auch weiterbringen
00:34:38: und einen kompetentiven Vorteil in sozusagen generieren.
00:34:42: Genau, ich habe da neulich, ich kann Ihnen jetzt leider nicht
00:34:45: korrekt als Quelle angehen, das müssen wir in dem Journalismachen,
00:34:50: aber ich habe ein Towards Data Science Artikel gelesen,
00:34:53: da ging es darum.
00:34:55: Der hat sich ein bisschen damit auch beschäftigt,
00:34:57: signifikant oder nicht signifikant,
00:34:59: und es gab dann so ein sehr plastisches Beispiel,
00:35:02: in dem man einen A/B-Test bei einer Website Optimierung macht
00:35:06: und findet dann raus, die die Änderung ist nicht statistisch signifikant,
00:35:11: mit irgendeinem Signifikanz-Niveau, was man definiert,
00:35:14: 95%.
00:35:19: Und die Argumentation da ist dann,
00:35:22: dass man hier wirklich stoppen sollte als Data Scientist in der Wirtschaft,
00:35:26: denn erstmal muss man sich klar machen,
00:35:28: diese Signifikanz-Niveaus, die sind irgendwo ein bisschen random,
00:35:32: weil wenn ich das dann breiter ziehe,
00:35:35: dann ist es auf einmal signifikant,
00:35:37: ob ich da jetzt 95% nehme oder 90% oder 98%.
00:35:42: Und die Frage, die man sich herstellen muss,
00:35:45: ist, was habe ich für eine erwartete Veränderung meines Umsatzes
00:35:51: und meines Gewinns, wenn ich das mache?
00:35:54: Und man kann die statistische Analyse dann natürlich weiterführen,
00:35:57: und dann kann man eben auch mit dem nicht signifikanten Experiment rausfinden,
00:36:01: dass es sehr viel wahrscheinlicher ist,
00:36:03: dass wir aber hinterher einen guten Business Value erzielen.
00:36:08: Und ich glaube, das ist so ein bisschen die,
00:36:10: das ist das, was ich meine mit der gedanklichen Orientierung,
00:36:15: woraufhin optimiere ich.
00:36:17: Und so vielleicht ein bisschen plaktative Vorwurf an die Wissenschaft ist,
00:36:21: die ist fertig, indem sie sagt, es ist nicht statistisch signifikant,
00:36:25: ich höre hier auf.
00:36:27: Und das versuchen wir nicht.
00:36:29: Wir versuchen aufzuhören, wenn wir sagen,
00:36:31: das kostet uns noch Geld und das bringt uns nichts.
00:36:33: Genau, ja, würde ich so unterschreiben,
00:36:36: ist doch auch ein tolles Thema vielleicht für eine zukünftige Podcast-Folge,
00:36:41: A-W-Test und High-Positive-Tests.
00:36:45: Das ist nochmal ein Thema für sich.
00:36:47: Auf jeden Fall.
00:36:49: Ich würde gerne zum Abschluss unseres Podcasts dich noch bitten,
00:36:53: hast du für Leute, die einen ähnlichen Währlegerang haben,
00:36:56: wie wir, auch so ein paar Tipps und Arztschläge,
00:37:00: wie man das angehen kann?
00:37:03: Ich meine, du kannst natürlich auch sagen, macht das bloß nicht,
00:37:06: wie ich und wie zu ähnlich ist, das ist alles furchtbar hier,
00:37:08: aber dann haben wir noch ein längeres Nachgespräch nach dem Podcast.
00:37:13: Ja, also ich würde sagen,
00:37:18: wenn man aus der Wissenschaft Richtung Data Science gehen möchte,
00:37:23: ist das Wichtigste, dass man schon nochmal auch ein bisschen guckt,
00:37:31: wie kann ich mich so auf diesen Wechsel wirklich vorbereiten,
00:37:35: Stichwort Tooling.
00:37:37: Ich glaube, das ist jetzt nichts, wo ich den Leuten unterstellen würde,
00:37:40: dass sie das nicht sich auch selber aneignen können,
00:37:42: aber es wird einfach im Recruitment-Prozess erwartet,
00:37:47: dass man bestimmte Sachen kann
00:37:50: und dass man vielleicht auch schon mal ein Modell-Deployt hat,
00:37:54: dass man vielleicht schon Grund legen der Erfahrungen,
00:37:56: keine Ahnung, im Bereich Cloud oder so hat.
00:38:00: Und wenn man sich da schon mal ein bisschen mit beschäftigt hat,
00:38:03: ist das auf jeden Fall ein Plus.
00:38:06: Auch dieses ganze Thema, wie läuft überhaupt so ein Interview ab?
00:38:09: Also definitiv auch gerne nochmal die Podcast-Folgen hier hören
00:38:13: und sich da ein bisschen darauf vorbereiten.
00:38:18: Ich habe auch von Leuten gehört, die so etwas wie Leadcode gemacht haben,
00:38:22: also Coding-Interviews usw. gibt es unter Umständen auch.
00:38:26: Das ist, denke ich, sehr wichtig
00:38:29: und auf der anderen Seite halt wirklich nochmal gezielt,
00:38:34: lernen herauszustellen, was der Mehrwert von so einer Promotion ist.
00:38:38: Also in welchen Problemen habe ich konkret gearbeitet,
00:38:41: was habe ich davon gelernt und wie bin ich da wertvoll
00:38:46: aus dieser Erfahrung heraus als Data Scientist für ein Unternehmen.
00:38:50: Also dass man das quasi nochmal richtig verpackt,
00:38:52: weil das ist, glaube ich, in der Wirtschaft nicht klar
00:38:55: und vielen Recruitern nicht klar.
00:38:58: Aber ich muss sagen, was der Vorteil wirklich von das,
00:39:01: was wir gerade besprochen haben.
00:39:03: Ich habe neulich auch mit einem Kumpel gesprochen,
00:39:06: der ein bisschen schockiert war,
00:39:08: dass ein Recruiter seine Hunderten von Stunden
00:39:13: auf einem Rechencluster an der Uni, was tausende von Euro gekostet hat,
00:39:18: so beiseitewüscht und fragt,
00:39:20: hast du denn das Escher-Zertifikat für 300 Dollar?
00:39:24: Aber Endeffekt sind das halt dann auch Leute,
00:39:27: die sich in den vielen Themen arbeiten.
00:39:30: Vielleicht letzte Frage.
00:39:32: Wie stellt man denn für sich selber fest,
00:39:34: so soul-searchingmäßig, ob das der richtige Weg für ein,
00:39:37: ob man kürzlich wird, als Data Scientist in der Wirtschaft
00:39:42: oder ob man es doch versuchen soll, in der Wissenschaft zu bleiben?
00:39:46: Boah, gute Frage.
00:39:49: Also ich glaube, ich will das vielleicht sogar nochmal aufteilen,
00:39:54: wenn man in der Wissenschaft bleiben will oder nicht,
00:39:56: ist der erste, der wichtigste Punkt ist,
00:40:00: dass man sich das auch vorstellen kann
00:40:02: mit den verschiedenen Constraints, die ich von gesagt habe,
00:40:06: mit den entsprechenden Arbeitsbedingungen usw.,
00:40:10: dass man das auch über viele Jahre noch durchziehen kann.
00:40:14: Das ist glaube ich erstmal ein wesentlicher Punkt.
00:40:17: Ansonsten sollte man natürlich einfach Spaß an der Arbeit mit Daten haben,
00:40:27: an Statistik haben, vor allen Dingen finde ich.
00:40:30: Also Statistik ist so das Haupttool,
00:40:32: da auch ein gutes Verständnis schon mitbringen.
00:40:37: Und vielleicht auch so ein bisschen dieses,
00:40:43: wie soll ich das sagen,
00:40:47: was Alex mal so schön beschrieben hat,
00:40:50: als auf ein Problem draufhauen, bis es kaputt geht.
00:40:53: Also man muss halt schon ein bisschen Lust drauf haben,
00:40:56: ein Problem lange und intensiv zu bearbeiten,
00:40:58: weil man halt nicht immer, also nicht immer,
00:41:00: ist der erste Wurf gleich erfolgreich.
00:41:02: Und dann kommen eben diese ganzen Data Science Tools,
00:41:06: Stichwort Feature Engineering, Modellverbesserungen,
00:41:10: Domänenwissen einbauen usw.,
00:41:14: wo man dann Schritt für Schritt versucht,
00:41:16: dann weiter an den Problem zu arbeiten, das zu lösen.
00:41:18: Das kann manchmal auch langwierig sein,
00:41:20: es kann komplex sein.
00:41:22: Und darauf muss man auch einfach Lust haben.
00:41:26: Gehe ich mit, ich habe noch zwei Ergänzungen vielleicht.
00:41:29: Eine Sache, die ich sehr schön finde,
00:41:31: gerade bei uns mit dem Data Science Project Geschäft,
00:41:35: ist auch ein viel unterschiedlicher, wie man sieht.
00:41:37: Also in den drei Jahren habe ich jetzt so viele Branchen kennengelernt
00:41:41: und mit unterschiedlichen Leuten gesprochen
00:41:44: und immer mit Daten gearbeitet,
00:41:46: aber eben Daten zu ganz unterschiedlichen Themen
00:41:49: von Lebensmittelhandeln, Einzelhandel zu Sensordaten,
00:41:52: zu Glasfaserausbau und ja, das ist schon cool.
00:41:57: Das ist eine Sache, die man vielleicht in der Wissenschaft
00:42:00: geht man eher tiefer in das eine Thema.
00:42:02: Und wir sehen sehr viel und lernen viele Menschen kennen,
00:42:05: das fand ich gut.
00:42:07: Und das andere ist, Dinge zu bauen
00:42:11: und dann auch wirklich live zu schalten
00:42:14: und zu sehen, dass die etwas verändern.
00:42:17: Das ist natürlich auch, also wenn es klappt,
00:42:20: das ist ein schönes Gefühl.
00:42:22: Definitiv.
00:42:24: Und das Erste, was du gesagt hast, ist natürlich auch nochmal speziell,
00:42:27: besonders interessant, bei ALIO, finde ich,
00:42:31: weil man kann natürlich auch Data Scientist
00:42:34: in einem Industrieunternehmen zum Beispiel werden,
00:42:37: wo man dann vielleicht tendenziell eher
00:42:40: die ähnliche Themen bearbeitet.
00:42:42: Aber das ist eben, wenn man über uns jetzt
00:42:46: einen Dienstag geht, ist das eben genau besonders das Coole,
00:42:50: dass man eben verschiedene Projekte in verschiedenen Branchen
00:42:52: und verschiedene Probleme hat.
00:42:54: Und das war auch für mich ganz klar ein Grund,
00:42:56: weswegen ich zu ALIO gehen wollte.
00:42:58: Ja, cool, Tobi. Vielen Dank.
00:43:01: Ich habe keine Fragen mehr, bin wunschlos glücklich.
00:43:04: Bist du noch jemanden grüßen am Ende der Folge?
00:43:07: Nein, ich glaube, ich bin gut, ohne Grüße,
00:43:12: aber ich danke dir erstmal für deine Geduld
00:43:19: und für die Fragen und für die Coole Podcast-Exercise.
00:43:25: Ja, ebenfalls. Ich grüße noch den Janis am Ende,
00:43:29: an alle, die den Janis jetzt schon vermissen
00:43:32: und sich auf die nächste Folge mit ihm freuen.
00:43:34: Ich habe einen Vögelchen Zwitschern hören, da ist was in der Mache.
00:43:37: Also auch von Janis ist es hier bald wieder was zu hören.
00:43:41: In der Urgner Podcast-Volgabe haben wir mal gesagt,
00:43:43: alle zwei Wochen oder so, weil wir einen rausrauen.
00:43:45: Ja, das ist challenging.
00:43:48: Genau, dann wünschen wir allen noch frohe Weihnachten,
00:43:51: einen guten Rutsch und ein paar Jahre.
00:43:53: Guten Rutsch und auf ein erfolgreiches 2025.
00:43:56: Genau, mach's gut, Tobi.
00:43:58: Ja, ciao.
00:43:59: Danke für die Leute!
Neuer Kommentar