Data Science in Wissenschaft und Industrie - Unterschiede und Gemeinsamkeiten

Shownotes

Takeaways

-Der Wechsel von der Wissenschaft zur Industrie kann herausfordernd sein. -Die Promotion erfordert Durchhaltevermögen und hohe Belastbarkeit. -Data Science erfordert sowohl technische Fähigkeiten als auch -Kommunikationskompetenz. -Teamarbeit ist in der Industrie oft strukturierter als in der Wissenschaft. -Die Nutzung von KI in der Forschung eröffnet neue Möglichkeiten. -Praktische Erfahrungen sind entscheidend für den Erfolg in der Industrie. -Die Fähigkeit, komplexe Probleme zu lösen, ist in beiden Bereichen wichtig. -Ein gutes Verständnis von Statistik ist für Data Scientists unerlässlich. -Die Arbeitskultur in der Industrie ist oft dynamischer und schneller. -Die Vielfalt der Projekte in der Industrie kann sehr bereichernd sein.

Transkript anzeigen

00:00:00: Hallo Tobi!

00:00:02: Ja moin, moin David!

00:00:04: Moin, schön dich zu sehen.

00:00:06: Ein ganz besonderer Podcast,

00:00:08: ohne Janis.

00:00:10: Ohne Janis.

00:00:12: Und ich hab die Ehre,

00:00:14: heute dich hier zu interviewen.

00:00:16: Wie fühlst du dich?

00:00:18: Wie fühlst dich das an?

00:00:20: Ja, ist mega spannend.

00:00:22: Auch ziemlich witzig,

00:00:24: dass ich jetzt hier bei dem Podcast bin,

00:00:26: über den ich überhaupt zu Alio gekommen bin damals.

00:00:28: Und der ist tatsächlich,

00:00:30: dieses Jahr bei meinem Spotify Wrapped,

00:00:32: auch Platz 3 der Podcast,

00:00:34: geschafft hat.

00:00:36: Ja, also ich glaub,

00:00:38: mehr Commitment geht nicht.

00:00:40: Obwohl zwei Plätze nach oben sind noch frei,

00:00:42: aber genau,

00:00:44: nee, ich bin super spannend

00:00:46: und freue mich heute dabei zu sein.

00:00:48: Sehr gut, das heißt,

00:00:50: unser Ziel für nächstes Jahr,

00:00:52: Alientern steht,

00:00:54: einen Platz in deiner Wrappedlist nach oben.

00:00:56: Genau, mindestens.

00:00:58: Aber das heißt auch,

00:01:00: dass du nicht so viele Podcasts

00:01:02: eigentlich hören kannst,

00:01:04: weil wir gar nicht so viele folgen,

00:01:06: wenn das für Platz 2 reicht.

00:01:08: Das stimmt, das stimmt.

00:01:10: Also meine Podcastliste

00:01:12: beschränkt sich auf

00:01:14: sehr wenige Ausgewählte,

00:01:16: die ich dafür dann aber regelmäßiger höre.

00:01:18: Man muss ja auch immer dazu kommen,

00:01:20: das ist ja immer auf die Zeit.

00:01:22: Lieber nicht öffentlich wie viele Podcast-Minute

00:01:24: ich letztes Jahr hatte.

00:01:26: Aber ich bin großer Geschichten

00:01:28: als der Geschichte-Fan.

00:01:30: Hab ich auch schon von gehört.

00:01:32: Als wir zusammengekommen.

00:01:34: Mit dir mach ich wahrscheinlich heute keinen Schand vorgeblänken.

00:01:36: Das verschieben wir dann auch.

00:01:38: Ja, ich glaub, das ist auch besser so.

00:01:40: Was hat sich uns vorgenommen?

00:01:42: Wir haben ja beide in den gleichen Untergrund.

00:01:44: Beide mit einem Physik-Doctor

00:01:48: zu Elio bekommen

00:01:50: und haben uns gedacht,

00:01:52: es ist auch eine schöne Folge

00:01:54: für das Jahresende.

00:01:56: Das muss man zu vergleichen.

00:01:58: Wie war eigentlich das Leben

00:02:00: an der Uni? Wie ist das Leben bei Elio?

00:02:02: Wie fühlt sich das an?

00:02:04: Das soll ein bisschen unser Thema sein.

00:02:06: Vielleicht auch Empfehlungen

00:02:08: für andere Leute mit einem

00:02:10: ähnlichen Werdegang

00:02:12: oder für Unternehmen wie Elio macht das Sinn.

00:02:14: So Leute wie uns einzustellen.

00:02:16: Ja.

00:02:18: Genau, damit wir dich mal kennen,

00:02:20: ich war ja jetzt schon öfter im Podcast.

00:02:22: Was ist denn dein Hintergrund eigentlich?

00:02:24: Genau, also du hast das schon richtig gesagt.

00:02:28: Wir kommen beide aus der Physik.

00:02:30: Bei mir ist es

00:02:32: die experimentelle Teilchenphysik.

00:02:34: Das heißt, ich habe

00:02:38: promoviert an der Universität Hamburg

00:02:40: im Institut für Experimentalphysik

00:02:42: in einer Arbeitsgruppe,

00:02:44: die Teil des CMS-Experiments am Zern ist.

00:02:46: Das ist also eines der großen Experimente

00:02:48: am weltbössten Teilchenbeschleuniger

00:02:50: LHC.

00:02:52: Und genau, mein Thema

00:02:54: war da eben, wie wir die

00:02:56: Anomalieerkennung

00:02:58: verbessern können

00:03:00: beim CMS-Experiment

00:03:02: mit KI-Methoden.

00:03:04: Ich habe mich da also

00:03:06: sehr intensiv auch schon seit dem Master

00:03:08: mit diesem Thema beschäftigt.

00:03:10: Und habe das Ganze dann

00:03:12: in derselben Arbeitsgruppe dann auch in der Promotion

00:03:14: fortgeführt

00:03:16: und

00:03:18: mein

00:03:20: konkretes Thema ging

00:03:22: um Anomalie-Detection.

00:03:24: Das heißt, wie können wir

00:03:26: ohne spezifische Annahmen

00:03:28: über unser Signalmodell tatsächlich

00:03:30: mit

00:03:32: einem nicht überwachten

00:03:34: Maschinenlearningschema

00:03:36: die Anomalie

00:03:38: in Teilchenphysikalischen Daten besser erkennen?

00:03:40: Das hört sich ja sehr, sehr fancy an.

00:03:44: Sehr cool an.

00:03:46: Was bedeutet das

00:03:48: eine Anomalie?

00:03:50: Eine Anomalie, wenn du die detektierst, hast du dann

00:03:52: ein Teilchen gefunden?

00:03:54: Genau, das wäre natürlich der Idealfall.

00:03:56: Also

00:03:58: irgendwie etwas, also was man letztendlich macht

00:04:00: ist es bei uns jetzt konkret

00:04:02: so eine Mischung gewesen

00:04:04: aus generativen

00:04:06: Modellen, Maschinenlearningmodellen

00:04:08: und

00:04:10: Klassifikationsmodellen. Das heißt

00:04:12: man will ja immer was Neues

00:04:14: entdecken. In der Teilchenphysik

00:04:16: hat man vielleicht auch, schon mal gehört

00:04:18: wenn man jetzt nicht Teilchenphysiker ist, dass

00:04:20: aktuell das Standardmodell der Teilchenphysik

00:04:22: ist, die das berühmte.

00:04:24: Und was man eben machen kann, ist man kann

00:04:26: solche generativen Modelle trainieren.

00:04:28: Das ist letztendlich das auch was

00:04:30: hinter so Sachen

00:04:32: wie Stable Diffusion

00:04:34: oder so was steckt, so bei Bildgenerierung

00:04:36: usw.

00:04:38: Man kann solche Modelle trainieren auf den

00:04:40: Klassik-Feyer-Daten und lernt

00:04:42: quasi so ein Hintergrundmodell.

00:04:44: Und dann kann man am Ende

00:04:46: so ein Klassik-Feyer trainieren

00:04:48: der dann sozusagen

00:04:50: alles erkennt, was sich unterschiedlich

00:04:52: verhält. Und das ist ja dann wiederum ein

00:04:54: neues Signal. Also wir wollen quasi gucken

00:04:56: wie können

00:04:58: wir Teilchen oder wie können wir

00:05:00: Ereignisse, Kollisionsereignisse

00:05:02: in unserem Detektor

00:05:04: detectieren, die sich unterschiedlich

00:05:06: von unserem Hintergrund behalten, den

00:05:08: generativen Modell gelernt haben.

00:05:10: Und im Idealfall kommt dann dabei raus, dass

00:05:12: wir ein neues Teilchen entdeckt haben. Aber da

00:05:14: müssen dann natürlich schon sehr strenge

00:05:16: Kriterien erfüllt sein,

00:05:18: damit wir ja wirklich mit Sicherheit sagen können,

00:05:20: es handelt sich jetzt ja wirklich um neue Physiken.

00:05:22: Ich gehe mal davon aus, du hast

00:05:24: kein neues Teilchen entdeckt,

00:05:26: sonst hätte ich schon ein neues Teilchen entdeckt.

00:05:28: Sonst geht es vielleicht schon

00:05:30: als Quad-Parsilvison,

00:05:32: obwohl es wahrscheinlich nicht nach mir

00:05:34: benannt worden wäre, selbst wenn, aber

00:05:36: leider haben wir in unseren Daten

00:05:38: mit der Methode

00:05:40: kein neues Teilchen entdeckt, aber

00:05:42: wir konnten sozusagen unsere

00:05:44: Sensitivität, es wird uns auch

00:05:46: Simulationen verglichen

00:05:48: mit verschiedenen Modellen, konnten wir unsere Sensitivität

00:05:50: im Vergleich zu herkömmlichen

00:05:52: nicht KI basierten Methoden deutlich verbessern.

00:05:54: Wir müssen an der Stelle

00:05:56: aufpassen, dass wir nicht zu sehr abdriften.

00:05:58: Wir hatten ja in meiner letzten

00:06:00: Podcastfolge Alex mit seiner Freundin

00:06:02: getrot, die dann immer ausschaltet.

00:06:04: Wenn es zufällig wird.

00:06:06: Ich finde das natürlich schon

00:06:08: sehr spannend und

00:06:10: vielleicht noch die eine Frage dazu.

00:06:12: Hab ich das richtig verstanden?

00:06:14: Das ist ja eigentlich

00:06:16: neuer Ansatz

00:06:18: mit der KI und mit generativer KI also

00:06:20: vorher, habe ich ja mehr oder weniger

00:06:22: eine Theorie gehabt

00:06:24: und habe gewusst, was ich suche,

00:06:26: weil ich quasi gesagt habe, die Theorie sagt mir voraus,

00:06:28: ich muss irgendwo ein bestimmtes

00:06:30: Signal detektieren können

00:06:32: und dann versuche ich eben genau genug zu messen

00:06:34: um das zu finden. Und ihr sagt jetzt,

00:06:36: wir machen das anders.

00:06:38: Wir benutzen quasi GenAI

00:06:40: und wir lassen

00:06:42: wir versuchen damit einfach

00:06:44: etwas, wie lieb ich, neues zu finden,

00:06:46: ob das jetzt von der Theorie vorhergesagt wurde

00:06:48: oder nicht.

00:06:50: Genau, das hast du ganz richtig verstanden.

00:06:52: Also

00:06:54: das ist sozusagen ein ganz anderer

00:06:56: Ansatz, als wenn man

00:06:58: sein Signal oder sag ich mal die Theorie

00:07:00: seines Signals schon kennt.

00:07:02: Das ist das Typische. Der Theoretiker

00:07:04: geht zum Experimental Physiker und sagt, guck mal

00:07:06: in den Odeon Variablen

00:07:08: da könnte sich ein Teilchen irgendwie

00:07:10: verstecken, nach meiner Theorie

00:07:12: und wir

00:07:14: gehen sozusagen von der

00:07:16: anderen Seite ran und sagen,

00:07:18: wir wollen nicht davon abhängig

00:07:20: sein, dass sich sozusagen in Theoretika

00:07:22: schon mal das richtige Modell überlegt hat.

00:07:24: Sondern wir wollen also sagen, ohne

00:07:26: oder möglichst ohne Modellannahmen

00:07:28: sozusagen reingehen

00:07:30: und

00:07:32: suchen nach irgendetwas, was anders auslädt

00:07:34: als der Hintergrund. Und dazu nutzen wir

00:07:36: auch GenAI. Solche Modell, sogenannten

00:07:38: Modellunabhängigen suchen, gab es auch schon vorher

00:07:40: in der Teilchenphysik, aber da wurden die

00:07:42: mit Simulationen gemacht

00:07:44: und die Simulationen in der Teilchenphysik,

00:07:46: gerade beim Standardmodell

00:07:48: in bestimmten Bereichen sind nicht ganz so exakt

00:07:50: und deswegen haben wir hier das quasi

00:07:54: direkt auch auf Daten trainieren können.

00:07:56: Das heißt, wir haben das quasi so

00:07:58: ein data driven approach gemacht,

00:08:00: was auch nochmal eine Verbesserung

00:08:02: in der Methodik darstellt.

00:08:04: Es ist natürlich schon

00:08:06: sehr spannend,

00:08:08: sehr cool

00:08:10: auch, dass man sieht, ich meine

00:08:12: hat es ja auch an

00:08:14: Physiknobelpreis gesehen, wie

00:08:16: eng dann auch Physik und

00:08:18: Grundlagenforschung mit

00:08:20: KI verbandelt ist,

00:08:22: wie man dann vielleicht manchmal doch

00:08:24: eher in der Wirtschaft kennt

00:08:26: oder auch...

00:08:28: Genau.

00:08:30: So und jetzt

00:08:32: saßt du hier cutting edge

00:08:34: Teilchenphysik,

00:08:36: coole Physikexperimente

00:08:38: und dann hast du dir gedacht

00:08:40: "Aliot, das ist es.

00:08:42: Mein Ding mit Podcast, da muss ich

00:08:44: wie kamst du hin zu dem

00:08:46: Wechseln?"

00:08:48: Also das war eigentlich auch so ein bisschen

00:08:50: Zufall.

00:08:52: So eine Mischung aus Podcast

00:08:54: und Social Media.

00:08:56: Also es gibt

00:08:58: in Hamburg so ein KI

00:09:00: in Kubathor, sag ich jetzt mal.

00:09:02: Arik heißen die,

00:09:04: wo wir auch Mitglied sind

00:09:06: mit Aliot und die haben

00:09:08: eine Podcast-Folge

00:09:10: auf LinkedIn geteilt

00:09:12: und das war

00:09:14: ziemlich genau vor einem Jahr

00:09:16: so

00:09:18: für zwischen den Jahren, sagt mir,

00:09:20: wir hören hier

00:09:22: unseren Mitgliedern von Aliot,

00:09:24: die haben ein Podcast gemacht,

00:09:26: eine neue Podcast-Folge, könnt ihr mal reinhören

00:09:28: und

00:09:30: das fand ich so spannend,

00:09:32: dass ich

00:09:34: im Prinzip alle Verquiktbeantfolgen

00:09:36: auch gleich gehört habe

00:09:38: und

00:09:40: vielleicht deswegen auch Platz 3

00:09:42: und

00:09:44: genau, hab mich dann einfach

00:09:46: spontan beim Janis gemeldet

00:09:48: und dann bin ich mit der

00:09:50: Mitte fristig fertig mit meinem Doktor.

00:09:52: Wie sieht es aus, könnt ihr noch Leute gebrauchen

00:09:54: und ja, dann nahmen die Dinge

00:09:56: ihren Lauf

00:09:58: und genau, so bin ich

00:10:00: dann endlich zu Aliot gekommen, hab dann

00:10:02: das übliche Verfahren durchlaufen

00:10:04: mit

00:10:06: Bewerbungen, Tech-Interview

00:10:08: und so weiter, was ja auch schon in diesem Podcast

00:10:10: besprochen wurde,

00:10:12: wie das für uns läuft

00:10:14: und

00:10:16: du kannst bestätigen,

00:10:18: wir haben nicht gelogen,

00:10:20: wir machen das wirklich so.

00:10:22: Genau, es läuft genauso.

00:10:24: Ja,

00:10:26: sehr gut, das gibt uns

00:10:28: jetzt glaubwürdig.

00:10:30: Weiß nicht, ob die eine oder andere

00:10:32: Aufgabe vielleicht schon mal verändert wurde, aber

00:10:34: wer weiß.

00:10:36: Ich plane auch mal ein Update für nächstes Jahr.

00:10:38: So, muss man ja auch sagen,

00:10:40: Tech-GVT

00:10:42: macht auch die Aufgaben

00:10:44: schwieriger.

00:10:46: Man sollte die nicht

00:10:48: einfach Pasten und von Tech-GVT

00:10:50: lösen lassen können, das ging früher mal.

00:10:52: Ja,

00:10:54: ich weiß halt noch, bei mir

00:10:56: für mich war

00:10:58: dann relativ schnell im Verlauf

00:11:00: der Promotion klar,

00:11:02: das würde mal in Richtung Wirtschaft gehen,

00:11:04: weil man in der Wissenschaft

00:11:06: dann irgendwo

00:11:08: weil so, soll man das eine Kleser in der Decke nennen,

00:11:10: aber so eine gewisse

00:11:12: Perspektivlosigkeit/

00:11:14: sehr hohe Risikogereitschaft

00:11:16: haben muss, wenn man nach dem Doktor

00:11:18: noch da bleiben will. Das war bei dir so ähnlich, oder?

00:11:20: Ja, das ist sehr schön formuliert, genau.

00:11:22: Ja, man muss halt schon,

00:11:24: wenn man jetzt wirklich langfristig

00:11:26: in der Wissenschaft bleiben will

00:11:28: auch nach seinem Doktor, muss man

00:11:30: schon einen sehr langen Atem

00:11:32: und, weil ich mal eine sehr hohe

00:11:34: Leidensfähigkeit auch ein Stück weit mitbringe,

00:11:36: weil

00:11:38: natürlich die Rahmenbedingungen

00:11:40: nicht optimasen, es gibt

00:11:42: wenige festzustellen,

00:11:44: auf die sich sehr viele

00:11:46: auch sehr schlaue Leute

00:11:48: bewerben.

00:11:50: Und ja, es wird dann eben auch

00:11:52: verlangt, dass man zum Beispiel auch

00:11:54: internationalen Erfahrungen sammelt,

00:11:56: dann muss man typischerweise dann auch mehrere

00:11:58: sogenannte Postdocs machen, schließt sich dann

00:12:00: eben an die Promotion an, wenn man in der Wissenschaft bleibt.

00:12:02: Und

00:12:04: genau, ich wollte eben auch

00:12:06: so ein bisschen lokaler hier

00:12:08: in der Großraum Hamburg

00:12:10: bleiben und das war für mich

00:12:12: eben klar und deswegen

00:12:14: war für mich dann der Schritt

00:12:16: ja, sag ich mal

00:12:18: logisch irgendwo an dem Punkt.

00:12:20: Und ich hatte mich auch schon vorher aber

00:12:22: immer viel mit Data Science

00:12:24: beschäftigt und hatte auch Lust

00:12:26: tatsächlich

00:12:28: das ganze Mal in einem praktischen

00:12:30: Umfeld anzuwenden

00:12:32: und das ganze live zu sehen

00:12:34: und auch mal ein Modell live

00:12:36: zu deployen und zu gucken, was das so macht.

00:12:38: Und hatte

00:12:40: mich auch schon vorher viel mit

00:12:42: Data Science im Allgemeinen auch neben der Promotion

00:12:44: beschäftigt.

00:12:46: Gab von der Uni so

00:12:48: Data Science

00:12:50: Schools

00:12:52: und die habe ich auch alle

00:12:54: im Prinzip mitgenommen, wo man auch nochmal so allgemeiner

00:12:56: über Data Science was gelernt hat.

00:12:58: Und

00:13:00: ja, habt auch so

00:13:02: online Kurse belegt

00:13:04: im Bereich auch Sequel

00:13:06: und so Sachen, die man so in der Uni vielleicht nicht so lernt

00:13:08: und hatte mich da schon

00:13:10: so ein bisschen auf einen

00:13:12: beruflichen Wechsel vorbereitet.

00:13:14: Ja, ich glaube, da kommen wir gleich nochmal zu

00:13:16: was eigentlich so

00:13:18: technische Skills

00:13:20: und Unterschiede sind, aber

00:13:22: vielleicht nochmal

00:13:24: chronologisch gegangen.

00:13:26: Kannst du ein bisschen

00:13:28: beschreiben, wie das

00:13:30: für dich war. Also ich weiß bei mir noch

00:13:32: die Promotion ist ja auch schon

00:13:34: etwas, wo man leid geprüft ist.

00:13:36: Und ich habe noch keinen getroffen,

00:13:38: der ein Doktor gemacht hat, der da nicht

00:13:40: zwischendurch mal an einer gewissen emotionalen

00:13:42: Grenze angekommen ist.

00:13:44: Und auch dieses

00:13:46: drei Jahre, manche

00:13:48: fünf Jahre, manche sechs Jahre lang auf einen

00:13:50: Ziel hinarbeiten.

00:13:52: Dann bewirbt man sich

00:13:54: wo ich die präfe, dann

00:13:56: bewirbt man sich

00:13:58: geht

00:14:00: man sich in die Wissenschaft und auf einmal

00:14:02: ist man nicht mehr in drei Jahreszyklen,

00:14:04: sondern in

00:14:06: drei Monatszyklen, bis hin

00:14:08: zu drei Wochenzyklen

00:14:10: und in unserem Fall

00:14:12: Projektgeschäft.

00:14:14: Ist ja schon ein gewisser Sprung ins kalte Wasser.

00:14:16: Wie hast du den erlebt?

00:14:18: Ja.

00:14:20: Also ich habe den schon

00:14:22: sag ich mal stark

00:14:24: erlebt,

00:14:26: weil ich

00:14:28: auch auf einem Projekt saß,

00:14:30: als ich angefangen

00:14:32: habe.

00:14:34: Allerdings habe ich das eher so,

00:14:36: ich war ja schon von vornherein

00:14:38: darauf eingestellt,

00:14:40: gewesen, dass es im Projektgeschäft

00:14:42: immer so läuft.

00:14:44: Auch so hat sich ja eben auch schon in den

00:14:46: vorherigen Gesprächen so

00:14:48: rausgestellt.

00:14:50: Und ja,

00:14:52: von daher hatte ich in dem Moment,

00:14:54: auch gerade wenn man so neu anfängt,

00:14:56: vielleicht noch mal mehr elan,

00:14:58: hatte ich da

00:15:00: auch wirklich

00:15:02: eine große Lust drauf,

00:15:04: mich da auch stark einzubringen.

00:15:06: Aber natürlich klar, die Mühlen

00:15:08: in der Universität

00:15:10: malen meistens ein bisschen langsamer.

00:15:12: Nichtsdestotrotz gibt es da natürlich auch

00:15:14: wieder richtiges. Das ist ja entsprechend

00:15:16: der Stressrohr.

00:15:18: Findest

00:15:20: in Projektgeschäft

00:15:22: bei Alio vielleicht nochmal

00:15:24: ein ticken Planbarer.

00:15:26: Also natürlich hat man

00:15:28: auch sehr enge Zyklen,

00:15:30: aber das weiß man

00:15:32: halt.

00:15:34: Man weiß halt, okay, wir haben dann

00:15:36: und dann immer unser Weekly,

00:15:38: oder bis dann muss irgendwie was fertig

00:15:40: werden, wenn man mal ein Projektplan hat, irgendwie.

00:15:42: Und

00:15:44: was für mich so ein bisschen

00:15:46: der Hauptstressor bei der Uni war,

00:15:48: ich weiß nicht, was dir da ging, war, dass halt viele

00:15:50: Sachen so ad hoc

00:15:52: oder zwischendurch gekommen sind.

00:15:54: Also jetzt muss ich nochmal schnell

00:15:56: eine Präsentation machen,

00:15:58: eine wissenschaftliche,

00:16:00: oder jetzt wollen wir dazu aber auch nochmal

00:16:02: was publizieren oder so, und dann muss man sich

00:16:04: dann doch eben wieder nochmal ran setzen,

00:16:06: man ist zwar sehr eigenständig,

00:16:08: aber es kommen eben auch viele Sachen so ad hoc rein.

00:16:10: Und das fand ich wiederum

00:16:12: da eingehend ein bisschen stressiger.

00:16:14: Und im Projektgeschäft kann man sich dann

00:16:16: ein bisschen mehr darauf einstellen,

00:16:18: weil man das ja auch entsprechend plant.

00:16:20: Also ich weiß noch,

00:16:22: ich denke, das wird sehr unterschiedlich sein,

00:16:24: aber ich weiß noch,

00:16:26: was ich mal ein Doktor angefangen habe.

00:16:28: Ich hatte dann das Thema

00:16:30: auch aus der Masterarbeit mehr oder weniger mitgenommen

00:16:32: und dann eben größer aufgezogen.

00:16:34: Aber ich glaube,

00:16:36: da hat man schon die ersten Wochen

00:16:38: damit verbracht, Literatur zu lesen,

00:16:40: Ideen zu sammeln,

00:16:42: vielleicht mal Reinigkeiten auszubewühren,

00:16:44: aber ich würde sagen

00:16:46: mit einem sehr breiten

00:16:48: Start und nicht mit der

00:16:50: höchsten

00:16:52: Geschwindigkeit, was jetzt das Erzielen

00:16:54: von irgendwelchen Delirables

00:16:56: und Outputs angeht.

00:16:58: Und das ist dann natürlich

00:17:00: im Projektgeschäft anders.

00:17:02: Also ich war ja eng dabei bei dir.

00:17:04: Das war ja auch

00:17:06: ein neues Thema, was du gemacht hast.

00:17:08: Du hast dich dann mit

00:17:10: Produktionsoptimierung beschäftigt.

00:17:12: Du hast da auch ein bisschen dich eingelesen,

00:17:14: aber du hast

00:17:16: mehr nach

00:17:18: einer Woche

00:17:20: ein erstes sichtbares Ergebnis.

00:17:22: Also das Ganze

00:17:24: versuchen so zu streamline

00:17:26: und dann vielleicht an der einwandenden Stelle

00:17:28: nicht so weit in die akademische Tiefe zu gehen,

00:17:30: aber so schnell das man was sieht,

00:17:32: das ist ein Unterschied.

00:17:34: Genau, das vielleicht wenn wir nachher nochmal ein bisschen genauer

00:17:36: auf die Unterschiede und Gemeinsamkeiten

00:17:38: eingehen,

00:17:40: wäre das auch ein Punkt,

00:17:42: den ich definitiv nochmal

00:17:44: ausstellen würde.

00:17:46: Klar,

00:17:48: man hat eben diese Regelmäßigkeit an Deliverables,

00:17:50: die man eben auch haben muss.

00:17:52: Bei uns war es zum Beispiel eine Arbeitsgruppe zwar auch so,

00:17:54: dass wir also an der Uni

00:17:56: jede Woche eine Präsentation

00:17:58: hatten, um über unseren aktuellen Stand

00:18:00: manchmal zu berichten, aber es ist natürlich

00:18:02: nicht, sozusagen

00:18:04: man muss jetzt irgendwie

00:18:06: das neue beste Modell jede Woche irgendwie

00:18:08: haben oder sowas,

00:18:10: sondern das ist eher ein kontinuierlicher Prozess.

00:18:12: Aber es kann natürlich am Ende dann eben auch

00:18:14: sozusagen

00:18:16: recht high stakes sein,

00:18:18: und man hat schon viele Monate an etwas gearbeitet

00:18:20: hat in der Wissenschaft

00:18:22: und sich dann zum Beispiel irgendwie rausstellt,

00:18:24: dass man das hier eben

00:18:26: es doch nicht so probizieren kann,

00:18:28: weil zum Beispiel irgendwo ein Bug war,

00:18:30: ein Code oder

00:18:32: weiß ich Dinge dann doch nochmal

00:18:34: anders rauskristallisiert haben, als man ursprünglich dachte.

00:18:36: Und das ist dann eben auch nochmal

00:18:38: zu jetzt sicher

00:18:40: Stress und es kann eben dann auch noch mal problematisch sein.

00:18:42: Ich weiß nicht wie

00:18:46: deine Wahrnehmung gewesen

00:18:48: gerade auch an der Uni

00:18:50: ich hatte bei mir schon

00:18:52: auch weite

00:18:54: Teile der Promotion das Gefühl

00:18:56: im Endeffekt war das mein Projekt.

00:18:58: Ich meine man hat dann

00:19:00: ein paar Kollaborationspartner, aber jeder

00:19:02: hat auch so ein bisschen seinen eigenen Rhythmus

00:19:04: und wer es oft von dem

00:19:06: jeweiligen Promotionsplan abhängig den man

00:19:08: eben hat. Und dann kann es ja auch schon mal passieren,

00:19:10: dass du sehr lange auf andere

00:19:12: warte bist und da kommt halt nichts

00:19:14: oder

00:19:16: du hast selber einen Bug

00:19:18: und es gibt aber niemanden

00:19:20: dem mit dir an deinem Code

00:19:22: arbeitet, der dir hilft.

00:19:24: Ich hatte das Gefühl, dass man da schon auch

00:19:26: recht stark einzelkämpfer war

00:19:28: und auch in der Verarbeitung

00:19:30: alleine war auch wohingegen,

00:19:32: wird es ja bei Eddie ein bisschen versuchen

00:19:34: im Team gemeinsam

00:19:36: aufzufangen mit einem

00:19:38: Ansprechpartner

00:19:40: und mit einem Project Buddy, der einem hilft

00:19:42: und auch ich finde die Kunden

00:19:44: ein höheres Interesse an der Mitwirkung haben

00:19:46: einfach weil sie Geld dafür bezahlen

00:19:48: und

00:19:50: schnell dann auch Ergebnisse sehen wollen

00:19:52: würdest du das teilen oder

00:19:54: war das bei dir anders?

00:19:56: Ich habe vielleicht

00:19:58: eine etwas ungewöhnliche Promotion

00:20:00: vielleicht als die meisten

00:20:02: Doktoranden gehabt

00:20:04: ich habe ja schon gesagt

00:20:06: dass ich bei CMS promoviert habe

00:20:08: ist also eine sehr große

00:20:10: Forschungskooperation

00:20:12: und auch unser Thema

00:20:14: spezifisch haben wir eher in einem Team

00:20:16: bearbeitet und zwar

00:20:18: hatten wir einen

00:20:20: Postdoc der sozusagen ein bisschen der

00:20:22: die Leitung von dem Team

00:20:24: übernommen hat könnte man so sagen

00:20:26: und wir waren

00:20:28: zwei Doktoranden die konkret

00:20:30: daran gearbeitet haben

00:20:32: weil das Thema an sich

00:20:34: so

00:20:36: komplex war, dass wir gesagt haben

00:20:38: da oder mein Prof

00:20:40: gesagt hat da müssen mehrere Leute sich

00:20:42: daransetzen

00:20:44: und von daher hatten wir schon

00:20:46: zumindest innerhalb dieses kleinen Teams

00:20:48: recht regen austausch, haben uns gegenseitig geholfen

00:20:50: hatten auch schon so ein bisschen

00:20:52: sag ich mal so Sachen wie CodeReview

00:20:54: gemacht, dass wir halt also

00:20:56: wir hatten auf GitHub ein Repository

00:20:58: wo wir dann gemeinsam

00:21:00: mit der Bank gearbeitet haben

00:21:02: und auch FullRequest gemacht haben

00:21:04: die wir kommentiert haben und so

00:21:06: was ich natürlich super fand weil ich dadurch

00:21:08: schon ein vortehrter vielleicht

00:21:10: gegenüber Doktoranden die nur allein an ihrem Code

00:21:12: arbeiten

00:21:14: und

00:21:16: genau von daher ist das

00:21:18: bei mir vielleicht ein bisschen anders

00:21:20: gewesen und auch sonst wenn man irgendwelche

00:21:22: Fragen hatte, konnte man meist

00:21:24: oder kannte man jemanden der

00:21:26: einen sagen konnte wer bei einem bestimmten

00:21:28: weiterhelfen kann

00:21:30: innerhalb der Kollaboration also das war schon

00:21:32: eine coole Sache

00:21:34: vom Teamwork her sag ich jetzt mal

00:21:36: aber es ist natürlich da, würde ich direkt gehen

00:21:38: bei den allermeisten Doktorandinnen und Doktorandinnen

00:21:40: ist das

00:21:42: vermutlich anders

00:21:44: Ja, wir hören sich gut an bei dir

00:21:46: das hört sich kreif an

00:21:48: das heißt du würdest auch so sagen

00:21:50: von der Arbeitskultur

00:21:52: und Arbeitstechnik so was wie

00:21:54: agiles Arbeiten

00:21:56: gibt's die ICD, meist nicht irgendwelche Scraps.

00:22:00: Die Rang-Beschicht hatte dir auch ein Project-Bord.

00:22:02: Hat sich da schon vieles überschnitten,

00:22:04: mit dem wie du es jetzt bei Alio kennen gelernt hast?

00:22:07: Oder wie ist da der Vergleich?

00:22:10: Also es war schon nochmal rudimentärer,

00:22:13: würde ich sagen, als bei Alio.

00:22:15: Also wir haben jetzt keine Sprint-Plannings

00:22:17: oder sowas jetzt in der Forschung gemacht.

00:22:19: Aber es war schon so, dass wir in Prinzip

00:22:22: wie so ein Weekly hatten,

00:22:24: wo wir unsere Updates konkret

00:22:27: sozusagen in unserem Team besprochen haben.

00:22:29: Und auch geplant haben,

00:22:32: woran wir als nächstes arbeiten.

00:22:34: Und ja, eben besprochen haben,

00:22:38: okay, gibt es noch ein Pull-Request,

00:22:40: den man mal besprechen muss oder so.

00:22:42: Also wir haben das so ein bisschen lockerer gehandhabt,

00:22:45: wir haben jetzt kein konkretes Fremdwerk,

00:22:47: agile Fremdwerk oder sowas benutzt.

00:22:49: Aber ich sag mal, es kam dem vielleicht schon ein bisschen näher,

00:22:53: als wenn man jetzt ganz alleine

00:22:55: an seinem Projekt gesessen hätte, möglicherweise.

00:22:58: Ja, ich meine, also Text-Scrum habe ich auch noch mit erlebt.

00:23:03: Also gibt es vielleicht, aber ich glaube,

00:23:06: es ist nicht so häufig.

00:23:08: Ja, spannend.

00:23:10: Und neben der reinen Art des Arbeitens,

00:23:13: wie würdest du denn die Skills so vergleichen?

00:23:15: Du hast ja eben schon gesagt,

00:23:17: du hast dich neben der Uni weitergebildet.

00:23:20: Das liegt jetzt nahe,

00:23:22: du musst dir Dinge noch nebenher dazuschaffen.

00:23:25: Aber einiges bringt man ja auch schon mit als ausgebildeter Physiker,

00:23:30: oder wie würdest du da so die Balance sehen?

00:23:33: Genau.

00:23:35: Also ich würde sagen, es ist teils teils.

00:23:38: Also das Tooling ist auf der einen Seite schon recht data-science,

00:23:45: würde ich sagen.

00:23:47: Also man hat so, also zum Beispiel,

00:23:49: Python ist so bei uns der absolute Standard.

00:23:52: Jetzt habe ich im Prinzip seit mein Bachelor auch schon gemacht,

00:23:56: weil man damit einfach super Datenanalyse machen kann.

00:24:00: Und die Daten, die man auch jetzt,

00:24:02: sag ich mal, in seiner Bachelorarbeit, Masterarbeit,

00:24:05: aber eben auch Promotion so analysiert.

00:24:08: Das läuft alles in Python, Visualisierung,

00:24:12: mit Mudplotlib und ja auch einige Machine Learning-Frameworks,

00:24:19: habe ich natürlich benutzt, wie zum Beispiel Pytorch

00:24:23: oder eben Tensoffloh und so, da kannte ich mich eben auch schon vorher mit aus.

00:24:27: Das lag jetzt bei mir im Spezifischen daran,

00:24:29: dass ich halt auch wirklich konkret KI auch in meiner Doktorarbeit benutzt habe.

00:24:36: Jetzt vielleicht auch andere, wo es noch nicht so ist.

00:24:39: Aber von daher habe ich jetzt so rein von den Frameworks und vom Tooling,

00:24:43: denke ich schon, auch einiges mitgebracht.

00:24:45: Was vielleicht noch fehlt, ist, also wenn man jetzt experimentelle Daten hat,

00:24:56: dann ist es häufig so, dass da die Unis oder die Forschungskollaboration,

00:25:02: an denen man Teil hat, dass sie ihre eigenen Datenpipelines

00:25:07: und Datenstorages usw. zur Verfügung stellen.

00:25:13: Das gilt auch für so Rechencluster, wo man dann Machine Learning-Modell

00:25:18: drauf trainieren kann und so, das ist alles irgendwie,

00:25:22: ja sage ich mal, Custom implementiert,

00:25:26: während das natürlich in der Wirtschaft alles oder das meiste über die Cloud läuft,

00:25:32: Stichwort eben ever oder auch Databricks oder sowas,

00:25:36: das haben wir jetzt zum Beispiel in der Forschung ja nicht so benutzt

00:25:39: und auch SQL habe ich jetzt nicht so in der Forschung direkt benutzt,

00:25:44: sondern da hatten wir dann einfach unsere eigenen spezifischen Systeme

00:25:48: in der Teilchumsik, die wir da verwendet haben

00:25:52: und deswegen habe ich da auch noch so einen zusätzlichen Kurs gemacht,

00:25:55: weil ich eben wusste, dass so SQL auch so ein bisschen bread and butter

00:25:58: einfach für ein Data Scientist ist.

00:26:00: Ja, ja, die Erfahrung habe ich so wenig gemacht.

00:26:03: Ich glaube, gerade auf amerikanische Cloud-Provider,

00:26:08: da hat man eher in der Uni ein Problem mit aus Datenschutzbründen und so Geschichten,

00:26:12: deswegen sind es da, glaube ich, eher die Rechenzentren in solchen Fällen

00:26:17: und genau SQL habe ich auch, ich habe niemanden kennengelernt,

00:26:21: jetzt, dass ich mich erinnern würde, der bei uns auch in der Uni SQL gemacht hat.

00:26:26: Wobei ich jetzt persönlich sagen würde,

00:26:29: für das, was wir benötigen, hinterher als Data Scientist,

00:26:32: wir sind jetzt nicht, also wir beide jedenfalls nicht die Hardcore Data Engineers,

00:26:37: da schafft man sich so auch ganz gut drauf.

00:26:41: Genau, das ist ja so ein grundsätzliches Problem,

00:26:44: wie stark man jetzt das Tooling auch so in einem Profil bewertet.

00:26:48: Es ist vielleicht eine Frage, an der sich die Geister auch so ein bisschen scheiden.

00:26:55: Also ich finde, wenn man ein guter Data Scientist ist,

00:26:59: kann man sich solche Tools auch recht gut selber aneignen.

00:27:03: Die meisten davon sind auch hervorragend dokumentiert,

00:27:07: im Gegensatz zu einiger Software, die so an der Uni entwickelt wird.

00:27:11: Und ich denke, bei Data Science ist es dann eher wichtig,

00:27:17: dass man sich schnell in komplexe Probleme einarbeiten kann,

00:27:21: eine gute Problemlösungskompetenz hat,

00:27:24: als dass man jetzt fünf Jahre Erfahrung mit Databricks hat,

00:27:27: das ist meine persönliche Meinung.

00:27:29: Bei solchen Dingen kann man auch dann eben,

00:27:33: gerade wenn man ein kompetentes Team hat,

00:27:35: recht schnell lernen oder sich selbst draufschaffen.

00:27:39: Ja, das sehe ich ähnlich.

00:27:42: Also ich habe das auch so gesehen,

00:27:46: ist auch eigentlich eine spannende Frage,

00:27:48: würdest du deine Zeit an der Uni mit drauf rechnen,

00:27:52: als Berufserfahrung als Data Scientist,

00:27:55: oder startet die bei dir mit deiner Einstellung bei England?

00:27:59: Also ich würde es schon mit drauf rechnen,

00:28:03: weil ich schon wirklich sehr konkret mit KI,

00:28:07: mit Datenauswertung, also Daten vom RHC,

00:28:11: das sind eben gigantische Mengen an Daten

00:28:16: und komplexen Daten, die man da bearbeitet.

00:28:19: Und das ist im Prinzip wie ein Data Science Projekt.

00:28:22: Ob man jetzt, sozusagen anomaly detection

00:28:26: in einem wirtschaftlichen Bereich,

00:28:29: irgendwie bei Credit Scores oder irgendwelchen Überweisungen macht,

00:28:34: oder ob man jetzt eben das neue Teilchen detektiert,

00:28:37: ist dann vielleicht letztes sogar ein bisschen komplizierter nochmal.

00:28:41: Also ich würde da schon sagen,

00:28:43: dass man das als Berufserfahrung anerkennen sollte,

00:28:48: weil man eben genau das als Data Scientist

00:28:52: eben am Ende auch macht,

00:28:54: vielleicht mit ein bisschen anderen Tooling,

00:28:57: aber vielleicht kommt das dann auch auf die konkrete Promotion,

00:29:02: sage ich jetzt mal an, wie es gelaufen ist,

00:29:04: aber im eibren konkreten Fall würde ich das schon bejahen.

00:29:08: Es ist relativ wenig Reibung hier in unserem Gespräch,

00:29:11: da sind wir überall auf einer Linie.

00:29:14: Das Lustige ist, wir können an der Stelle mal ein Shout-out an Daniel machen,

00:29:20: unseren Sales Chef.

00:29:23: Das war der erste Alien-Mitarbeiter, mit dem ich Kontakt hatte damals

00:29:28: bei meiner Bewerbung, und ich weiß gar nicht, ob ich das mal zählt habe,

00:29:31: ich habe ja bei uns den Wann gebrochen für die Leute mit einer Promotion.

00:29:36: Der ist mir noch sehr kritisch beim ersten Gespräch begegnet,

00:29:40: mit so ein paar Vorurteilen gegenüber den Wissenschaftlern,

00:29:44: der dann auch die Frage ist,

00:29:47: das ist das eigentlich Data Science Berufserfahrung,

00:29:49: oder ist da jemand nur ewig an der Uni geblieben?

00:29:52: Ich glaube, es ist genau das, was du sagst.

00:29:54: Eigentlich arbeitet man de facto als Data Scientist.

00:29:57: Ich würde sagen, man kann jedes Paper wie ein Data Science Projekt betrachten,

00:30:02: und man muss auch ganz viele Dinge machen.

00:30:05: Domänenwissen aufbauen, also gerade in interdisziplinären Projekten,

00:30:09: die wir hier von mir viel kommunizieren,

00:30:11: mit Leuten gemeinsame Lösungen erarbeiten, eine Lösung präsentieren.

00:30:16: Da sauber arbeiten, man hat vielleicht nicht so diese Themen,

00:30:22: rund um die ICD, um das Deployment, wirklich ein Production Model,

00:30:28: das sind so Themen, die da vielleicht nicht so viel vorkommen.

00:30:31: Das hat vielleicht dann doch mehr einen Studiencharakter,

00:30:35: einen Biosy-Charakter, so was, aber kommt auch darauf an,

00:30:38: gibt es auch unterschiedliche Varianten.

00:30:41: Ich glaube, das ganz Entscheidende ist eben,

00:30:43: dass man das so wie wir es jetzt versuchen, kommunizieren kann.

00:30:46: Weil in dem Moment, wo man dann, oder als ich damals,

00:30:49: das dem Daniel so erzählt habe, hat er dann auch schon sich die Notiz gemacht,

00:30:53: könnte doch gehen.

00:30:54: Also einfach, indem man, verdeutlicht, ich bin jetzt nicht jemand,

00:30:59: der hier jetzt erstmal die Tür zu macht und ein halbes Jahr lang

00:31:02: mit Schüft und Papier auf seinem Problem rumkaut,

00:31:04: und es dann hinterher nicht vorstellen kann,

00:31:06: sondern es braucht auf diese kommunikativen Skills,

00:31:10: die Teppelskills vielleicht auch in Projekten,

00:31:14: das ist das, was wir auch brauchen.

00:31:15: Es ist ja auch das, was du sehr gut in deinem ersten Projekt gemacht hast,

00:31:19: in dem du dann einfach dich anpasst an ein Projekt,

00:31:23: eine eigene Lösung findest,

00:31:25: und die Leute aktiv ansprichst und kommunizierst.

00:31:28: Wir haben uns überlegt, das so und so zu machen,

00:31:30: weil das für euch aus dem und dem Grund am besten ist.

00:31:33: Es gibt in der Promotion mehr Kommunikation als man denkt.

00:31:37: Also man muss ja wirklich auch regelmäßig

00:31:39: seine Ergebnisse kommunizieren,

00:31:42: aufwissenschaftlichen Konferenzen, zum Beispiel gegenüber Leuten,

00:31:47: die vielleicht jetzt nicht ganz so konkret in dem Projekt drin stecken,

00:31:51: wie man selbst, oder gegenüber dem Prof,

00:31:54: oder auch, was ja auch ein wesentlicher Teil ist,

00:31:57: gegenüber anderen Studierenden.

00:31:59: Wenn man jetzt zum Beispiel ein Master Studenten betreut,

00:32:01: oder ein Bachelor Studenten betreut,

00:32:03: wenn man zum Beispiel Übungsgruppen betreut,

00:32:07: ich habe zum Beispiel auch Übungsgruppen

00:32:10: zur statistischen Datenanalyse betreut und so.

00:32:13: Und auch da ist es natürlich super wichtig,

00:32:15: solche komplexen Sachen auch unterzubrechen

00:32:17: und auch weiterzugeben.

00:32:18: Und das ist eben auch ein sehr wichtiger kommunikativer Skill,

00:32:21: der, ja, denke ich auch relevant ist für die Projekte bei Alienium.

00:32:26: Genau, also kommunizieren, ja.

00:32:30: Ich glaube, was sich ändert, ist so ein bisschen die Perspektive

00:32:35: und die Starkrichtung, auf die man hinwirkt.

00:32:39: Also am Ende eines Projektes wird niemand von dir

00:32:42: einen 40-seitigen Bericht erwarten,

00:32:45: indem du drei statistische Tests gemacht hast

00:32:48: und alle Metriken deines Modells aufschlüsst,

00:32:52: sondern im Endeffekt, gerade wenn das auf das Ziellevel geht,

00:32:55: geht es am Ende um Executive Summary,

00:32:58: dann ist die Frage, hast du die Projektziele erreicht,

00:33:01: hast du einen Business Value generiert, solche Themen.

00:33:04: Was aber nicht heißt, dass man umgenauert sein sollte.

00:33:07: Also auch das kann man ja statistisch begründen,

00:33:11: kann das vernünftig herleiten, aber man muss es,

00:33:15: ich würde sagen, vielleicht noch ein bisschen prägnanter darstellen

00:33:18: und mit einem weniger wissenschaftlichen als mit einem Monetäern

00:33:22: und zeitlichen.

00:33:24: Genau, das Ende ist das Wissenfabliche,

00:33:27: sozusagen rückt vielleicht in der Präsentation ein bisschen

00:33:30: in den Hintergrund, aber ich würde schon grundsätzlich sagen,

00:33:33: dass es eine Gemeinsamkeit von Wissenschaft und Wirtschaft,

00:33:37: dass man sozusagen einfach schon Strukturen in Daten erkennen möchte,

00:33:43: um in irgendeiner Form daraus Erkenntnisse zu gewinnen,

00:33:47: Prozesse zu verbessern etc.

00:33:49: Und das eben auch, das ist auch meine tiefe Überzeugung natürlich

00:33:52: als Wissenschaftler irgendwo mit wissenschaftlichen Methoden.

00:33:55: Also wir reden immer viel auch im Podcast über dieses Bauchgefühl,

00:34:00: das spielt natürlich auch eine Rolle, Domänen wissen,

00:34:03: Leute, die schon 20, 30, 40 Jahre im Unternehmen arbeiten.

00:34:06: Aber auf der anderen Seite auch zu sagen,

00:34:08: wir gucken uns trotzdem die Daten ganz genau an,

00:34:12: wir gucken uns unsere Modelle ganz genau an

00:34:14: und schauen auch mit statistischen Methoden drauf,

00:34:17: sozusagen ob wir eine signifikante Veränderung zum Beispiel haben.

00:34:21: Und das sehe ich eben als eine Gemeinsamkeit,

00:34:28: damit man quasi nicht einfach nur rät,

00:34:32: sondern wirklich anhand der Daten Schlüsse zieht,

00:34:35: die am Ende das Unternehmen dann auch weiterbringen

00:34:38: und einen kompetentiven Vorteil in sozusagen generieren.

00:34:42: Genau, ich habe da neulich, ich kann Ihnen jetzt leider nicht

00:34:45: korrekt als Quelle angehen, das müssen wir in dem Journalismachen,

00:34:50: aber ich habe ein Towards Data Science Artikel gelesen,

00:34:53: da ging es darum.

00:34:55: Der hat sich ein bisschen damit auch beschäftigt,

00:34:57: signifikant oder nicht signifikant,

00:34:59: und es gab dann so ein sehr plastisches Beispiel,

00:35:02: in dem man einen A/B-Test bei einer Website Optimierung macht

00:35:06: und findet dann raus, die die Änderung ist nicht statistisch signifikant,

00:35:11: mit irgendeinem Signifikanz-Niveau, was man definiert,

00:35:14: 95%.

00:35:19: Und die Argumentation da ist dann,

00:35:22: dass man hier wirklich stoppen sollte als Data Scientist in der Wirtschaft,

00:35:26: denn erstmal muss man sich klar machen,

00:35:28: diese Signifikanz-Niveaus, die sind irgendwo ein bisschen random,

00:35:32: weil wenn ich das dann breiter ziehe,

00:35:35: dann ist es auf einmal signifikant,

00:35:37: ob ich da jetzt 95% nehme oder 90% oder 98%.

00:35:42: Und die Frage, die man sich herstellen muss,

00:35:45: ist, was habe ich für eine erwartete Veränderung meines Umsatzes

00:35:51: und meines Gewinns, wenn ich das mache?

00:35:54: Und man kann die statistische Analyse dann natürlich weiterführen,

00:35:57: und dann kann man eben auch mit dem nicht signifikanten Experiment rausfinden,

00:36:01: dass es sehr viel wahrscheinlicher ist,

00:36:03: dass wir aber hinterher einen guten Business Value erzielen.

00:36:08: Und ich glaube, das ist so ein bisschen die,

00:36:10: das ist das, was ich meine mit der gedanklichen Orientierung,

00:36:15: woraufhin optimiere ich.

00:36:17: Und so vielleicht ein bisschen plaktative Vorwurf an die Wissenschaft ist,

00:36:21: die ist fertig, indem sie sagt, es ist nicht statistisch signifikant,

00:36:25: ich höre hier auf.

00:36:27: Und das versuchen wir nicht.

00:36:29: Wir versuchen aufzuhören, wenn wir sagen,

00:36:31: das kostet uns noch Geld und das bringt uns nichts.

00:36:33: Genau, ja, würde ich so unterschreiben,

00:36:36: ist doch auch ein tolles Thema vielleicht für eine zukünftige Podcast-Folge,

00:36:41: A-W-Test und High-Positive-Tests.

00:36:45: Das ist nochmal ein Thema für sich.

00:36:47: Auf jeden Fall.

00:36:49: Ich würde gerne zum Abschluss unseres Podcasts dich noch bitten,

00:36:53: hast du für Leute, die einen ähnlichen Währlegerang haben,

00:36:56: wie wir, auch so ein paar Tipps und Arztschläge,

00:37:00: wie man das angehen kann?

00:37:03: Ich meine, du kannst natürlich auch sagen, macht das bloß nicht,

00:37:06: wie ich und wie zu ähnlich ist, das ist alles furchtbar hier,

00:37:08: aber dann haben wir noch ein längeres Nachgespräch nach dem Podcast.

00:37:13: Ja, also ich würde sagen,

00:37:18: wenn man aus der Wissenschaft Richtung Data Science gehen möchte,

00:37:23: ist das Wichtigste, dass man schon nochmal auch ein bisschen guckt,

00:37:31: wie kann ich mich so auf diesen Wechsel wirklich vorbereiten,

00:37:35: Stichwort Tooling.

00:37:37: Ich glaube, das ist jetzt nichts, wo ich den Leuten unterstellen würde,

00:37:40: dass sie das nicht sich auch selber aneignen können,

00:37:42: aber es wird einfach im Recruitment-Prozess erwartet,

00:37:47: dass man bestimmte Sachen kann

00:37:50: und dass man vielleicht auch schon mal ein Modell-Deployt hat,

00:37:54: dass man vielleicht schon Grund legen der Erfahrungen,

00:37:56: keine Ahnung, im Bereich Cloud oder so hat.

00:38:00: Und wenn man sich da schon mal ein bisschen mit beschäftigt hat,

00:38:03: ist das auf jeden Fall ein Plus.

00:38:06: Auch dieses ganze Thema, wie läuft überhaupt so ein Interview ab?

00:38:09: Also definitiv auch gerne nochmal die Podcast-Folgen hier hören

00:38:13: und sich da ein bisschen darauf vorbereiten.

00:38:18: Ich habe auch von Leuten gehört, die so etwas wie Leadcode gemacht haben,

00:38:22: also Coding-Interviews usw. gibt es unter Umständen auch.

00:38:26: Das ist, denke ich, sehr wichtig

00:38:29: und auf der anderen Seite halt wirklich nochmal gezielt,

00:38:34: lernen herauszustellen, was der Mehrwert von so einer Promotion ist.

00:38:38: Also in welchen Problemen habe ich konkret gearbeitet,

00:38:41: was habe ich davon gelernt und wie bin ich da wertvoll

00:38:46: aus dieser Erfahrung heraus als Data Scientist für ein Unternehmen.

00:38:50: Also dass man das quasi nochmal richtig verpackt,

00:38:52: weil das ist, glaube ich, in der Wirtschaft nicht klar

00:38:55: und vielen Recruitern nicht klar.

00:38:58: Aber ich muss sagen, was der Vorteil wirklich von das,

00:39:01: was wir gerade besprochen haben.

00:39:03: Ich habe neulich auch mit einem Kumpel gesprochen,

00:39:06: der ein bisschen schockiert war,

00:39:08: dass ein Recruiter seine Hunderten von Stunden

00:39:13: auf einem Rechencluster an der Uni, was tausende von Euro gekostet hat,

00:39:18: so beiseitewüscht und fragt,

00:39:20: hast du denn das Escher-Zertifikat für 300 Dollar?

00:39:24: Aber Endeffekt sind das halt dann auch Leute,

00:39:27: die sich in den vielen Themen arbeiten.

00:39:30: Vielleicht letzte Frage.

00:39:32: Wie stellt man denn für sich selber fest,

00:39:34: so soul-searchingmäßig, ob das der richtige Weg für ein,

00:39:37: ob man kürzlich wird, als Data Scientist in der Wirtschaft

00:39:42: oder ob man es doch versuchen soll, in der Wissenschaft zu bleiben?

00:39:46: Boah, gute Frage.

00:39:49: Also ich glaube, ich will das vielleicht sogar nochmal aufteilen,

00:39:54: wenn man in der Wissenschaft bleiben will oder nicht,

00:39:56: ist der erste, der wichtigste Punkt ist,

00:40:00: dass man sich das auch vorstellen kann

00:40:02: mit den verschiedenen Constraints, die ich von gesagt habe,

00:40:06: mit den entsprechenden Arbeitsbedingungen usw.,

00:40:10: dass man das auch über viele Jahre noch durchziehen kann.

00:40:14: Das ist glaube ich erstmal ein wesentlicher Punkt.

00:40:17: Ansonsten sollte man natürlich einfach Spaß an der Arbeit mit Daten haben,

00:40:27: an Statistik haben, vor allen Dingen finde ich.

00:40:30: Also Statistik ist so das Haupttool,

00:40:32: da auch ein gutes Verständnis schon mitbringen.

00:40:37: Und vielleicht auch so ein bisschen dieses,

00:40:43: wie soll ich das sagen,

00:40:47: was Alex mal so schön beschrieben hat,

00:40:50: als auf ein Problem draufhauen, bis es kaputt geht.

00:40:53: Also man muss halt schon ein bisschen Lust drauf haben,

00:40:56: ein Problem lange und intensiv zu bearbeiten,

00:40:58: weil man halt nicht immer, also nicht immer,

00:41:00: ist der erste Wurf gleich erfolgreich.

00:41:02: Und dann kommen eben diese ganzen Data Science Tools,

00:41:06: Stichwort Feature Engineering, Modellverbesserungen,

00:41:10: Domänenwissen einbauen usw.,

00:41:14: wo man dann Schritt für Schritt versucht,

00:41:16: dann weiter an den Problem zu arbeiten, das zu lösen.

00:41:18: Das kann manchmal auch langwierig sein,

00:41:20: es kann komplex sein.

00:41:22: Und darauf muss man auch einfach Lust haben.

00:41:26: Gehe ich mit, ich habe noch zwei Ergänzungen vielleicht.

00:41:29: Eine Sache, die ich sehr schön finde,

00:41:31: gerade bei uns mit dem Data Science Project Geschäft,

00:41:35: ist auch ein viel unterschiedlicher, wie man sieht.

00:41:37: Also in den drei Jahren habe ich jetzt so viele Branchen kennengelernt

00:41:41: und mit unterschiedlichen Leuten gesprochen

00:41:44: und immer mit Daten gearbeitet,

00:41:46: aber eben Daten zu ganz unterschiedlichen Themen

00:41:49: von Lebensmittelhandeln, Einzelhandel zu Sensordaten,

00:41:52: zu Glasfaserausbau und ja, das ist schon cool.

00:41:57: Das ist eine Sache, die man vielleicht in der Wissenschaft

00:42:00: geht man eher tiefer in das eine Thema.

00:42:02: Und wir sehen sehr viel und lernen viele Menschen kennen,

00:42:05: das fand ich gut.

00:42:07: Und das andere ist, Dinge zu bauen

00:42:11: und dann auch wirklich live zu schalten

00:42:14: und zu sehen, dass die etwas verändern.

00:42:17: Das ist natürlich auch, also wenn es klappt,

00:42:20: das ist ein schönes Gefühl.

00:42:22: Definitiv.

00:42:24: Und das Erste, was du gesagt hast, ist natürlich auch nochmal speziell,

00:42:27: besonders interessant, bei ALIO, finde ich,

00:42:31: weil man kann natürlich auch Data Scientist

00:42:34: in einem Industrieunternehmen zum Beispiel werden,

00:42:37: wo man dann vielleicht tendenziell eher

00:42:40: die ähnliche Themen bearbeitet.

00:42:42: Aber das ist eben, wenn man über uns jetzt

00:42:46: einen Dienstag geht, ist das eben genau besonders das Coole,

00:42:50: dass man eben verschiedene Projekte in verschiedenen Branchen

00:42:52: und verschiedene Probleme hat.

00:42:54: Und das war auch für mich ganz klar ein Grund,

00:42:56: weswegen ich zu ALIO gehen wollte.

00:42:58: Ja, cool, Tobi. Vielen Dank.

00:43:01: Ich habe keine Fragen mehr, bin wunschlos glücklich.

00:43:04: Bist du noch jemanden grüßen am Ende der Folge?

00:43:07: Nein, ich glaube, ich bin gut, ohne Grüße,

00:43:12: aber ich danke dir erstmal für deine Geduld

00:43:19: und für die Fragen und für die Coole Podcast-Exercise.

00:43:25: Ja, ebenfalls. Ich grüße noch den Janis am Ende,

00:43:29: an alle, die den Janis jetzt schon vermissen

00:43:32: und sich auf die nächste Folge mit ihm freuen.

00:43:34: Ich habe einen Vögelchen Zwitschern hören, da ist was in der Mache.

00:43:37: Also auch von Janis ist es hier bald wieder was zu hören.

00:43:41: In der Urgner Podcast-Volgabe haben wir mal gesagt,

00:43:43: alle zwei Wochen oder so, weil wir einen rausrauen.

00:43:45: Ja, das ist challenging.

00:43:48: Genau, dann wünschen wir allen noch frohe Weihnachten,

00:43:51: einen guten Rutsch und ein paar Jahre.

00:43:53: Guten Rutsch und auf ein erfolgreiches 2025.

00:43:56: Genau, mach's gut, Tobi.

00:43:58: Ja, ciao.

00:43:59: Danke für die Leute!

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.