„ICH HABE VON EINEM SPANNENDEN LEBEN GETRÄUMT“

Dr. Nikolay Kobyshev

Interview mit dem Gründer eines Startups, welches die Airline-Branche durch Computer Vision revolutioniert hat

Künstliche Intelligenz, Zukunftstechnologien, Computer Vision – diese futuristischen Worte bringen enorme Popularität für Sci-Fi-Filme. Mit Interesse und Aufregung schauen wir Black Mirror und stellen uns vor, wie Computer unsere Zukunft verändern werden und welche Rolle uns dabei geben werden wird. Währenddessen erschafft jemand in dieser Welt genau jetzt diese Zukunft und verändert ganze Branchen buchstäblich vom Nachbarhaus aus.

Nikolay Kobyshev ist Doktor der Informatik, Alumni der ETH Zürich, Gründer des Startups Assaia International AG und Vorstandsmitglied von Spectando. Vor einigen Jahren zog er aus Russland in die Schweiz, um an einer führenden Universität zu studieren, und heute leitet er ein globales Innovationsunternehmen. In diesem Interview spricht Nikolay darüber, warum Algorithmen zuverlässiger sind als Menschen, wie Bildung den Erfolg behindert, warum Fluggesellschaften an Oliven sparen und ob wir Angst vor dem technologischen Fortschritt haben sollten oder nicht.

Was hat deine Berufswahl beeinflusst?

Als ich 15 Jahre alt war, habe ich von einem spannenden Leben geträumt – eines, das es mir erlauben würde, meine Wahl auch nach ein paar Jahrzehnten nicht zu bereuen. Ich war schon immer begeistert von den Computertechnologien. Ich dachte und glaube immer noch, dass dies nicht nur ein sehr vielversprechender Beruf ist, sondern auch ein Bereich, der wirklich von Vorteil für die Gesellschaft ist und der unsere Welt objektiv verändert. Ausserdem gefiel mir die Mathematik und die Logik ihrer Anwendung im Computerbereich: Man gibt die Formel ein, gibt den Befehl, und der Computer führt sie genau aus. Mit dieser Motivation ging ich an die Fakultät für Technische Kybernetik der Polytechnischen Universität St. Petersburg. Parallel dazu habe ich auch einen Bachelor-Abschluss in Wirtschaftswissenschaften erlangt.

Warum bist du in die Schweiz gezogen?

Als ich mein Bachelorstudium abgeschlossen hatte, wusste ich nicht wirklich, was ich als nächstes tun sollte. Meine Noten waren besser als die der anderen, aber das hat meine Karriereaussichten in keiner Weise verbessert. Die Arbeitgeber schätzen die Erfahrung einer Person viel mehr als meine akademischen Leistungen am Institut. Der einzige Weg, den akademischen Vorteil zu nutzen, war, das Studium fortzusetzen und zu versuchen, an eine Spitzenuniversität zu gelangen. Deshalb habe ich mich an verschiedenen europäischen Universitäten beworben. Es hat alles perfekt funktioniert: Ich wurde in das Masterprogramm der ETH aufgenommen und erhielt sogar das „Excellence Scholarship and Opportunity Award“, was eine Art Stipendium ist.

Ich bin unglaublich froh, dass ich eine so gute Ausbildung bekommen habe. Ich denke jedoch auch, dass Bildung im Leben selbst nutzlos ist.

Kannst du im Nachhinein sagen, dass die ETH Zürich die richtige Wahl war?

Ich vermute es. Ich sage hierbei bewusst „vermuten“, weil ich keinen Vergleich habe. Ich bin unglaublich froh, dass ich eine so gute Ausbildung bekommen habe. Ich denke jedoch auch, dass Bildung im Leben selbst nutzlos ist. In der Tat entwickelt es die Fähigkeit zu arbeiten und gibt einem ein tiefes Verständnis für das Thema. Aber dir dieses akademische Wissen ist vielleicht nicht so wichtig. Es gibt viele Beispiele für Menschen, deren mangelnde Bildung sie nicht daran gehindert hat, äusserst erfolgreich zu sein – zum Beispiel bekannte Persönlichkeiten wie Zuckerberg, Gates, Jobs. Ausserdem ist der akademische Weg manchmal sogar ein Hindernis: Natürlich entwickelt man sich, man lernt logisch zu denken, aber man verpasst auch einige Zeit.

Da du erkannt hast, dass eine lange Ausbildung nicht unerlässlich für den Erfolg ist, bist du dennoch weiter gegangen und hast dich für eine Promotion eingeschrieben. Das ist ein grosser Schritt, warum hast du es getan?

Tatsächlich scheint mir die Promotion weniger kategorisch zu sein als die Arbeit direkt nach dem Abschluss, denn sie beraubt dich nicht in der Wahl deines Jobs. Im Gegenteil, es bietet dir eine grossartige Gelegenheit, etwas Interessantes und Nützliches zu tun, ohne Karrieretüren zu schliessen. Zum Beispiel hätte ich nach meiner Promotion als Programmierer arbeiten oder in die Wirtschaft einsteigen oder mich an der wissenschaftlichen Forschung beteiligen können – das heisst, mein Horizont wurde grösser.

In meinem Fall war es so: Nach dem Master-Abschluss wurde mir klar, dass ich eine gute Situation hatte – ich hatte bereits in der Schweiz gelebt, erfolgreich mein Studium abgeschlossen und wusste sicher, dass ich in meinem Bereich einen Job finden konnte. Aber wie schon vor vielen Jahren wollte ich, dass meine Karriere etwas Nicht-Triviales ist. Ausserdem hatte ich einen Kindheitstraum, in die Wissenschaft zu gehen, um tiefe Kenntnisse in einem Bereich zu erlangen. Ich wollte diese Neugierde befriedigen, und ich bin froh, dass ich es bis zum Äussersten getan habe.

Was war dein Spezialgebiet während der Promotion?

Bereits seit meinem Masterstudium habe ich Computer Vision studiert. Damals habe ich mich nur für dieses Gebiet entschieden, weil es mir interessant und vielversprechend erschien. Schliesslich gefiel mir die Spezialisierung aber so gut, dass ich während der Promotion weiter daran gearbeitet habe. Ein Jahr nach Beginn meines Doktoratsstudiums geschah der absolute Boom der Computervision: Es entstanden tiefe neuronale Netze, die die Branche auf den Kopf stellten und es erlaubten, ernsthaft über die Umsetzung der Computervision in vielen Bereichen nachzudenken.

Einfach ausgedrückt, was ist Computervision?

Das ist sozusagen die Computerdekodierung von visuellen Informationen. Es gibt Aufgaben, die mit seiner Hilfe schon seit langem gelöst werden. Der klassischste von ihnen ist der Barcode, dessen Symbole der Computer sehr gut versteht. Dann gab es einen grossen Erfolg mit der Erkennung von Codes auf Post und den Autokennzeichen. Dann kamen gute Gesichtserkennungsmethoden hinzu, die es ermöglichten, den Kameras die Autofokusfunktion auf Gesichter hinzuzufügen. Aber manche Aufgaben, die für einen Menschen super trivial klangen – zum Beispiel, ein Bild einer Blume von einem Bild eines Hundes zu unterscheiden – waren für einen Computer bis etwa 2012 unmöglich. Damals brachten tiefe neuronale Netze die Computervision auf ein neues technologisches Niveau.

Wie funktionieren tiefe neuronale Netze?

Computerneuronale Netzwerke funktionieren genauso wie das menschliche Gehirn, so wie es bis heute untersucht wurde. Das Netzwerk besteht aus einer Vielzahl von miteinander verbundenen künstlichen Neuronen, die ständig und unabhängig darauf trainiert werden, durch welche elektrischen Signale sie stimuliert werden und durch welche nicht. So wertet beispielsweise ein Neuron die Helligkeit einer kleinen Gruppe von Pixeln in einem Bild aus und löst aus, wenn es höher als ein bestimmter Grenzwert wird. Oder es reagiert nicht, wenn die Werte niedriger als dieser Grenzwert sind. Innerhalb des Netzwerks gibt es Millionen von Neuronen, die miteinander verbunden und aktiviert sind, abhängig von der Aktivität der anderen in der Nähe. Zuletzt gibt es noch das letzte Neuron am Ausgang, das nur dann ausgelöst wird, wenn es eine Blume im Bild gibt, und es wird nicht ausgelöst, wenn ein Hund darauf ist.

Neuronale Netze werden zunächst nur programmiert, für welches Neuron mit welchem gesprochen wird. Aber wann es auf das vorherige Neuron hören wird oder nicht, ist Teil des Trainings. So versuchen Neuronen selbstständig, den effektivsten Weg zur Lösung des Problems zu finden. Während des Trainings werden grosse Datenmengen zur Analyse in das neuronale Netzwerk geladen. Je mehr Eingangsdaten das Netzwerk erhält, desto besser funktioniert es und desto genauere Ergebnisse kann es erzielen. Das ist es, worum es bei der künstlichen Intelligenz am Beispiel neuronaler Netze geht.

Wenn es unbestreitbare Beweise dafür gibt, dass eine Maschine besser funktioniert als ein Mensch, würde ich der Maschine definitiv mehr vertrauen.

Bei der harmlosen Sortierung von Bildern erscheint das alles klar. Aber glaubst du, dass moderne Systeme so ausgereift sind, dass sich die Menschen wirklich darauf verlassen können um ernsthafte Entscheidungen zu treffen?

Es sind Fehler von Algorithmen, die in der Regel resonant werden. Zum Beispiel ein Netzwerk, das eine Frau als Gorilla erkannte; oder ein Netzwerk, das unschuldige Menschen als Kriminelle identifizierte. Es ist jedoch sehr wichtig zu verstehen, dass das Netzwerk niemanden beleidigen will, es arbeitet auf der Grundlage der Daten, die in es hochgeladen wurden. Wenn die Eingabedaten unzureichend oder falsch waren, wiederholt das Netzwerk sie nur und erhöht den menschlichen Fehler. Dies ist sehr ähnlich wie bei den Kindern, die von schlechten Eltern aufgezogen werden.

Ich glaube, dass Vertrauen in Algorithmen eine Frage des Wissensgewinnens ist. Wenn es unbestreitbare Beweise dafür gibt, dass eine Maschine besser funktioniert als ein Mensch, würde ich der Maschine definitiv mehr vertrauen. Das heisst, wenn das System Tumore aus dem Scan besser erkennt als ein Mensch, werde ich darauf bestehen, dass meine Scans von der Maschine untersucht werden. Ganz einfach aus dem Grund, dass mir diese Entscheidung eine bessere Überlebenschance gibt.

Was hältst du von der Idee, die Computersteuerung in den Alltag zu integrieren, wie z.B. das soziale Bewertungssystem in China, das vielen Menschen Angst macht?

Auf der einen Seite sehe ich einige positive Aspekte dieses Ansatzes: zum Beispiel, dass dieses System dazu beitragen wird, Kriminelle aufzuspüren und zu fangen. Aber ich würde in einer solchen Gesellschaft nur leben wollen, wenn ich dem Autor dieser Technologien zu 100% vertraue. Ich denke jedoch, dass dies in keiner Gesellschaft der Fall sein wird.

Wenn wir über technische Innovationen im Allgemeinen sprechen, bin ich natürlich immer auf der Seite des Fortschritts. Ich verstehe, dass das Unbekannte die Menschen oft erschreckt, aber ich denke, dass der „point of no-return“ bereits überschritten ist. Die Technologie verändert die Welt sehr schnell und macht sie einfacher und zugänglicher. Heute lernt man sich über Tinder kennen, kommuniziert über Facebook, geht nach Hause mit Uber und ruft überall auf der Welt über WhatsApp an. Natürlich gibt es dabei sowohl Vor- als auch Nachteile, aber die Technologie ist so nützlich, so dass es keinen Sinn macht, Angst zu haben oder ihre Entwicklung einzuschränken.

Du bist seit vielen Jahren persönlich an der Entwicklung der Technologie beteiligt. An welchen Projekten hast du gearbeitet?

Ja, ich habe immer versucht, parallel zum Studium etwas zu tun. Zuerst haben wir das Hackathon HackZurich organisiert – es ist ein Wettbewerb für Programmierer, bei dem sie 48 Stunden Zeit haben, eine Idee zu entwickeln und in einem Prototyp umzusetzen. Dieses Format trägt wesentlich zum kreativen Prozess bei, der im Alltag oft blockiert wird. Denn in der Regel, wenn man ein gutes Produkt anbieten will, muss man es qualitativ herstellen. Die Entwicklung braucht viel Zeit und man weiss immer noch nicht, ob sich das Produkt selbst lohnt. Im Hackathon-Modus sagst du im Voraus: Ich tue es irgendwie, nur damit der Prototyp in irgendeiner Weise funktioniert. Dies hilft, interessante Ideen zu generieren.

Während meines Studiums habe ich auch mein erstes unabhängiges Projekt gegründet – die Firma Spectando, die sich auf Virtual Reality für die Visualisierung von Immobilien spezialisiert hat. Die Idee ist, dass wenn man nach einer Wohnung sucht, es viel Zeit braucht, um die Objekte zu besichtigen. Wir bieten an, die virtuellen Analogien von Wohnungen zu betrachten, um den Fokus der Auswahl zu verengen und sofort festzustellen, was man mag und welche Optionen einen nicht interessieren. Heute ist Spectando ein stabiles Unternehmen mit einer gewissen Anzahl von Kunden. Ich bin immer noch im Vorstand.

Dein Hauptgeschäft heute ist ASSAIA. Wann und wie bist du auf die Idee dazu gekommen?

Im Oktober 2017 schloss ich mein Doktoratsstudium ab und wusste, dass ich in Zukunft mit Computervision arbeiten wollte. Dieser Wunsch wurde von meinem alten Kollege Dmitry, mit dem wir bereits mehrere gemeinsame Projekte durchgeführt haben, und unserem Geschäftspartner Max mit mir geteilt. Wir glauben alle an die Computervision und dass sie bestimmte Branchen radikal verändern kann. Deshalb haben wir uns entschlossen, gemeinsam ein Unternehmen zu gründen, das diese Technologie anbietet.

Damals wussten wir nicht, auf welche Branche wir uns konzentrieren sollten, aber wir haben uns von Anfang an auf den B2B-Markt konzentriert. Um die Richtung zu bestimmen, boten wir verschiedene Produkte an und untersuchten einfach den gesamten Markt und versuchten herauszufinden, wo wir nützlich sein könnten.

Es handelt sich um eine Branche, in der American Airlines 40 000 Dollar pro Jahr eingespart hat, indem sie die Anzahl der Oliven für das Mittagessen der Passagiere der ersten Klasse um eine einzige reduziert haben.

Mit anderen Worten, anstatt ein Produkt zu entwickeln und es dem Unternehmen anzubieten, habt Ihr das Gegenteil getan: Ihr habt die Unternehmen gefragt was sie brauchen und darauf aufbauend eine Lösung entwickelt?

Ja, und ich werde das Gleiche für alle zukünftigen Unternehmen tun, denn dies ist ein nachhaltigeres Modell. Zum Vergleich: Wir haben Spectando um eine Idee herum aufgebaut. Im Nachhinein verstehe ich, dass wir während der gesamten Entwicklung des Produkts versucht haben, uns davon zu überzeugen, dass der Markt es braucht. Jetzt denke ich, dass es besser ist, die Bedürfnisse des Marktes zu finden und auf dieser Basis ein massgeschneidertes Produkt zu entwickeln.

Wie hast du den Markt analysiert, um eure Nische zu finden?

Wir haben standardisiert gehandelt: Wir haben Workshops mit Kunden organisiert und die Unternehmen angerufen, um zu verstehen, welche Lösungen benötigt werden; dann haben wir uns einige Produkte ausgedacht und beobachtet, wie gut sie verkauft werden.

All dies führte uns schliesslich in die Luftfahrtindustrie. Es gibt viele Faktoren, die uns gezeigt haben, dass dieser Markt einen hohen Optimierungsbedarf hat. Erstens wird es an subjektiven Dingen gemessen: zum Beispiel wie schnell erhält man eine Antwort auf eine E-Mail, wie viel Feuer hat der Mitarbeiter in den Augen? Aber die objektiven Signale bestätigen natürlich auch die Existenz des Problems. Schliesslich handelt es sich um eine Branche, in der American Airlines 40 000 Dollar pro Jahr eingespart hat, indem sie die Anzahl der Oliven für das Mittagessen der Passagiere der ersten Klasse um eine einzige reduziert haben. Es bedarf nicht viel Analyse um zu erkennen, dass maximale Kosteneinsparungen bei den Prozessen überlebenswichtig in diesem Markt sind.

Was sind die Prozesse, an deren Optimierung ihr arbeitet?

Derzeit konzentrieren wir uns auf den Turnaround – das ist alles, was einem Flugzeug nach der Landung auf dem Flughafen passiert. Bisher ist das noch eine echte Blackbox: Fast niemand weiss genau, was mit dem Flugzeug passiert und wie man die Prozesse steuert. Das Verständnis dafür ist jedoch entscheidend, denn jede Inkonsistenz kann zu einer Verzögerung des Abflugs führen, die enorme Verluste verursacht.

Der zweite Aspekt sind die Sicherheitsprobleme. Auf dem Flugplatz ereignen sich oft Vorfälle aller Art, von Situationen, in denen vergessen wird das Gepäck einzuladen, bis hin zu physischen Kollisionen von Flugzeugen. Schliesslich gibt es Schwierigkeiten bei der Kapazität der Flughäfen. Die Zahl der Flüge steigt und wird sich innerhalb der nächsten 20 Jahre voraussichtlich verdoppeln. Aber die Kapazität der Flughäfen bleibt gleich, denn der physische Ausbau eines Flughafens ist eine sehr schwierige Lösung. Daher ist die einzige Möglichkeit, die Kapazität eines Flughafens zu erhöhen, eine Steigerung der Effizienz seiner internen Prozesse.

Hier sehe ich die Schönheit der Arbeit mit Daten: Man kann die aktuelle Branche nicht mit Hilfe neuer Mechanismen verändern, sondern einfach mit Hilfe der Daten.

Welches Produkt bietet ASSAIA, welche Probleme hilft es zu lösen?

Zunächst einmal ermöglichen wir es den Kunden, sich ein sehr klares Bild davon zu machen, was mit einem Flugzeug während eines Turnarounds passiert, ohne komplexe Sensoren hinzuzufügen, sondern einfach mit einer installierten Videokamera. Es hilft dabei, festzustellen wenn ein Flugzeug ankam, wenn die Passagiere abflogen, wann die Reinigung, das Betanken, der Stromanschluss und hundert andere Dinge begannen. Das ist keine Übertreibung: Die Liste der Parameter, die wir kontrollieren können, umfasst 110 Indikatoren. Ein solches Überwachungssystem ermöglicht genauere Entscheidungen bei der Koordination.

Zweitens bieten wir ein Entscheidungsunterstützungssystem an, das den Fluggesellschaften mitteilt, auf welches Flugzeug sie mehr achten sollten und welches Flugzeug von Verspätungen bedroht ist. Wir haben drei Ziele: die Steigerung der Effizienz, Sicherheit und Umweltfreundlichkeit des Flugzeugumschlags am Flughafen.

Wie genau ist künstliche Intelligenz in eurem System eingebunden?

Die Lösung ist zu 100% an die künstliche Intelligenz gebunden, die hier auf zwei Ebenen funktioniert. Einerseits betrachtet unser Computer Vision System, wie am Beispiel eines Hundes und einer Blume, das Bild eines Flugzeugs und erkennt, was im Moment mit ihm passiert. Auf der anderen Seite haben wir ein System, das versteht, wie der Flughafen im Allgemeinen funktioniert, und vorhersagen kann, was in einer halben Stunde, einer Stunde und so weiter mit ihm passieren wird. Seine Genauigkeit ist bereits höher als die des Menschen und er wird jeden Tag optimiert.

Wer sind eure Kunden?

Wir haben drei Haupttypen von Kunden: Flughäfen, die ihre Kapazität und Effizienz verbessern wollen; Fluggesellschaften, die an etwa der gleichen Sache interessiert sind; und Abfertiger, die direkt mit dem Betrieb zu tun haben (Gepäck, Passagiere, etc.). Sie alle profitieren von mehr Transparenz und Vorhersehbarkeit.

Unser System ist vielseitig, für alle Flughäfen und Unternehmen geeignet, und die technischen Anforderungen an den Anschluss sind minimal: Man muss nur eine Kamera installieren, die das Flugzeug sieht.

Habt ihr Konkurrenz?

Soweit uns bekannt ist, sind wir weltweit das einzige Unternehmen, das sich mit künstlichen Intelligenzsystemen ausschliesslich für Flughäfen beschäftigt. Dies ist ein Nischenprodukt, und wir glauben, dass eine solche Entscheidung – um ein Qualitätsprodukt für bestimmte Kunden herzustellen – optimal ist.

Was sind eure Pläne für die nächsten fünf bis zehn Jahre?

Wir arbeiten bereits auf globaler Ebene, und unsere Wachstumspläne zielen darauf ab, weltweit führend zu werden. Ich denke, wir haben so eine Chance, weil wir in einer bestimmten Nische arbeiten und unsere Funktion gut erfüllen. Deshalb kann ich sehr optimistisch sein und erwarten, dass unser System in Zukunft standardmässig auf allen Flughäfen installiert wird.

Darüber hinaus wollen wir noch besser verstehen, wie ein Flughafen funktioniert, um alle technischen Systeme miteinander zu verknüpfen. Auf diese Weise erhalten wir nicht nur glasklare Informationen über alle Prozesse, sondern können auch die Entwicklung von Ereignissen vorhersagen, wenn sich bestimmte Parameter ändern. Je mehr Daten ein System analysieren kann, desto mehr profitieren die Benutzer davon, damit sie ihren Betrieb optimieren können. Dies ist eine der vorrangigen Richtungen unserer Entwicklung.

Wie siehst du die Zukunft der Luftfahrtindustrie im Allgemeinen? Welche Veränderungen können wir erwarten?

Heute gibt es in der Luftfahrtindustrie bestimmte Umweltprobleme, die in den kommenden Jahrzehnten sicherlich in Angriff genommen werden. Darüber hinaus wird die Zahl der Flugzeuge rasant wachsen, was eine noch stärkere Optimierung aller Prozesse erfordert. Ich bin sogar sehr froh, dass die Branche wachsen wird. Ich glaube, dass Netzwerke, die Menschen vereinen, für die Entwicklung der Gesellschaft sehr wichtig sind. Das Hauptnetz ist natürlich das Internet, aber auch der physische Transport von Menschen und Objekten spielt eine grosse Rolle.

Könnte es sein, dass die Flugzeuge veraltet sein werden und durch eine grundlegend neue Art von Transport ersetzt werden?

Ich glaube nicht, dass Flugzeuge in den nächsten 10-20 Jahren veraltet sein werden. Es gibt keinen Grund für die Entstehung radikal neuer Technologien. Die Luftfahrtindustrie ist ein eher konservativer Markt, und das zeigt sich in ihrer Geschichte: Vor 20 Jahren zum Beispiel unterschieden sich Flugzeuge nicht wesentlich von heutigen Flugzeugen. Übrigens, hier sehe ich die Schönheit der Arbeit mit Daten: Man kann die aktuelle Branche nicht mit Hilfe neuer Mechanismen verändern, sondern einfach mit Hilfe der Daten.

Wie wird sich der internationale Datenaustausch verändern – wird er offener?

Mit dem Aufkommen des Internets ist der Datenaustausch bereits für alle Menschen auf der Welt uneingeschränkt möglich geworden. Schwieriger sind natürlich die sensiblen Daten – niemand will sie teilen, aber jeder will das daraus synthetisierte Wissen haben. In diesem Sinne ist maschinelles Lernen ein guter Kompromiss, denn niemand interessiert sich für Rohdaten an sich, was damit jedoch gemacht werden kann, ist interessant. Wenn es eine Maschine gibt, die die Daten analysiert und Wissen anzeigt, das für alle nützlich ist, ist das grossartig. Und es trägt wirklich wesentlich zur Entwicklung der Menschheit bei.

Nun, lasst die Menschheit sich weiterentwickeln! Vielen Dank für das Gespräch und viel Erfolg in deinen Projekten!

Einen Kommentar hinterlassen