About Fintech #10: Voice first? Später vielleicht!

Egal ob im eCommerce oder auch im Banking: Wenn es um die Zugangskanäle der Kunden zu Produkten und Services geht, werden in immer kürzeren Zyklen neue Säue durchs Dorf getrieben. Online ist dabei der etablierte Kanal. Seit dem Siegeszug von iPhone und iPad wird der Platzhirsch aber massiv von Mobile bedrängt. „Mobile first“ bzw. „Mobile Only“ lauten die aktuellen Kampfbegriffe. „Alles kalter Kaffee“, sagen die Vordenker der Branche. Ihre Parole lautet: „Voice first“.

Damit setzen sie auf digitale Assistenten wie Amazons Alexa, Google Home oder Apple Homepod. Die intelligenten Helferlein sind über Mikrofone 24/7 auf Lauschposten und warten darauf, dem Nutzer auf Zuruf nützlich zur Seite zu stehen. „Das ist die Zukunft“, sagen Experten wie Maik Klotz oder Rafael Otero und fordern Firmen dazu auf, sich schnell dieser Schnittstelle zuzuwenden. Auch ich glaube, dass Voice die Zukunft sein wird – die Betonung liegt aber klar auf Zukunft. Und Voice allein wird es wohl nicht richten.

Tobias Baumgarten
Tobias Baumgarten hat auf finletter die aktuellen Fintech-Trends im Blick. Nebenbei bloggt er auf aboutfintech.de.

„Voice first“ in nett, hat aber Nachteile

Dass derzeit viele Menschen noch extrem skeptisch gegenüber Alexa und Co. eingestellt sind, weil sie um ihre Privatsphäre fürchten, wird sich mit der Zeit vielleicht geben. Wobei selbst mir als Techie manchmal ein wenig mulmig wird, wenn Alexa plötzlich losplappert, obwohl ich sie gar nicht angesprochen habe.

Schwerer wiegt, dass „Voice first“ in vielen Anwendungsfällen nicht wirklich zu den menschlichen Vorlieben und Angewohnheiten passt. Sicherlich: Sein Smarthome per Sprache zu steuern, ist schon sinnvoll. Musik abspielen lassen geht auch. Aber für die meisten Dinge will der Mensch mehr. Und zwar Bilder, denn der Mensch ist ein visuelles Wesen.

Wenn ich einen Überblick über meine Kontoumsätze will, sagt ein Bild (oder eine Übersicht) mehr als tausend Worte. Wenn ich Klamotten kaufen möchte, geht das nicht ohne Produktbilder (oder VR). Und auch bei einer Börsenorder will ich über die ganzen Angaben, die ich machen muss, am Ende lieber einmal drüberschauen, als dass ich sie vorgelesen haben möchte.

Sicherheit ist (noch) die Achillesferse

Gerade im Banking kommt allerdings ein noch viel größeres Problem hinzu: die Sicherheit. Eine Überweisung per Alexa oder Siri vorzunehmen, ist heute technisch grundsätzlich schon möglich. Aber ist es auch sicher? Da sind Zweifel angebracht. Denn die aktuellen Lösungen via Alexa setzen alle darauf auf, dass ich die Überweisung mit einer Pin bestätige. Die spreche ich aber frei in den Raum – und jeder, der anwesend ist, hört sie. Das ist, als wenn ich meine Pin am schwarzen Brett aushänge.

Überweisungen werden zwar meist noch über einen zweiten Faktor abgesichert (Fingerprint bei Siri, smsTAN bei Alexa). Letztlich ist dieser zweite Faktor aber der einzige Sicherheitsfaktor, weil die Pin bei Voice-Anwendungen quasi per Design unsicher ist. Hier werden sich die Entwickler noch etwas Neues einfallen lassen müssen. Ein Ansatz könnte Stimmerkennung statt Spracherkennung sein. Die Stimme ist ja ähnlich individuell wie der Fingerabdruck. Es käme dann also nicht nur darauf, was gesagt wird, sondern auch von wem. Das könnte dann der zweite sichere Faktor sein. Wobei sich hier wiederum die Frage stellt, ob so ein System nicht mit simplen Aufnahmen ausgetrickst werden kann.

Warten auf die Killeranwendung

Die schlauen Köpfe der Branche werden dafür aber sicherlich eine Lösung finden. Bleibt die Frage nach der Killeranwendung, die Voice zum richtigen Druchbruch verhilft. Meine Alexa verkommt seit Monaten zu einer reinen Musikbox, weil sie eigentlich nichts besser kann als mein Smartphone. Weder im Shopping noch im Banking konnte mich bisher eines der immer zahlreicheren Angebote wirklich überzeugen.

Wenn ich meine Überweisung eh mit einer smsTAN absichern und dafür zum Smartphone greifen muss, warum dann nicht gleich alles darüber abwickeln? Wo ist der Mehrwert von Voice? Den Börsenkurs einer Aktie über einen Skill (so heißen die Apps für Alexa) abrufen? Ok, aber die Einzelkurse meines gesamtes Depots? Hell no! In seiner jetzigen Form wird Voice nicht durchstarten.

Wie die Zukunft aussehen könnte

Aber die Zukunft wird – wie so oft – nicht schwarz-weiß sein. „Voice first“ kann dann zum Erfolg werden, wenn es mit anderen Technologien kombiniert wird. Amazon hat das erkannt und die neueste Generation seiner Echo-Familie um ein Gerät mit Bildschirm ergänzt. Hierfür würden mir schon deutlich mehr Use Cases einfallen. Noch mehrwertiger wären im Rahmen eines Smarthomes die Kombination mit weiteren Bildschirmen zum Beispiel am Smart-TV oder auf dem Smartphone.

Ein „Voice only“ dürfte dagegen keine Zukunft haben, zumindest nicht im Banking. Für viele Banken und Fintechs dürfte aber bereits „Voice first“ eine große Herausforderung bleiben. Nur wenige von ihnen sind bereits auf den Zug aufgesprungen. Allen voran ist hier die Comdirect mit ihrem Alexa-Skill zu nennen. Auch die Sparkassen haben auf ihrem Symbioticon-Hackathon zumindest Witterung aufgenommen.

Schöne neue Welt. Lassen wir uns mal überraschen, was da noch so kommt. Bis dahin bleibt mir nur: „Alexa, spiel meine Alternative Rock-Playlist!“

Tobias Baumgarten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.