voice assistent

Luister – voordat je verder leest – eerst even naar dit telefoon gesprek. Gewoon… een reservering voor de kapper door een digitale voice assistent!

Google voice Assistent maakt een reservering bij kapper (mei 2018)

spraak vandaag & morgen

Een voice assistent zoals Google Assistent, Amazon Alexa of Apple Siri wordt veelal gebruikt om algemene vragen te beantwoorden, de weersvooruitzichten te vertellen, muziek te streamen of als intelligente, persoonlijke assistent voor het managen van agenda’s, ’to do’ taken en herinneringen. Een persoonlijke voice assistent wordt echter hét toekomstige hart van ons slimme huis. En gaan niet alleen alle ‘on the spot’ en vooraf geplande taken uitvoeren, maar ook al onze slimme apparaten met elkaar verbinden. 

Van smartphones tot auto’s: inmiddels kun je technologie voor spraakherkenning bijna overal terugvinden. Maar wat is de geschiedenis, wat zijn vandaag de meest gebruikte toepassingen van de voice assistent en hoe ziet de toekomst er uit? Kortom… hoe gaan de voice assistent en de onderliggende spraak technologie ons leven beheren en beheersen!?

de mens is uniek

Wat maakt ons als mens uniek; wat onderscheidt ons – tot op heden  – van alle andere levensvormen? Onze mogelijkheid tot communiceren via spraak. We kunnen – naast onze lichaamstaal – woorden, zinnen en intonaties gebruiken om uit te drukken wat er in ons omgaat. Er is geen ander levend wezen wat daar toe in staat is. Praten is voor ons ook het meest natuurlijke om te doen en staat als communicatiemiddel het dichtste bij ons. Maar de voice assistent komt er aan…

De hedendaagse voice assistent ontwikkelt zich sneller dan de communicatie die vroeger ook via drums ging.
van communicatie via drums naar een voice assistent

Want de technologie gaat ons voorbij streven. Tot op heden bedienen we apparaten om ons heen met knoppen, toetsenborden, muizen of aanraakschermen. Maar ook dat gaan we vermenselijken… Spraakherkenning is daarbij  de technologie die voor de praatgrage mens dus ultiem natuurlijk aanvoelt. Als mens hebben we er vele eeuwen over gedaan om onze spraak te vormen en te perfectioneren. Maar de ontwikkeling van kunstmatige spraaktechnologie die sturing geeft aan de voice assistent gaat echt razendsnel…

geschiedenis van de voice assistent

Spraakherkenning is een technologie waarmee computers gesproken woorden kunnen herkennen en verwerken. Gezien de voortschrijdende (kunstmatige) intelligentie van computers, klinkt het misschien eenvoudig om een technologie aan te leren hoe het woorden en/of getallen kan herkennen. Daar komt echter nog veel bij kijken.

de ontwikkeling van spraak via een voice assistent is minder logisch dan het lijkt
ontwikkeling van voice assistent niet makkelijk

Iedere mens – en iedere taal  – is immers uniek en dat heeft effect op de manier waarop we spreken en hoe onze stem klinkt. Een vrouw heeft doorgaans een hogere stem dan een man en in Friesland heeft men een andere intonatie dan in Limburg. Combineer dat met verschillende spraaksnelheden en de altijd aanwezige achtergrondgeluiden en je begrijpt waarschijnlijk dat alleen al het herkennen van enkele woorden niet zo vanzelfsprekend is als het in eerste instantie lijkt.

Spraakherkenning moet overigens onderscheiden worden van stemherkenning; een biometrische techniek om een bepaalde persoon aan de hand van zijn stem te kunnen identificeren. De methoden om beide te realiseren zijn echter wel nauw verwant.

de eerste stappen

De eerste technologie die gebruik maakte van stemherkenning dateert uit de jaren 50. Bell Laboratories ontwikkelde in 1952 het ‘Audrey’-systeem, dat getallen herkende die door één stem werden uitgesproken. Dat kon je moeilijk al spraakherkenningstechnologie noemen. De software begreep immers maar een handvol woorden. Maar het bracht de eerste bruikbare toepassingen. Denk aan een automatisch antwoordapparaat dat verschillende menukeuzes geeft. Door het juiste getal uit te spreken, ga je naar het menu van jouw keuze. Het was een eerste stap; een eerste ontwikkeling.

De voice assistent heeft de laatste decennia een grote doorontwikkeling meegemaakt.
voice assistent vooral laatste jaren stevig doorontwikkeld

Maar in woorden uitleggen naar welk menu je wilt gaan, was nog niet mogelijk. De technologie was nog niet in staat om natuurlijke spraak te begrijpen. Ruim 10 jaar later werden (korte) woorden toegevoegd aan de mogelijkheden van spraakherkenningssystemen. In 1962 demonstreerde IBM tijdens de World’s Fair de ‘Shoebox’-machine. Die  was in staat om getallen van nul tot negen én zestien Engelse woorden te verstaan.

doorontwikkeling naar een voice assistent

Vanaf begin jaren ‘90 zien we de commerciële spraakherkenningsprogramma’s ontstaan. In 1996 bracht – wederom – IBM de OS/2 Warp op de markt; een besturingssysteem met ingebouwde spraakherkenning. Het Nederlandse Philips ontwikkelde het programma FreeSpeech, waarvan FreeSpeech 2000 de laatste versie was voor de consumentenmarkt. Philips legde zich daarna alleen nog toe op spraakherkenning voor professionele toepassingen, maar verkocht de spraakherkenningspoot uiteindelijk aan het Amerikaanse bedrijf Nuance Communications Inc.

naturally speaking

Nuance (NASDAQ: NUAN ) is wereldwijd de toonaangevende leverancier van spraak- en taaloplossingen voor bedrijven en consumenten met onder meer zijn spraakherkenningsoftware Dragon NaturallySpeaking. Met deze software voor je PC is het mogelijk om met je eigen stem e-mailberichten naar vrienden te sturen, zoekopdrachten op internet uit te voeren, huiswerk te dicteren, je agenda bij te houden, te chatten, sociale media te onderhouden en nog veel meer.

vandaag

Maar het gaat inmiddels veel verder dan alleen software voor de PC… bedrijven als Google en Amazon hebben – net als Microsoft en Apple – digitale assistenten ontwikkeld die met je stem te besturen zijn en waar je dus gewoon mee praat. Een PC is daar niet voor nodig. Deze assistenten draaien op je telefoon of – nog interessanter- zijn geïntegreerd in apparaten zoals speakers, televisies of horloges.

Binnen enkele jaren praten we meer met onze voice assistent dan met een partner.
wie is straks populairder… voice assistent of partner?

een nieuw huwelijk

Eigenlijk zijn de (toekomstige) mogelijkheden bijna eindeloos. En heb je feitelijk dus de beschikking over een soort van pratende assistent; je eigen PA. Uuuuhm…. digitaal weliswaar… maar  wie wil dat nou niet! In 2020 zal de gemiddelde persoon naar verwachting meer gesprekken voeren met een voice assistent en de daarvan afgeleide chatbots dan met hun echtgeno(o)t(e). Na het beluisteren van telefoongesprekken die Google voice assistent in mei 2018 al zelfstandig kon voeren, lijkt dat geen onlogische veronderstelling…

Google Assistent reserveert restaurant (mei 2018)