V nekaterih podjetjih so se na pisalnih mizah nenadoma znašli konferenčni mikrofoni, saj vse več delavcev opušča tipkovnice in navodila svojim računalnikom raje šepetajo.
Programska oprema za pretvorbo glasu v besedilo do nedavnega nikakor ni delovala, kot bi morala, zdaj pa je ta funkcija, zahvaljujoč napredku umetne inteligence, ki raztresenost govorjene besede pretvori v nekaj bolj uporabnega, postala izvedljiva. Glasovni način pridobiva priljubljenost, saj njegove prve uporabnike neustavljivo privlači obljuba vedno večje produktivnosti. Narekovanje e-pošte in poročil namesto tipkanja pomeni, da lahko (kot to obljublja eno od zagonskih podjetij, ki trži to tehnologijo) to počnete "s hitrostjo misli". Orodja so v pomoč tudi delavcem z invalidnostjo ter razvijalcem programske opreme, ki želijo klepetalnim robotom podati podrobna navodila.
"Ko tipkate, so vaše poizvedbe preprosto zanič," pravi Tanay Kothari, soustanovitelj in izvršni direktor zagonskega podjetja Wispr iz San Francisca, ki se ukvarja s prepisovanjem. Govorjene poizvedbe so po njegovih navedbah običajno daljše in podrobnejše. "Ko tipkajo, inženirji napišejo le: odpravi to napako. A napake to ne bo odpravilo."
Jack Flame Sorokin za Bloomberg Businessweek
Z najnovejšim razvojem na področju umetne inteligence se je začela brezglava dirka za prevlado v kateremkoli kotičku razvijajočega se področja. Januarja je Apple z Googlom sklenil dogovor za približno milijardo dolarjev letno, in sicer za uporabo modelov Gemini za pomoč pri poganjanju virtualnega asistenta Siri, kot poroča Bloomberg News. Amazon je na trgu predstavil prenovljenega glasovnega asistenta Alexa+, Microsoft pa svetlečo kroglico po imenu Mico, ki jo tržijo kot "emotiven, prilagodljiv in priljuden" vizualni avatar za njihovega klepetalnega robota Copilot; njegova naloga je, da pogovor z umetno inteligenco spremeni v bolj naraven. V podjetju Wispr pravijo, da vsak teden oskrbijo od 150 do 200 novih ekip, pogosto začenši na enem oddelku – kot sta prodaja in inženiring – v globalnih podjetjih, podjetjih tveganega kapitala in zagonskih podjetjih v Silicijevi dolini. Svetovalno podjetje Grand View Research že samo rastoči trg generatorjev glasu z umetno inteligenco ocenjuje na 7,7 milijarde dolarjev letos in napoveduje, da bo do konca desetletja dosegel vrednost 21,8 milijarde.
A tudi prepričljiv izdelek je včasih težko prodati. Ravnodušnost je še kako prisotna zaradi dolgih let neizpolnjenih obljub o glasovnih asistentih in številna podjetja se le težko pripravijo do tega, da bi dala priložnost novim orodjem. Tehnologija prepisovanja kljub izboljšani natančnosti še vedno dela napake – poleg tega vse naloge niso enako primerne za glasovno obdelavo. Občutljivi pogovori ali ocene uspešnosti nimajo v narekih kaj iskati. Prav tako lahko včasih malce traja, da se vam misel povsem razjasni, to pa se pogosto najlažje doseže prav s pisanjem in prepisovanjem. Včasih naj bi bila "hitrost misli" v resnici počasna.
"Malce je res čudno," priznava Yash Tekriwal, vodja izobraževanja na prodajni in marketinški platformi Clay v New Yorku. To, da se je lani v pisarni odprtega tipa začel na glas pogovarjati s svojim računalnikom, je bila za njegove sodelavce novost, na katero se je bilo treba navaditi. "Ali Yash govori z mano," Yash ugiba njihove misli, "ali se zgolj pogovarja sam s sabo?"
Jack Flame Sorokin za Bloomberg Businessweek
Če odmislimo to nerodnost, je glasovni način Tekriwalu pisan na kožo, saj je že od nekdaj obseden s produktivnostjo. Kot številni pisarniški uslužbenci ima tudi sam veliko dela z odgovarjanjem na e-pošto in sporočila na Slacku, s pomočjo glasovnega načina pa se skoznje prebija hitreje. Po lastni oceni v povprečju izgovori okoli 205 besed na minuto, medtem ko jih natipka od 110 do 120. "Zdaj le s težavo gledam koga, ki tipka, saj gre vse tako zelo počasi," pravi Tekriwal in dodaja, da po njegovem zgledu zdaj narekovanje uporabljajo tudi vsi člani njegove ekipe, zraven pa še polovica preostale pisarne.
V zagonskem podjetju Boosted.ai iz Toronta, ki je lani na svojo platformo za upravljanje naložb dodalo glasovne funkcije, pravijo, da se orodje med upravljavci sredstev in drugimi institucionalnimi strankami še ni prijelo. Večina analitikov in vlagateljev, ki uporabljajo platformo, je preizkusila funkcijo, ki poročila prebira z glasom, ustvarjenim z umetno inteligenco, precej manjši delež pa se jih je na prebrano odzvalo z govorom. Izvršni direktor Josh Pantony ima načrt: podjetje razvija funkcijo, ki bo njihovemu glasovnemu asistentu Alfa omogočila, da se zaposlenim pridruži na sestankih in na njih tudi sodeluje. Cilj te novosti je, da se pogovor z računalnikom bolj približa klepetu s sodelavcem.
Kothari iz podjetja Wispr ve, da opustitev tipkovnice zahteva nekaj časa. Uporabniki po njegovih ocenah potrebujejo približno dva do tri tedne, da se navadijo na uporabo glasu. "To je družbena sprememba, do katere mora priti," pravi Kothari. "Če se pogovarjate s svojim računalnikom, niste nori."