loader

Dzisiejsza technologia umożliwia przeprowadzenie swobodnej rozmowy telefonicznej z różnymi rodzajami rozwiązań głosowych. Pozwalają one na zastąpienie człowieka w miejscach, gdzie konwersacja u podstaw sprowadza się do zestawu wypowiedzi oraz odpowiedzi, powtarzalnych w każdej rozmowie. Hellobot jako bot głosowy pozwala na kompleksowe przetwarzanie zapytań użytkownika, udostępniając szereg różnego rodzaju możliwości o charakterze sztucznej inteligencji oraz integrację z różnymi systemami. 

Kilka słów wstępu

Klienci Hellobota mogą korzystać z wielu ciekawych funkcjonalności, które podnoszą komfort rozmowy z botem oraz pozwalają na zrealizowanie skomplikowanych scenariuszy zgodnych z  założeniami biznesowymi danej firmy. Voicebot odnajdzie się w wielu różnych dziedzinach życia. Jego ograniczeniem jest wyłącznie kreatywność klienta, wspieranego przez doświadczony zespół programistów. 

U podstaw każdej rozmowy z Hellobotem leży scenariusz, którego poziom skomplikowania zależy od celów biznesowych, jakie chcemy zrealizować. Scenariusz porównać możemy do drzewa decyzyjnego. Każde pytanie bota oraz odpowiedź użytkownika i zawarte w niej informacje przesuwają rozmówcę dalej, przechodząc przez kolejne elementy składowe, które nazywane są akcjami. Dotyczą one różnych kwestii – od podstawowych umiejętności mówienia i słuchania, poprzez rozpoznawanie intencji oraz ekstrahowanie encji, realizowanie zapytań HTTP do dowolnych systemów zewnętrznych, kończąc na odgrywaniu komunikatów RODO, przekierowywaniu rozmowy lub raportowaniu wyników rozmów.  Modularność tworzenia scenariuszy pozwala na powtórne wykorzystywanie pewnych powtarzających się elementów, co w znaczący sposób wpływa na skrócenie czasu implementacji.  

Przykładowy diagram scenariusza:

Szeroka lista funkcjonalności oraz możliwości Hellobota pozwala umieszczać to rozwiązanie w kategorii bardzo zaawansowanych systemów głosowych, pozwalających na kompleksowe przetwarzanie rozmowy z człowiekiem. W skład najważniejszych funkcjonalności wchodzą:

  • Mówienie i słuchanie
  • Jedna wypowiedź – wiele informacji
  • Unikalność konwersacji
  • Weryfikacja adresów
  • Obsługa płatności
  • Rozpoznawanie płci
  • Integracja z zewnętrznym REST API


1. Mówienie i słuchanie

To podstawowe zadanie każdego rozwiązania głosowego, którego poprawna implementacja i wykorzystanie jest pierwszym krokiem do sukcesu całego scenariusza.

W określonych miejscach rozmowy bot wypowiada konkretne, sprecyzowane wcześniej kwestie, przygotowane przez specjalistę. Treść wypowiedzi jak i jej długość mogą być dowolne. Głównymi narzędziami wykorzystywanymi do tego celu są Google Text-to-Speech oraz Azure Text-to-Speech, które udostępniają podobny zestaw funkcjonalności: możliwość literowania, odczytywania dat, wykonywania przerw w wypowiedzi oraz wiele więcej. Do dyspozycji twórców dostarczone są parametry takie jak szybkość wypowiedzi lub rodzaj głosu komputerowego lektora. Niezwykłą zaletą obu rozwiązań jest obecność języka polskiego, przystępne widełki cenowe oraz pewność prawidłowego funkcjonowania narzędzi rozwijanych przez specjalistów.

Odpowiedź użytkownika na kwestie wypowiadane przez bota jest niezwykle ważna. Jako narzędzie rozpoznawania mowy Google Speech-To-Text sprawdza się w tym zadaniu idealnie. Konwersja mowy na tekst zwykle zakończona jest pełnym sukcesem, co ma znaczący wpływ na komfort rozmowy.

2. Jedna wypowiedź – wiele informacji 

Sformułowanie oraz postawienie pytania, a następnie prawidłowe rozpoznanie odpowiedzi to w dzisiejszych czasach za mało. Podczas rozmowy z botem użytkownik chce zazwyczaj rozwiązać swój problem – wymaga to odpowiedniego zrozumienia oraz interpretowania uzyskanych od niego informacji. Wychodząc naprzeciw oczekiwaniom klientów, Hellobot został wyposażony o odpowiednie mechanizmy sztucznej inteligencji dostarczone przez narzędzie wit.ai, pozwalające na kategoryzowanie wypowiedzi oraz wyłuskiwanie z niej określonych informacji. 

Poniższy schemat pokazuje pozyskanie dwóch informacji o pizzy: ‘size’ i ‘type’. Dodatkowo bot pyta o ‘dough’, bo tej informacji mu brakuje. W drugim przykładzie nie ma żadnych informacji o pizzy, więc bot zadaje pytanie ogólne.

Dzięki temu, po uprzednim przygotowaniu kontekstu aplikacji wit.ai oraz prawidłowym douczeniu sieci, wypowiedź użytkownika może zostać skategoryzowana, a interesujące nas informacje wyodrębnione, co ma realny wpływ na przebieg rozmowy. Przy odpowiednim zaprojektowaniu scenariusza rozmowy, uzyskanie wielu informacji na jej początku pozwala diametralnie skrócić przebieg zamówienia. W rezultacie rozmowa z botem staje się bardziej ludzka, ponieważ słusznie odnosi się wrażenie, że bot w pełni rozumie potrzeby rozmówcy oraz zapisuje przekazywane przez niego informacje. Jedno proste pytanie: „Cześć, jak mogę Ci pomóc?” sprawia, że rozmowa staje się bardziej otwarta i swobodna niż w liniowym scenariuszu zbudowanym z wielu schematycznych pytań.  

3. Unikalność konwersacji

Głównym powodem niechęci do rozmów z botami jest przeświadczenie, że są one nudne i monotonne. Kilkukrotna rozmowa z tym samym botem w celu rozwiązania danego problemu prowadzi do niechęci spowodowanej wysłuchiwaniem wciąż tych samych komunikatów. W tym celu zespół realizujący Hellobota przygotował funkcjonalność pozwalającą na prowadzenie unikalnych rozmów. Podczas projektowania wypowiedzi bota, zamiast dostarczać jedną, sztywną wypowiedź, autor ma możliwość przygotowania wielu różnych treści, które będą występowały losowo. Dzięki temu po przygotowaniu odpowiednio dużej bazy wypowiedzi, każda rozmowa staje się unikalna, ponieważ prawdopodobieństwo powtórzenia dokładnie tych samych kwestii jest niewielkie. Rozmówca, który po raz kolejny rozmawia z botem nie jest nim znudzony i może z zaciekawieniem czekać na kolejne odpowiedzi. 

4. Weryfikacja adresów

To funkcjonalność, która stawia nasze rozwiązanie głosowe w całkowicie nowym, wcześniej rzadko spotykanym świetle. Podczas rozmowy z człowiekiem Hellobot może w pełni kompleksowo obsłużyć rozpoznawanie adresu, którego poprawność walidowana jest przy pomocy Azure Maps. Jeżeli jest poprawny, bot kontynuuje rozmowę. W przypadku błędów lub braków potrafi z kolei dopytać o konkretne, brakujące parametry takie jak ulica lub numer budynku. 

Sytuacji, w których można wykorzystać tę funkcjonalność jest mnóstwo. Prawidłowe rozpoznanie i zapisanie adresu pozwala na określenie miejsca spotkania lub dostarczenia zamówienia, a zaimplementowana walidacja wyklucza ewentualne błędy lub niezrozumienie. 

5. Obsługa płatności

W dobie pandemii możliwość ograniczenia kontaktu z drugim człowiekiem w sytuacjach, które go nie wymagają jest niezwykle ważną i cenioną funkcjonalnością. Dlatego Hellobot został wyposażony w mechanizmy umożliwiające przetwarzanie płatności online. Takie rozwiązanie znajduje zastosowanie w wielu codziennych sytuacjach, jak opłacenie zamówienia lub uregulowanie należności. Proces jest natomiast niezwykle prosty. Gdy rozmówca zdecyduje się na płatność internetową, bot przesyła na jego numer SMS z linkiem do płatności, która może być zrealizowana przy pomocy najbardziej popularnych metod udostępnionych przez Przelewy24. Wówczas pieniądze natychmiast docierają do celu, co w znaczący sposób zwiększa komfort użytkownika końcowego.

6. Rozpoznawanie płci

Bot jest w stanie określić, jakiej płci jest rozmówca na podstawie jego wypowiedzi. Dzięki temu scenariusz może być bardziej spersonalizowany, a użytkownik słyszy prawidłowo odmienione zdania. Weryfikacja odbywa się na podstawie transkrypcji jego wypowiedzi. Pozwala to wykluczyć błędne rozpoznanie płci mężczyzny o wysokim lub kobiety o niskim tonie głosu. 

7. Integracja z zewnętrznym REST API

Podczas rozmowy Hellobot wykorzystuje dane pobierane na żywo z systemów wewnętrznych klienta poprzez komunikację zapytaniami HTTP oraz w analogiczny sposób informuje system klienta o efektach rozmowy. Dzięki temu dostarczanie niezbędnych danych jest niezwykle proste, wygodne i efektywne. Istnieje wiele różnych przypadków, w których taka komunikacja usprawnia proces realizowany przez bota. Potrzeba pobrania informacji może wynikać z rozmowy lub być pierwszym krokiem, który w zależności od danych, spersonalizuje rozmowę pod konkretnego rozmówcę. Komunikacja odbywa się w dwie strony. Hellobot może na bieżąco informować o efektach rozmowy lub sterować ważnymi procesami zależnymi od scenariusza.

Podsumowanie

Hellobot zapewnia możliwość zrealizowania otwartej rozmowy opartej o sztuczną inteligencję mogącą analizować i interpretować wypowiedzi użytkownika. Implementacja przeprowadzona zgodnie ze sztuką oraz możliwość skalowania pozwala na przetwarzanie wielu jednoczesnych połączeń, dzięki czemu bot bezproblemowo radzi sobie z pracą pod ciągłym obciążeniem. Wykorzystanie najlepszych rozwiązań firm zewnętrznych usprawnia jego pracę, dzięki czemu ma on możliwość przetwarzania rozbudowanych scenariuszy dotyczących różnych dziedzin życia codziennego. Charakterystyka rozwiązania oparta o modularność skraca czas realizacji oraz udostępnia możliwość ciągłego rozwoju, zależnego od wymagań rynkowych lub nowych trendów w dziedzinie asystentów głosowych.