Már hanggal is kommunikálhatunk a ChatGPT-vel II. 

-tapasztalatok-

Bevezető

 2023. november 15. | Szabó Máté

A chatbot ingyenes változatában már elérhető a hangalapú interakció, így akár magyar nyelven is beszélgethetünk a ChatGPT-vel, mintha egy valódi személlyel csevegnénk.

Az új funkció az OpenAI frissítési körének része, beleértve a képekkel kapcsolatos kérdések megválaszolását.

voice-over

Elérhetőség, beállítások

Ez a szolgáltatás eddig csak a chatbot előfizetéses verziójánál volt elérhető, viszont már bárki igénybe veheti, aki az androidos vagy az iOS-es alkalmazáson keresztül használja a ChatGPT-t. A hangalapú társalgáshoz elég a képernyő alján található szövegdoboz melletti fejhallgató ikonra kattintanunk, majd kiválasztani az öt hangséma közül azt, amelyik a legszimpatikusabb. 

Ha a későbbiekben meggondolnánk magunkat, és azt szeretnénk, hogy a ChatGPT másik hangon kommunikáljon velünk, ezt a beállításokban, a “Voice” menüpont alatt tudjuk megváltoztatni.

 

 

A chatbot nem csak a hanghordozásában tűnik sokkal emberszerűbbnek, mint bármelyik hangasszisztens, de a beszélgetések is sokkal inkább tükrözik egy valódi párbeszéd jellegzetességeit: a ChatGPT tökéletesen szerkesztett, kerek mondatokban kommunikál velünk, adott esetben visszakérdez, ráadásul nem is kell minden alkalommal külön hangutasítással felébresztenünk, ha mondani akarunk neki valamit.

ChatGPT-voice-1

Éberen figyel

Ez a program egyik legérdekesebb funkciója, ami ugyanakkor sokak számára kifejezetten aggasztó is lehet. Mivel az alkalmazás a háttérben is tud futni, így hacsak nem zárjuk be minden használat után, a ChatGPT folyamatosan figyel, arra várva, hogy kérdezzünk tőle valamit. 

Emiatt aztán az is előfordulhat, hogy már régen mással foglalkozunk, amikor a “még mindig ott vagy?” kérdésre a ChatGPT azonnal válaszol, hogy igen, majd emlékeztet rá, hogy hol tartunk a beszélgetésben. Ez a megoldás kétségkívül sokkal intuitívabbá teszi a chatbot használatát, ráadásul rendkívül jól jön olyan helyzetekben, amikor a mesterséges intelligenciát akarjuk segítségül hívni egy feladat megoldásához. A hangos ChatGPT-nél megtehetjük például azt is, hogy miután elindítottuk a beszélgetést, a Chrome-ban megnyitunk egy feladatot, az abban szereplő kérdéseket pedig egyszerűen kimondjuk hangosan, és pillanatokon belül kapjuk rá a választ.

 

Az OpenAI oldalán fellelhető információk szerint a ChatGPT nem rögzíti a hangunkat, hanem azt egyből továbbküldi a Whisper API-nak, ami a hangosan kimondott mondatokat írott szöveggé konvertálja, majd egy másik modell a ChatGPT által erre adott szöveges választ visszaalakítja hangos beszéddé. Ez azt is jelenti, hogy a chatbottal élőszóban folytatott beszélgetéseink ugyanúgy tárolódnak, mint a többi társalgásunk és azokat utólag írásos formában vissza is tudjuk olvasni. 

Emberszerű beszélgetés

Ami vitán felül áll, hogy a ChatGPT-vel való beszélgetés sokkal természetesebbnek hat, mint amikor az Amazon Alexától vagy a Google Hangsegédtől kérdezünk valamit, ez pedig nem csak abban nyilvánul meg, hogy az OpenAI chatbotja emberibben fejezi ki magát, de például töredékes, nem jól megfogalmazott mondatokból is ki tudja hámozni, hogy mit akartunk mondani – pont, mint egy valódi ember. A felhasználási lehetőségei emiatt nyilvánvalóan nagyon sokrétűek.

Hasson ugyanakkor bármennyire is meggyőzőnek az emberien kommunikáló chatbot, azt azért nem szabad elfelejteni, hogy a ChatGPT továbbra is ugyanazt a nagy nyelvi modellt (ingyenes verziónál a GPT-3.5-öt, fizetősnél pedig a GPT-4-et) használja, mint eddig, vagyis az általa elmondott információk akár teljesen tévesek is lehetnek. Mivel a GPT-3.5 adatbázisa csak 2021 szeptembere előtti információkat tartalmaz, az aktuális időjárással kapcsolatos kérdésekre például egyeltalán nem kellene tudnia válaszolni.

 

Személyes tapasztalatok, összegzés

Véleményem szerint ahogy írásban, úgy szóban is kiemelkedő válaszokat kapunk a hangalapú szoftvertől. Habár bizonyos esetekben még hallucinál (mint például: ha megkérdezem milyen lesz holnap az idő, arra egy határozott választ kapok, de azt már nem tudjuk meg, hogy honnan van ez az információ), bizonytalan hátterű dolgokat mond, de mindezt kifejezetten érthető akcentussal teszi az esetek 80-90%-ában. Angolul a teljes beszélgetés alatt hibátlanul tudtunk kommunikálni természetesen.

Akár jogi szempontból is nagyon érdekes funkció (erről mindenbizonnyal beszámolunk még később), hogy az applikációt lehetséges a háttérben is futtani; ilyenkor csendben marad és figyel, ha pedig időközben kérdezünk tőle, készségesen válaszol akár visszaidézve teljes egészében a korábban beszélt mondatokat.

LEGFRISSEBB BEJEGYZÉSEINK:

Új technológiák és kihívások

Az olyan csevegőrobotokat, mint a GPT, nagy mennyiségű adat és..

ChatGPT - Így tanul tőlünk

A ChatGPT a GPT-3 adaptált modellje, amely nem kizárólag felügyelet nélküli..

Chatbot típusok

A legkezdetlegesebb chatbot típus a menüvezérelt...