Hlasové AI nástroje

00:00:00

Psaní promptů je jen jedna cesta, jak s AI komunikovat. Čím dál více nástrojů umožňuje plnohodnotný hlasový rozhovor – mluvíte, AI vám odpovídá živým hlasem a vy reagujete, jako byste telefonovali s chytrým asistentem. Pro nevidomé uživatele je to přirozená a rychlá cesta. Pro vidoucí zase skvělá alternativa tehdy, kdy nemají ruce volné nebo prostě nechtějí psát.

ChatGPT – hlasový režim

ChatGPT od OpenAI nabízí jednu z nejpokročilejších hlasových funkcí na trhu. V mobilní aplikaci (iOS i Android) stačí klepnout na ikonu sluchátek nebo vlnky a aplikace přejde do hlasového režimu. Nemusíte nic psát – mluvíte přirozeně a ChatGPT vám odpovídá jedním z několika hlasů, které si sami vyberete v nastavení.

Hlasový režim ChatGPT není jen převod textu na hlas. Model skutečně „naslouchá" tónu vašeho hlasu, reaguje na váhání nebo smích a dokáže udržet delší konverzaci s pamětí kontextu. Hodí se na:

  • Brainstorming v pohybu: Procházíte se a přemýšlíte nahlas? ChatGPT vás doplní, polemizuje s vámi a navrhne alternativy.
  • Jazykovou praxi: Hlasový režim je skvělý pro procvičování angličtiny nebo jiného jazyka. AI vás opraví a navrhne přirozenější formulace.
  • Rychlé dotazy bez psaní: „Jaká je dnes předpověď počasí v Brně?" nebo „Připomeň mi, co jsem vám říkal o svém projektu."
  • Čtení a shrnutí: Vložte URL nebo text a nechte si ho přečíst nahlas přirozeným hlasem.

Na počítači (Mac, Windows) hlasový vstup přímo v aplikaci ChatGPT zatím není tak komfortní jako na mobilu, ale lze použít systémové nástroje – na Macu například dikci přes klávesovou zkratku, diktovat příkaz a odeslat ho do chatu.

Claude a hlas – jak na to na Macu

Claude od Anthropic v době psaní tohoto článku nemá vlastní zabudovaný hlasový režim srovnatelný s ChatGPT, ale to neznamená, že s ním nemůžete mluvit. Na macOS existuje několik cest:

  • Dikce macOS (systémová): Kdekoliv v textovém poli aktivujete systémovou dikci (výchozí zkratka je dvojité stisknutí klávesy Fn nebo mikrofon v Touch Baru). Nadiktujete zprávu, systém ji přepíše a vy ji odešlete. Claude odpovídá textem, který si přečtete přes VoiceOver.
  • VoiceOver + webové rozhraní: Claude.ai funguje velmi dobře s VoiceOverem. Navigace po stránce, čtení odpovědí i psaní zpráv přes VoiceOver jsou plně funkční.
  • Aplikace třetích stran: Existují aplikace (například různé AI klienti pro macOS), které kombinují přístup k API Clauda s hlasovým vstupem a TTS výstupem. Výsledkem je plnohodnotný hlasový asistent postavený na Claudovi.

Je reálné očekávat, že Claude v budoucnu vlastní hlasový režim přidá – vývoj v této oblasti jde rychle kupředu.

Siri a Apple Zkratky jako most k AI

Na Apple zařízeních máte v ruce silný nástroj – Siri a aplikaci Zkratky. Pomocí nich si můžete vytvořit hlasové povely, které zavolají libovolné AI API a přečtou vám odpověď nahlas. Výsledkem je například:

  • Řeknete „Hej Siri, zeptej se Clauda na…" a Siri odešle váš dotaz, přijme odpověď a přečte ji.
  • Vlastní zkratka „Shrň mi tento text" – otevře se dialog, nadiktujete obsah a Claude vrátí shrnutí jako hlasovou odpověď přes TTS.
  • Rychlý překlad: „Přelož mi tuto větu do angličtiny" bez otevírání jakékoliv aplikace.

Vytvoření takové zkratky vyžaduje trochu technické zdatnosti, ale na webu existují volně sdílené šablony, které stačí importovat a doplnit vlastní API klíč.

Gemini a hlasové ovládání v Google ekosystému

Pokud používáte Android telefon nebo Chromebook, je Gemini hluboce integrován do systému. Na Androidu ho aktivujete podržením tlačítka Domů nebo vyslovením „Hey Google". Gemini pak dokáže pracovat s jinými aplikacemi ve vašem telefonu, číst zprávy, odpovídat na e-maily nebo vyhledávat v kalendáři – vše hlasem.

Na iOS je Gemini dostupný jako samostatná aplikace s hlasovým režimem. Není tak úzce propojen se systémem jako na Androidu, ale pro samotnou hlasovou konverzaci funguje velmi dobře.

Tipy pro lepší výsledky při hlasovém zadávání

Hlasová komunikace s AI má svá specifika. Zde je několik osvědčených postupů:

  • Mluvte v celých větách: Na rozdíl od vyhledávače AI lépe reaguje na přirozené věty než na klíčová slova. Místo „počasí Brno zítra" zkuste „Jaké bude zítra počasí v Brně?"
  • Říkejte kontext hned na začátku: Pokud chcete konkrétní formát odpovědi, řekněte to předem: „Odpověz mi stručně, maximálně třemi větami…"
  • Klidně opravujte: Pokud vás AI nepochopila nebo odpověděla jinak, než jste čekali, jednoduše řekněte: „To není přesně to, co jsem myslel. Zkus to znovu s důrazem na…"
  • Tiché prostředí pomáhá: Přepis hlasu je přesnější v klidném prostředí. Na rušné ulici je lepší psát nebo použít sluchátka s mikrofonem.

Tip od Zdeňka

Zdeněk radí: Já osobně využívám hlasové ovládání hlavně při procházkách s Nickouškem. Nadiktuji si nápad nebo úkol, Claude mi odpoví a já si výsledek přečtu po příchodu domů přes VoiceOver. Je to jako mít sekretáře v kapse, který vás poslouchá a pamatuje si, co jste mu řekli. Jednou to vyzkoušejte a už nebudete chtít jinak!