Hlasové AI nástroje
Psaní promptů je jen jedna cesta, jak s AI komunikovat. Čím dál více nástrojů umožňuje plnohodnotný hlasový rozhovor – mluvíte, AI vám odpovídá živým hlasem a vy reagujete, jako byste telefonovali s chytrým asistentem. Pro nevidomé uživatele je to přirozená a rychlá cesta. Pro vidoucí zase skvělá alternativa tehdy, kdy nemají ruce volné nebo prostě nechtějí psát.
ChatGPT – hlasový režim
ChatGPT od OpenAI nabízí jednu z nejpokročilejších hlasových funkcí na trhu. V mobilní aplikaci (iOS i Android) stačí klepnout na ikonu sluchátek nebo vlnky a aplikace přejde do hlasového režimu. Nemusíte nic psát – mluvíte přirozeně a ChatGPT vám odpovídá jedním z několika hlasů, které si sami vyberete v nastavení.
Hlasový režim ChatGPT není jen převod textu na hlas. Model skutečně „naslouchá" tónu vašeho hlasu, reaguje na váhání nebo smích a dokáže udržet delší konverzaci s pamětí kontextu. Hodí se na:
- Brainstorming v pohybu: Procházíte se a přemýšlíte nahlas? ChatGPT vás doplní, polemizuje s vámi a navrhne alternativy.
- Jazykovou praxi: Hlasový režim je skvělý pro procvičování angličtiny nebo jiného jazyka. AI vás opraví a navrhne přirozenější formulace.
- Rychlé dotazy bez psaní: „Jaká je dnes předpověď počasí v Brně?" nebo „Připomeň mi, co jsem vám říkal o svém projektu."
- Čtení a shrnutí: Vložte URL nebo text a nechte si ho přečíst nahlas přirozeným hlasem.
Na počítači (Mac, Windows) hlasový vstup přímo v aplikaci ChatGPT zatím není tak komfortní jako na mobilu, ale lze použít systémové nástroje – na Macu například dikci přes klávesovou zkratku, diktovat příkaz a odeslat ho do chatu.
Claude a hlas – jak na to na Macu
Claude od Anthropic v době psaní tohoto článku nemá vlastní zabudovaný hlasový režim srovnatelný s ChatGPT, ale to neznamená, že s ním nemůžete mluvit. Na macOS existuje několik cest:
- Dikce macOS (systémová): Kdekoliv v textovém poli aktivujete systémovou dikci (výchozí zkratka je dvojité stisknutí klávesy Fn nebo mikrofon v Touch Baru). Nadiktujete zprávu, systém ji přepíše a vy ji odešlete. Claude odpovídá textem, který si přečtete přes VoiceOver.
- VoiceOver + webové rozhraní: Claude.ai funguje velmi dobře s VoiceOverem. Navigace po stránce, čtení odpovědí i psaní zpráv přes VoiceOver jsou plně funkční.
- Aplikace třetích stran: Existují aplikace (například různé AI klienti pro macOS), které kombinují přístup k API Clauda s hlasovým vstupem a TTS výstupem. Výsledkem je plnohodnotný hlasový asistent postavený na Claudovi.
Je reálné očekávat, že Claude v budoucnu vlastní hlasový režim přidá – vývoj v této oblasti jde rychle kupředu.
Siri a Apple Zkratky jako most k AI
Na Apple zařízeních máte v ruce silný nástroj – Siri a aplikaci Zkratky. Pomocí nich si můžete vytvořit hlasové povely, které zavolají libovolné AI API a přečtou vám odpověď nahlas. Výsledkem je například:
- Řeknete „Hej Siri, zeptej se Clauda na…" a Siri odešle váš dotaz, přijme odpověď a přečte ji.
- Vlastní zkratka „Shrň mi tento text" – otevře se dialog, nadiktujete obsah a Claude vrátí shrnutí jako hlasovou odpověď přes TTS.
- Rychlý překlad: „Přelož mi tuto větu do angličtiny" bez otevírání jakékoliv aplikace.
Vytvoření takové zkratky vyžaduje trochu technické zdatnosti, ale na webu existují volně sdílené šablony, které stačí importovat a doplnit vlastní API klíč.
Gemini a hlasové ovládání v Google ekosystému
Pokud používáte Android telefon nebo Chromebook, je Gemini hluboce integrován do systému. Na Androidu ho aktivujete podržením tlačítka Domů nebo vyslovením „Hey Google". Gemini pak dokáže pracovat s jinými aplikacemi ve vašem telefonu, číst zprávy, odpovídat na e-maily nebo vyhledávat v kalendáři – vše hlasem.
Na iOS je Gemini dostupný jako samostatná aplikace s hlasovým režimem. Není tak úzce propojen se systémem jako na Androidu, ale pro samotnou hlasovou konverzaci funguje velmi dobře.
Tipy pro lepší výsledky při hlasovém zadávání
Hlasová komunikace s AI má svá specifika. Zde je několik osvědčených postupů:
- Mluvte v celých větách: Na rozdíl od vyhledávače AI lépe reaguje na přirozené věty než na klíčová slova. Místo „počasí Brno zítra" zkuste „Jaké bude zítra počasí v Brně?"
- Říkejte kontext hned na začátku: Pokud chcete konkrétní formát odpovědi, řekněte to předem: „Odpověz mi stručně, maximálně třemi větami…"
- Klidně opravujte: Pokud vás AI nepochopila nebo odpověděla jinak, než jste čekali, jednoduše řekněte: „To není přesně to, co jsem myslel. Zkus to znovu s důrazem na…"
- Tiché prostředí pomáhá: Přepis hlasu je přesnější v klidném prostředí. Na rušné ulici je lepší psát nebo použít sluchátka s mikrofonem.
Tip od Zdeňka
Zdeněk radí: Já osobně využívám hlasové ovládání hlavně při procházkách s Nickouškem. Nadiktuji si nápad nebo úkol, Claude mi odpoví a já si výsledek přečtu po příchodu domů přes VoiceOver. Je to jako mít sekretáře v kapse, který vás poslouchá a pamatuje si, co jste mu řekli. Jednou to vyzkoušejte a už nebudete chtít jinak!