Test narzędzi AI do dyktowania i pułapka na inteligentnych ludzi
Pociąg > Samolot
W tym wydaniu piszę o tym, jak więcej dyktować, a mniej klikać, jaka jest największa pułapka na ludzi inteligentnych oraz w czym pociąg jest lepszy od samolotu. Ruszajmy!
Test narzędzi AI do dyktowania
Internet jest zalany postami o tym, że jeśli nie używasz codziennie AI, to przegrałeś życie, zaraz stracisz pracę i rzuci Cię dziewczyna. Dlatego na wstępie uprzedzam - to NIE jest jeden z tych tekstów.
Dziś przychodzę podzielić się moimi doświadczeniami z użycia programów do dyktowania. Jeśli pamiętasz mój artykuł z lutego, w którym pisałem Co myślę o rewolucji AI i jak się na nią przygotowuję, to wiesz, że szukam nowych narzędzi, które pomogą mi w starych czynnościach. Zanim przejdziemy dalej najpierw muszę wyjaśnić czym jest…
Okno kontekstowe
ChatGPT lub Perplexity doskonale sprawdzają się jako internetowa wyszukiwarka. Czyli alternatywa dla Google, do którego już chyba wszyscy coraz rzadziej zaglądamy. Jednak wymagają od nas zupełnie innego podejścia do wyszukiwania. Musimy znacznie rozszerzyć nasze okno kontekstowe, czyli podać dużo więcej informacji niż to wcześniej robiliśmy.
Dla przykładu, w dawnych czasach (czyli w 2024 roku), gdy chciałem odwiedzić okoliczne zabytki, to wpisywałem w Google hasło: “Dolny Śląsk atrakcje“. Potem klikałem link po linku i sprawdzałem, co jest ciekawego. Teraz mogę dostać dużo lepszą odpowiedź od AI - ale muszę podać znacznie więcej informacji: ile mam czasu na zwiedzanie i dojazd, rodzaje atrakcji, których szukam, czy jestem sam czy z dzieckiem, czy mają być darmowe czy płatne etc. Bez tych danych zobaczę niewiele mniej przypadkową odpowiedź jak wcześniej z Google.
Innymi słowy, muszę zapełnić okno kontekstowe różnymi informacjami. Z uwagi na moje stare przyzwyczajenia, niechętnie wpisuję to wszystko ręcznie i ograniczam się do krótkich, hasłowych zdań, co daje średnie efekty. Mógłbym “rozmawiać“ z AI, ale słuchanie tego trwa za długo i wolę trzymać się tekstu.
I dlatego zacząłem korzystać z narzędzi AI do dyktowania. Teraz po prostu uruchamiam je na komputerze lub telefonie i na spokojnie opowiadam ze szczegółami czego szukam lub potrzebuję. Moim zdaniem tak jest dużo szybciej i wygodniej. I sprawdza się w wielu innych przypadkach, bo dyktowany tekst pojawia się tam, gdzie jest nasz kursor - w skrzynce mailowej, w notatniku czy przeglądarce internetowej.
Przetestowałem kilka aplikacji, ale finalnie używam Wispr Flow i AudioPen. Oto ich plusy, minusy i zastosowanie:
Wispr Flow
To moje ulubione narzędzie do dyktowania i używam go od początku roku. Działa szybko, jest zaskakująco precyzyjne, a silnik AI dobrze sobie radzi w rozumieniu, nawet jeśli mówię cicho. Zapisuje dokładnie to, co powiem, bez istotnego przeredagowywania kontekstu - i o to mi chodzi. Automatycznie usuwane są tylko przerywniki i powtórzenia.
Wispr Flow ma wbudowane funkcje formatowania tekstu. Wie, że nowe zdania zaczynamy z wielkiej litery, wykrywa ich koniec i stawia tam kropkę, szuka miejsc na przecinki, dodaje wykrzykniki i znaki zapytania. Co więcej, aplikacja próbuje dostosować formatowanie do tego czy piszemy do kogoś mail, czy tylko notatkę dla siebie. Wnioskuje to z kontekstu naszych słów albo z programu, którego akurat używamy.

Praca z Wispr Flow jest bardzo łatwa i intuicyjna. Wystarczy kliknąć w miejsce, gdzie chcemy, aby pojawił się tekst, wcisnąć dedykowany klawisz na klawiaturze i mówić. Gdy go puścimy, to niemal natychmiast pojawi się tekst, który właśnie wypowiedzieliśmy. W przypadku aplikacji na Maca przyciskiem jest “fn”, ale można go zmienić na inny. Próbowałem używać tej aplikacji na iPhonie - da się, ale kompletnie mi to nie podeszło. Poza tym, jako szanujący się milenials, każdy ważny mail piszę z laptopa, a nie ze smartfona :)
Podoba mi się, że w Wispr Flow mogę dodawać własną pisownię słów. Dla przykładu, mam ustawione, że gdy powiem „pięćdziesiąt dwie notatki”, to dostaję zapis: “52Notatki”. Podobnie z moim nazwiskiem czy pisaniem zaimków osobowych z dużych liter. Można też tworzyć zespoły, dzięki którym inne osoby będą mieć te same reguły pisowni. Wispr Flow ma też kilka ciekawych funkcji w stylu automatyczne wypełnianie danych, ale ja z nich jeszcze nie korzystam.
Minusy?
Działa tylko, gdy jesteśmy online. To najpoważniejszy minus, pozostałe są mało istotne. Czasami program się zacina i potrzebuje kilkunastu sekund, aby przetworzyć mowę. Zdarzają się też sytuacje, w których się myli i zapisuje zupełnie inne słowa niż powiedziałem. Dlatego zawsze czytam drugi raz to, co przedyktowałem oraz samemu poprawiam formatowanie. I generalnie nagrywam krótkimi seriami po 20-30 sekund.
Cena
Ja korzystam z Wispr Flow w wersji Flow Pro, która kosztuje mnie 24 zł miesięcznie. Każdy dostaje ją na start za darmo na 14 dni i to bez podawania danych karty kredytowej, co staje się rzadkością w Internecie. Dlatego zachęcam, aby po prostu przetestować ją samemu.
AudioPen
Z tego narzędzia korzystam zupełnie inaczej, bo to osobna aplikacja mobilna (iOS/Android), która nagrywa notatki głosowe i przekształca je w tekst. Co ważne - mocno edytuje to, co mówię, usuwa pomyłki, powtórzenia, nadaje im zwięzły kontekst. Jeśli moja wypowiedź będzie dłuższa (kilka minut), to AudioPen napisze coś w stylu podsumowania z tego, co usłyszy.
Używam jej do szybkiego zbierania pomysłów, gdy jestem poza domem. Przykładowo, spaceruję z psem, słucham podcastu i dowiaduje się czegoś, co chciałbym zapamiętać. To może być tytuł książki, którą chciałbym przeczytać, jakiś ciekawy cytat albo pomysł, który mi akurat przyjdzie do głowy. Znam już siebie na tyle dobrze, że wiem, iż na pewno to zapomnę, jeśli nie zapiszę, ale nie za bardzo mam jak się zatrzymać i klikać notatkę na telefonie. I wtedy uruchamiam AudioPen i z marszu wygodnie sobie dyktuję. A potem, gdy już jestem w domu, to na spokojnie sortuję te notatki, bo aplikacja synchronizuje się między urządzeniami.

AudioPen można traktować jako oddzielną aplikację do szybkich notatek, ale trzeba pamiętać, żeby je stamtąd wyciągać i żeby jej nimi nie zapchać. Bo jak tam się zbierze 100 notatek, do których kiedyś na pewno wrócimy (akurat!), to niewiele na niej zyskamy. Dlatego ja celowo używam wersji darmowej, która ma pojemność tylko 10 notatek. W ten sposób zmusza mnie, żeby być na bieżąco i kasować te stare.
Minusy?
Ingerencja AudioPen w to, co mówię może być zbyt duża. Program pozwala nawet ustawić, żeby tekst był pisany w stylu jakiejś konkretnej znanej osoby. Ja nie szukam takich funkcji i nie potrzebuję się do kogoś upodabniać. Więc zbyt daleko idące edycje są dla mnie wadą. Drugi minus, to że AudioPen próbuje zrobić się aplikacją do zarządzania notatkami, z folderami, regułami i integracjami. Ponownie - ja tego nie potrzebuję, chcę po prostu szybko robić transkrypcje notatek głosowych i mieć je edytowane w podstawowy sposób. Trzeci minus, chyba najpoważniejszy, jest taki, że twórca AudioPen często zmienia ofertę. Podnosi ceny, zmienia zakres konta darmowego, wprowadza nowe ograniczenia. To nie wróży za dobrze na przyszłość, dlatego AudioPen nigdy nie będzie moją główną aplikacją do notatek.
Cena
AudioPen kosztuje prawie 30 zł za miesiąc ($8,25). Moim zdaniem to dużo, jak na prostą aplikację do transkrypcji notatek. Nie przejmuję się tym zbytnio, bo tak jak pisałem wyżej, używam wersji darmowej, która ma kilka ograniczeń, które mi nie przeszkadzają. Oprócz limitu zapisanych notatek jest nim też ich długość - do 2 minut (wersja płatna to 15 minut). Możliwe, że AudioPen będzie szedł w kierunku funkcji podobnych do Wispr Flow, ale jeszcze mu do niego daleko.
Co innego testowałem?
Superwhisper: mocna konkurencja w stosunku do Wispr Flow. Ma więcej funkcji, ustawień, personalizacji, działa offline, daje większą kontrolę, a przy tym kosztuje podobne pieniądze. Dlaczego więc jej nie wybrałem? Bo Superwhisper jest przeładowany funkcjami, których ja nie używam, przez co jest bardziej skomplikowany w codziennym użyciu.
MacWhisper: to przede wszystkim narzędzie do lokalnej transkrypcji plików audio i wideo na Macu, choć ma też funkcje dyktowania na żywo. Gdybym potrzebował obsługi podcastów z rozpoznaniem rozmówcy albo długich plików, to sięgnąłbym po niego. Plusem jest to, że działa offline, ale jest dostępny tylko na Maca.
Spokenly: darmowy, ale ponownie tylko ma Maca. Ma mniej funkcji i nie jest tak intuicyjny jak Wispr Flow.
Pisanie głosowe w GoogleDocs - ta funkcja znajduje się w zakładce Narzędzia/Pisanie głosowe. Stanowczo odradzam, bo działa równie topornie co Internet Explorer w 2010 roku. A co gorsza można jej używać tylko wewnątrz GoogleDocs.
5 ważnych wniosków na koniec
Po paru miesiącach codziennego używania aplikacji do dyktowania myślę, że:
Jest kwestią czasu zanim każdy z nas będzie z nich korzystał, bo w wielu przypadkach dyktowanie jest o niebo wygodniejsze niż klikanie na klawiaturze. Już sam fakt, że tekst jest pisany bez żadnych literówek, które mozolnie trzeba poprawiać, oszczędza sporo zachodu. Co więcej, nie musimy w tym czasie patrzeć w ekran, co przydaje się, gdy jesteśmy w ruchu.
Jednak w przypadku pracy kreatywnej lub trudnych tematów, tradycyjne pisanie na klawiaturze pozostaje niezastąpione. Przelewanie myśli na papier/ekran, to skomplikowany i czasochłonny proces. Ja nadal piszę ręcznie 52Notatki, próbowałem je dyktować, ale mi to nie idzie 🤷♂️
Prywatność i bezpieczeństwo stoi pod dużym znakiem zapytania. Ja z góry zakładam, że wszystko, co podyktuję, kiedyś wycieknie do Internetu. Albo legalnie zostanie komuś sprzedane, bo jest taki zapis na 739 stronie regulaminu, który każdy akceptuje bez czytania. Więc pilnuję się, aby to nie były żadne dane wrażliwe czy osobiste.
Każdy z tych programów ma istotną wadę - jest produktem na abonament. W dowolnej chwili może zostać celowo popsuty, aby stworzyć wersję premium, a cennik może wzrosnąć. Dlatego nie przywiązywałbym się mocno do jednej wybranej aplikacji. Zwłaszcza że każda z nich oferuje mniej-więcej tę samą usługę, tylko w innym opakowaniu.
Bardzo bym chciał, aby dyktowanie było dostępne po prostu z poziomu systemu operacyjnego, a nie za pośrednictwem trzecich firm, które po drodze przepuszczają mój tekst przez inne modele AI. I myślę, że w przyszłości Apple czy Microsoft dostarczą takie rozwiązania systemowe.
(Nie wiem czy muszę to pisać, ale wszystkie przedstawione tu opinie są moje własne, nikt mi nie zapłacił ani w żaden sposób na tym nie zarabiam. Podane przeze mnie linki NIE są referencyjne, choć wiem, że wiele programów je ma).
Następne kroki:
Spróbuj przez kilka dni dyktowania zamiast pisania. To szczególnie dobrze sprawdza się, gdy masz do napisania tekst, który dużo szybciej jesteś w stanie powiedzieć.
Trwa wyścig pomiędzy aplikacjami do dyktowania, więc niemal każda rozdaje darmowe okresy próbne. Warto z tego skorzystać, bo pewnie niebawem to się skończy.
Wszyscy wiemy, że nie pyta się fryzjera czy pora ścinać włosy bo zawsze przytaknie. Dlatego nie ma się co dziwić, że największymi zwolennikami narzędzi AI są ich twórcy. Nie daj się złapać na FOMO, które rozpylają, lepiej wypracować własne zdanie na ten temat. Ja swoje opisałem tutaj:
Pułapka na ludzi inteligentnych
Jedna z najgorszych pułapek w życiu, to być wystarczająco inteligentnym, by dostrzegać problem, ale nie na tyle odważnym, aby go rozwiązać. Potrafić przeanalizować wszystko pod każdym kątem, aż do osiągnięcia paraliżu decyzyjnego.
Inteligentni ludzie są wybitnie dobrzy w znajdowaniu powodów, żeby czegoś nie robić. Dostrzegają wszystkie konsekwencje i skrajne przypadki. Wiedzą z góry co może pójść nie tak, albo który krok będzie najtrudniejszy. Analizują wszystkie niuanse, różne scenariusze i patrzą na każdy problem z kilku perspektyw.
Takie podejście brzmi rozsądnie, a nawet ambitnie. Ale jeśli nie idzie za nim działanie, to jest szkodliwe i bezużyteczne. Dlatego wielu błyskotliwych ludzi ma trudności z podstawowymi życiowymi zadaniami i rolami, które dla osób z ich inteligencją powinny być łatwe. Specjalizują się w myśleniu, zamiast w robieniu.
Warto się pilnować, aby nie wpaść w tę pułapkę. Najprostszy sposób, żeby się przed nią uchronić, to zwracać większą uwagę na to, czy za naszymi analizami idzie też działanie. Bo jeśli za każdym razem prowadzą nas tylko do braku decyzji (lub jej odkładania), to co nam z tej naszej inteligencji?
(ten tekst napisałem dla siebie, ale może komuś też się przyda)
Przypominam o sesji pytań i odpowiedzi
Już w ten czwartek 23 kwietnia o 20:00 widzimy się na sesji pytań i odpowiedzi. Mail ze szczegółami i linkiem do ankiety wyślę na początku tygodnia. Zakładam, że dostanę dużo pytań, więc w pierwszej kolejności będę odpowiadał na te najtrudniejsze i najciekawsze :)
Sesja Q&A jest jednym z bonusów, jakie dodaje do zakupu 52Notatki Sezon 4. To moja forma podziękowania dla tych z Was, którzy w ten sposób doceniają moje treści. Bardzo się cieszę, że tak wiele osób chce mieć 52Notatki w formie książki lub ebooka. A po szczegóły zapraszam tutaj:
A tak prywatnie…
Mój newsletter pisałem już w różnych miejscach na świecie, ale chyba nigdy w pociągu. A to wydanie powstało w Intercity relacji Jelenia Góra-Warszawa. Po drodze doszedłem do wniosku, że koleje są znacznie lepsze niż samoloty. Oto kilka przewag pociągów:
Nie muszę dopłacać za to, żeby móc siedzieć obok mojej rodziny.
Pierwsza klasa nie kosztuje tyle, co nowy Rolex.
Nie muszę być 2 godziny wcześniej na dworcu i nikt mnie tam nie traktuje jak potencjalnego przestępcę, bo wziąłem szampon do bagażu podręcznego.
Widzę okno, nawet jeśli nie siedzę przy oknie.
(myślałem, że będę miał 3-4 przykłady, a jest ich coraz więcej)
Mogę przyjść dosłownie minutę wcześniej, a i tak mnie wpuszczą. Ba! Mogę nawet wsiąść bez biletu i kupić go trochę drożej na miejscu. W samolotach takich cudów nie mają :)
Nie ma dramy z wymiarami i wagą walizki.
Można podróżować anonimowo, jeśli się kupi papierowy bilet na stacji.
I nie boję się, że umrę, gdy pociąg dojeżdża do stacji (po ostatnich turbulencjach przy lądowaniu na Maderze mam teraz stracha :) )
Minusy kolei? Oczywiście oprócz notorycznych opóźnień? Ponoć brak stałego Internetu, choć mi to nie przeszkadza. Można wcześniej pobrać sobie film, wziąć książkę albo uporządkować zdjęcia w telefonie. Naprawdę nie widzę potrzeby, aby być online w każdej sekundzie życia.
Post Scriptum: Ostatnio przybywa tu wiele nowych Czytelniczek i Czytelników - witam! Zachęcam do zajrzenia w archiwalne wydania, gdzie jest dużo treści, które jeszcze długo będą aktualne. I od razu zdradzę Wam sekret, że mój newsletter nie kończy się w tym miejscu. Ma jeszcze “cichą sekcję“, którą widać tylko w wersji mailowej. Więc jeśli nie chcesz, aby za tydzień też Ci umknęła, to zachęcam do zapisów:

🤫



