Dyktowanie zamiast pisania? Wtyczka do zamiany mowy na tekst dla Chrome
Zapraszam was do krótkiego tekstu na temat wtyczek do Chrome które pozwalają dyktować do przeglądarki zamiast pisać na klawiaturze. Cały ten artykuł postaram się podyktować. Oczywiście będę go potem poprawiał ale zobaczymy jak szybko mi pójdzie napisanie go w porównaniu do wpisywania ręcznego.
Postaram się też nagrać dla was krótki pokaz możliwości wtyczki z której aktualnie korzystam.
TL;DR – napisanie tego artykułu poprzez dyktowanie w 2 różnych wtyczkach zajęło mi jakieś może 5 minut. Poprawianie – za pomocą wtyczki Voice in – jakiś kwadrans. Jestem naprawdę zadowolony z efektów. Jest to na pewno wydajniejszy sposób na pisanie dłuższych tekstów niż wpisywanie ich z klawiatury.
Dyktowanie i zamiana mowy na tekst w dokumentach Google
Właściwie to możemy obyć się bez żadnych wtyczek ponieważ w dokumentach Google mamy dostępną opcję dyktowania. Nie jest to jednak najwygodniejszy sposób. Musimy później taki tekst i tak przekleić w jakieś pole tekstowe w przeglądarce czy do jakiegoś programu. Dlatego postanowiłem poszukać wygodniejszej metody. Na przykład wtyczek, które pozwolą nam dyktować, zamieniać mowę na tekst i wklejać go do dowolnego pola tekstowego.
Najlepsza wtyczka do zamiany mowy na tekst – Voice in
W tej chwili dyktuję do wtyczki która nazywa się Voice in. Pozwala ona mi dyktować do niemal dowolnego pola tekstowego. Na stronie wtyczki jest co prawda wymieniona lista aplikacji web gdzie dyktowanie powinno działać – jest między innymi Gmail i kilkanaście innych a w wersji płatnej jeszcze więcej. Ale okazuje się, że wtyczka działa na większości pól tekstowych. Przykładowo na moim blogu hostowanym na własnym serwerze w edytorze Gutenberg.
Zaraz po instalacji wtyczka prowadzi nas przez proces przyznania jej odpowiednich uprawnień i pokazuje jak z niej korzystać. Jest to bardzo przejrzyście wytłumaczone i po kilku prostych krokach możemy zacząć jej używanie. Możemy też zakupić wersję Plus, która ma nieco więcej funkcji.
Jak w praktyce wygląda korzystanie z wtyczki? Dzieje się to mniej więcej w taki sposób, że będąc na dowolnym polu tekstowym włączamy tryb nagrywania i ustawiamy kursor tam gdzie chcemy aby pojawił się tekst. W momencie gdy zaczniemy mówić do mikrofonu tekst pojawia się w półprzezroczystej ramce wyświetlanej na szczycie pola tekstowego. Po chwili tekst widoczny w ramce zostaje wklejony w miejsce w którym jest aktualnie kursor.
Zresztą, zobaczcie sami:
Niewątpliwą zaletą tej wtyczki jest to, że raz włączony tryb nagrywania utrzymuje się tak długo aż go nie wyłączymy. Dzięki temu możemy poprawiając jakiś tekst ustawić kursor w dowolnym miejscu a następnie powiedzieć kilka słów – na przykład wtrącić jakieś zdanie czy nawet jedno słowo do tekstu. Kiedy podyktujemy jedno czy dwa słowa to przeklejenie do pola tekstowego nastąpi szybciej niż kiedy dyktujemy jakiś dłuższy tekst. Pozwala to szybko poprawiać wcześniej przedyktowany tekst i wstawiać do niego jakieś brakujące bądź źle zrozumiane słowa.
Niestety, wtyczka nie zawsze radzi sobie z poprawnym wklejeniem podyktowanego tekstu w pole tekstowe. W różnych aplikacjach webowych różnie to wygląda i czasami trzeba sobie radzić inaczej – na przykład korzystając z wtyczki opisanej niżej, której zasada działania jest nieco inna.
Speech-to-text Voice recognition
Sprawdziłem też speech-to-text Voice recognition. Wtyczka ta działa w taki sposób że otwiera nam się osobno okienko do którego dyktujemy więc nie jest tak wygodna jak jej poprzedniczka, ale zapewnia że podyktowany tekst na pewno nam nigdzie nie zniknie.
Wtyczka całkiem dobrze rozpoznaje mowę potrafi sobie poradzić z mieszaniem Polskiego i angielskiego na przykład jeśli teraz powiem Custom Field albo post Type albo testimonial to rozpoznawanie mowy radzi sobie z takimi wtrąceniami. Potrafi też sobie radzić z naprawdę bardzo szybkim dyktowaniem. Wtyczka nie ma wersji premium ale można przekazywać datki dla jej twórców.
Speech recognition anywhere
Mamy jeszcze jedną wtyczkę – Speech recognition anywhere – ale po zainstalowaniu wystraszyłem się interfejsu użytkownika w którym kryją się ustawienia. Odwiedziłem też stronę producenta, która wygląda jak z wczesnych lat 90. Mnogość ustawień tak mnie wystraszyła, że nawet jej nie przetestowałem.
Wygląd niekoniecznie musi oznaczać to że ta wtyczka jest słaba ma dosyć dobre oceny ma dosyć dużo pobrań i ponad 10 tysięcy użytkowników. Być może programiści starej daty który którzy robili ten Interfejs użytkownika i tę stronę producenta są po prostu tak dobrymi programistami że napisali świetną wtyczkę tylko nie potrafią jej sprzedać.
Podsumowanie
Podsumowując na ten moment Wydaje mi się że zostanę z Voice in Ponieważ pozwala mi dyktować dokładnie w tym miejscu gdzie chcę nie muszę niczego przyklejać mogę ustawić kursor na przykład między dwoma słowami i podyktować jedno słowo Albo między dwoma akapitami podyktować kilkanaście zdań i działa to naprawdę dobrze rozpoznaje język polski dość nieźle radzi sobie z mieszaniem Polskiego i angielskiego więc na ten moment pozostaje przy tej wtyczce.
A może znasz lepszy sposób na przyspieszenie pisania artykułów na bloga (nie, GPT-3 się nie liczy)? Napisz o nim w komentarzu.