Niektórzy niewidomi, zwłaszcza kobiety, marzą o „gadającym lustrze”, które podpowiedziałoby, jak się wygląda, czy makijaż się nie rozmazał, czy strój jest odpowiednio dobrany kolorystycznie. To już nie muszą być pobożne życzenia, a rewolucyjny wynalazek. Znane są programy, które zdalnie łączą niewidzącego właściciela „oka kamery” z widzącym wolontariuszem, który jest gotowy opisać to, na co nakierowany zostanie obiektyw urządzenia.
Od pewnego czasu szczęśliwie trafiają w moje ręce aplikacje na iPhone’a, których przydatność testuję w niewidzialnej codzienności i dzielę się swoimi spostrzeżeniami z innymi osobami ze środowiska. Suche opisy ze stron producentów niewiele wnoszą, dopiero przy bliższym poznaniu aplikacje zyskują na wartości. Tym razem chcę zapoznać czytelników z programami do rozpoznawania obrazów.
Korzystam na iPhonie 5S i systemie iOS 9.2 z dwóch z nich – „TapTapSee” oraz „CamFind” – pochodzących od tych samych twórców. Obydwa są bezpłatne, ale pierwszy ma ograniczenie do stu zdjęć próbnych, a potem należy wykupić kolejne pakiety. O ile „TapTapSee” powstał specjalnie dla osób z dysfunkcją wzroku, to „CamFind” kierowany jest do ludzi chcących dokonać zakupu lub porównać cenę danego produktu w internecie. Po zrobieniu zdjęcia wybranego przedmiotu otrzymujemy – oprócz informacji, co znajduje się na fotografii – zestawienie wyników związanych z opisem przedmiotu, np. hasło z wikipedii oraz listę sklepów i portali aukcyjnych oferujących ten sam produkt. Z poziomu aplikacji można od razu dokonać zakupu. Doskonałą funkcją w przypadku obu aplikacji jest możliwość dzielenia się otrzymanym wynikiem poprzez wiadomość tekstową, mail, skype’a i facebooka. Różni je natomiast język menu – „TapTapSee” funkcjonuje już po polsku, a „CamFind” jedynie w wersji anglojęzycznej. Ponieważ wyniki rozpoznawania są zbliżone, opowiem o nich wspólnie.
Poukładajmy zdjęcia w albumie
Pierwszą niewątpliwą zaletą jest rozpoznawanie zdjęć z galerii smartfona. Jeśli robiliśmy zdjęcia, mamy ich zbiory w przeglądarce zdjęć i wideo telefonu, ale są one podzielone jedynie ze względu na miejsca i daty. Jeśli w jednym dniu zrobiliśmy kilkanaście zdjęć i nie opisaliśmy ich na bieżąco, to pomogą nam w tym wymienione aplikacje. Możemy uzyskać na przykład takie meldunki:
– zdjęcie 1 to brązowy czarny pies rasy yorkshire terrier;
– zdjęcie 2 to osoba w brązową kurtkę i niebieskie jeansy stojąco w ciągu dnia;
– zdjęcie 3 to osoby posiadające kolację przy długim stole;
– zdjęcie 4 to kobieta w czerwonej koszuli stojących w czarnej marynarce w pobliżu człowieka na łóżku;
– zdjęcie 5 to mężczyźni i kobiety na sobie ciemne dół kolorowe kurtki biorąc zdjęcia grupowego na molo pod ciemnym niebem w czasie nocy.
Specjalnie zamieściłam tekst nieprzetworzony – w formie odczytywanej syntezą VoiceOver. Wiadomo, że użyty język jest najprostszy, ale można domyśleć się, o co chodzi. Będą zapewne trafiać się jakieś niezgodności i przekłamania – wszystko zależy jednak od jakości zdjęcia oraz zaprezentowanych na nim elementów do rozpoznania. Jak można wyczytać z jednej z informacji wysłanych na oficjalne konto aplikacji w serwisie twitter, sukcesem programów jest połączenie algorytmów komputerowych z czynnikiem ludzkim – jeśli system stojący za „TapTapSee” nie jest pewien, czy sfotografowany obiekt pasuje do jakiegoś wzorca z bazy, wysyła zdjęcie do jednego z pracujących aktualnie operatorów, który na bieżąco tworzy odpowiedni opis.
Rzuć okiem tu i tam
Często zdarza się, że mamy do czynienia z jakimś pudełkiem, puszką czy innym przedmiotem, którego zawartości nie jesteśmy pewni. Spore problemy bez pomocy osoby widzącej rodzą też sytuacje, gdy chcemy poznać markę sprzętu RTV i AGD czy zidentyfikować książkę. Aplikacje do rozpoznawania obrazu próbują z większym lub mniejszym skutkiem te problemy zniwelować. Na przykład dzięki aplikacji „TapTapSee” dowiedziałam się, że mój laptopik już się uruchomił – mimo hałasu zza okna, który uniemożliwiał usłyszenie pracy komputera:
– zdjęcie 1 to czarny monitor z płaskim ekranem włączony.
Poniżej zamieszczam przykładowe opisy fotografii przedmiotów znajdujących się w pokoju:
– zdjęcie 2 to biały brązowy kopuły kinkiet;
– zdjęcie 3 to łóżko z kudłaty kość słoniowy koc na górze.
A to już treść opisu fotki selfie, czyli zrobionej samej sobie:
– zdjęcie 4 to uśmiechnięta kobieta.
Tak natomiast uświadomiona zostałam, na klawiaturze jakiej firmy piszę ten artykuł:
– zdjęcie 5 to biały Samsung klawiatury komputera.
Kura domowa powraca
Bardzo użyteczne okazały się te produkty w samodzielnym kucharzeniu. Podam konkretne przykłady ich przydatności: byłam sama w domu bez wsparcia oka widzącej osoby i do przygotowania obiadu potrzebowałam mrożonego szpinaku i warzyw na patelnię. Dotykiem niestety szpinaku w kostkach nie byłam w stanie odróżnić po kształcie od mrożonych kopytek, ani też mieszanki warzyw od zupy jarzynowej. Wyjęłam z zamrażarki wszystkie paczki, położyłam je na blacie stołu i zrobiłam zdjęcia. Po rozpoznaniu usłyszałam: „Kraina mrożonek, szpinak, paczka” – to był już jeden z potrzebnych produktów. Drugi był opisany jako „Kraina mrożonek, warzywa na patelnię”. Pozostałe, rozpoznane jako zupy i kopytka, odłożyłam do zamrażarki.
Przyszła kolej na wybranie spośród trzech jednakowej wielkości puszek tej właściwej z groszkiem konserwowym. Robienie zdjęcia w pionie nie było bardzo odpowiednie, bo aparat obejmował też elementy tła i próbował je rozpoznawać. Zachowałam się więc jak pomysłowy Dobromir i położyłam puszki osobno na blacie szwem blachy do dołu. Robiłam zdjęcia równolegle od góry. Potrzebny produkt został rozpoznany jako „groszek konserwowy 240 gram”. Pozostałe puszki opisano mi jako „pomidory Łowicza” i „puszka czarno-żółto-zielona”. Gdybym z większą starannością i dociekliwością chciała rozpoznać obiekty, należałoby obiektyw aparatu ustawiać z większą dokładnością.
W co tapnąć?
Jak już wspomniałam, menu „TapTapSee” jest w języku polskim, więc pokrótce opiszę zawarte w aplikacji funkcje. Po uruchomieniu pojawia się ekran z następującymi przyciskami:
– powtórz: powtórz objaśnienie ostatniego zdjęcia
Gdybyśmy nie usłyszeli bądź nie zrozumieli opisu, można skorzystać z powtórzenia, ale tylko w przypadku ostatniego rozpoznanego zdjęcia.
– biblioteka: dostęp do zdjęć i biblioteki
Dzięki tej opcji, jeśli wyrazimy zgodę na to, by aplikacja korzystała z wszystkich funkcji aparatu, możemy przenieść się do przeglądarki zdjęć i wideo naszego smartfona i tam dokonywać rozpoznania wskazanych plików graficznych.
– podzielać: zapisz lub dzielić najnowsze zdjęcie
Ten przycisk otwiera listę działań, które można przeprowadzić z uzyskanym opisem fotografii (udostępnić przez AirDrop, wiadomość sms, e-mail, notatki, facebooka, skype’a, zachować przez iBooks) lub samym zdjęciem (zachować obrazek, przypisać do kontaktu, kopiować, drukować).
– wielkie „O”: o TapTapSee
W tym miejscu możemy poczytać o polityce prywatności i warunkach korzystania z serwisu, skontaktować się z twórcami aplikacji, uzyskać informacje o wersji, włączyć lub wyłączyć dźwięk ustawiania ostrości, lampę błyskową, a także dowiedzieć się, ile opisów zdjęć pozostało w wykupionym pakiecie.
– przycisk aparatu: postukaj dwukrotnie w celu zrobienia zdjęcia przed tobą
Po zrobieniu zdjęcia odczekujemy kilkanaście sekund, słysząc komunikat: „Picture 1 call progress”. W efekcie głos syntezy VoiceOvera przedstawi nam opis fotografowanego obrazu. W „CamFind” natomiast usłyszymy komunikat o rozpoznanym obrazie wygłoszony inną (wewnętrzną) syntezą aplikacji, ale nie musimy wyłączać VoiceOvera. Ta ostatnia aplikacja ma kilka podstawowych przycisków, a mianowicie: „menu”, „add image icon” do rozpoznania zdjęć z albumu, „take picture” do zrobienia zdjęcia, a także pięć dodatkowych zakładek.
Poza zbadanymi i opisanymi przeze mnie aplikacjami funkcjonuje jeszcze „VizWiz” – najbardziej rozbudowana z nich wszystkich. Od opisanych powyżej różni się dwoma elementami: po pierwsze, zrobione zdjęcie rozpoznawać może człowiek lub komputer i to użytkownik decyduje, czy zrobiona przez niego fotografia trafi przed oczy „żywego” człowieka, czy zadanie to pozostawi maszynie. Po drugie, wysyłając zdjęcie do człowieka, możemy zadać mu pytanie i uściślić, co dokładnie interesuje nas na przesłanej fotografii. Robimy np. zdjęcie okładki książki – „TapTapSee” prawdopodobnie odpowie nam, że zdjęcie to książka, a wysyłając zdjęcie do „VizWiz”, możemy doprecyzować pytanie chociażby o jej tytuł. Niestety aplikacja posiada tylko interfejs angielski – co dotyczy zarówno pytań, jak i odpowiedzi.
Mam nadzieję, że przedstawione funkcje opisanych aplikacji zachęcą niektórych z Państwa do sięgnięcia po nie, by ułatwić sobie rozpoznawanie zdjęć i otoczenia, a szklane oko swoimi podpowiedziami choć w niewielkim stopniu zastąpi brak widzenia.
Z ostatniej chwili!
Spieszę donieść, że przy najnowszej aktualizacji programu „TapTapSee” z dnia 18 lutego br. twórcy zadecydowali o powrocie do bezpłatnej jego wersji bez ograniczeń ilości rozpoznawanych zdjęć.
Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 1 gość
Nie możesz rozpoczynać nowych wątków Nie możesz odpowiadać w wątkach Nie możesz edytować swoich postów Nie możesz usuwać swoich postów Nie możesz dodawać załączników