
Od loňského února, což se shoduje se spuštěním Plazma 6.6, show Dokáže extrahovat text ze snímků obrazovky. Tato funkce je známá jako optické rozpoznávání znaků neboli OCR. Ve výchozím nastavení však není povolena a možná vás zajímá, proč tuto možnost nevidíte ani po aktualizaci na nejnovější verzi, kterou je aktuálně Plasma 6.6.5.
Důvod je jednoduchý: chybí potřebné balíčky. To se stává i s možností naskenovat QR kód pro přístup k Wi-Fi síti, ale to je téma na jiný článek. Zde si to vysvětlíme. Jak aktivovat podporu OCR ve Spectacle, pokud používáte Plasma 6.6 nebo novější.
Pokud používáte Plasma 6.6 nebo novější, povolte podporu OCR ve Spectacle.
Když po aktualizaci pořídíme snímek obrazovky, vidíme, že se možnost extrahovat text nezobrazuje, na rozdíl od toho, co je uvedeno v návodu. Poznámky k vydáníDokonce je tam i ukázkové video:
Pokud otevřeme Spectacle a přejdeme do jeho nastavení, uvidíme v sekci OCR ikonu s písmenem „i“, která nám poskytuje další informace. Jednoduše nám říká, že není k dispozici.
Spectacle dokáže extrahovat text pomocí svého rozhraní, ale kouzlo se děje... Tesseract OCRTo je běžné u softwaru používaného systémy založenými na Linuxu: mnoho programů je frontendale na něčem závisí backend Nechte ho dělat práci.
Aby zpráva na předchozím snímku obrazovky zmizela a nahradily ji možnosti OCR, musíme nainstalovat potřebné balíčky Tesseractu. V mém případě s distribucí založenou na Archu, jako je Manjaro, jsou potřebné balíčky:
- tesseract
- tesseract-data-osd
- tesseract-data-cat
- tesseract-data-eng
- tesseract-data-spa
Z výše uvedených balíčků chci, aby detekoval jazyky končící na -cat, -eng a -spa (katalánština, protože pocházím z východního Španělska, angličtina a španělština). tesseract Je to hlavní balíček a koncovka -osd umožňuje softwaru detekovat orientaci psaní, což teoreticky umožní detekovat text, i když je například otočený o 90°.
Je to jasné, ale stojí za to to zopakovat: pokud někdo potřebuje více jazyků, stačí si pro ně nainstalovat balíčky. Například koncovku -ita pro italštinu, -fra pro francouzštinu nebo -rus pro ruštinu.
Instalace toho, co je potřeba
Instalace na různé distribuce bude záviset na konkrétní distribuci. V případě Manjara to lze provést pomocí Pamacu (jeho grafického nástroje pro správu balíčků), ale také pomocí sudo pacman -S tesseract tesseract-data-osd tesseract-data-cat tesseract-data-eng tesseract-data-spaV jiných distribucích, jako jsou ty založené na Debianu nebo openSUSE, může být balíček tesseract-ocr.
Po instalaci balíčků se zobrazí možnost pořídit snímek obrazovky, jak je znázorněno na záhlaví snímku obrazovky a ve výukovém videu KDE. Kliknutím na tlačítko „Extrahovat text“ se zobrazí oznámení, které vám umožní zkopírovat text do schránky nebo jej otevřít v textovém editoru.
Poznámka: Jazyky je třeba aktivovat v nastavení.
Jakmile se možnost zpřístupní, změní se i nastavení. Zpráva o nedostupnosti je nahrazena částí „Rozpoznávání textu (OCR)“. Tato část má pouze dvě části:
- Výběr jazyka: pomocí zaškrtávacích políček. Vybereme jazyky, ze kterých chceme extrahovat text. Je to také dobrý způsob, jak zjistit, které jazyky máme nainstalované a které jsou podporované.
- Zavření po extrakci zabrání automatickému ukládání. Je to věc osobní preference, ale já to nemám zaškrtnuté. Tím se zajistí, že se vždy zkopíruje do schránky.
Je to jednoduchý proces, ale není ve výchozím nastavení povolen. Po instalaci několika balíčků bude Spectacle schopen „číst“.

