Microsoft představuje MarkItDown, nástroj pro převod vašich dokumentů na Markdown

MarkItDown

Před chvílí, krátce po zveřejnění a průvodce na Markdown, hledal jsem informace, abych zjistil, zda lze LibreOffice použít k vytváření těchto typů dokumentů. Nenašel jsem nic, kromě odpovědí typu "proč to chceš udělat?" počítat. Cílem bylo vytvořit dokument pomocí editoru typu Word nebo Writer a poté jej uložit ve formátu .md, ale jak jsem řekl; Nic jsem nenašel. Nedávno Microsoft vydal nástroj pro něco podobného a jmenuje se MarkItDown.

MarkItDown je a python knihovna který lze nainstalovat do systému — nikoli na Linux od Pythonu 3.12 — nebo do virtuálního prostředí (env). Po instalaci by základní nebo surové použití vyžadovalo napsání několika řádků v Pythonu, který máte níže. Není to ale jediný způsob, jak jej využít.

MarkItDown pomocí Pythonu

API je takto jednoduché:

from markitdown import MarkItDown markitdown = MarkItDown() result = markitdown.convert("test.xlsx") print(result.text_content)

Z výše uvedeného první řádek importuje knihovnu; druhý vytvoří kompatibilní objekt; Ve třetím provede převod — do souboru, který se v příkladu jmenuje text.xlsx — a ve čtvrtém vypíše výsledek do konzole. Navíc, jak je vysvětleno v váš GitHub, může být kompatibilní s LLM, jako je ChatGPT, to vše podle vkusu spotřebitele a v závislosti na znalostech každého člověka.

Pokud kód není to, co je pro nás nejlepší, vytvořil jej vývojář jménem Matt Palmer web pro usnadnění úkolu. Přestože je v angličtině, jeho použití je velmi jednoduché. Ve spodní části rámečku se zobrazují podporované soubory, kterými jsou PDF, PPTX, DOCX, XLSX, obrázky, zvuk, HTML a textové soubory. Jediné, co budeme muset udělat, je přetáhnout soubor do krabice a počkat, až se kouzlo stane, jak je vidět na snímku záhlaví.

V době psaní je problém se stahováním souboru, který zobrazuje chybovou zprávu místo textu. Je možné, něco, co jsem neověřil, že to vidím, protože jsem soubor vytvořil z Linuxu, LibreOffice nebo obou, ale při stahování souboru vidím tuto chybu. Převod dělá dobře a vygenerovaný prostý text můžete vždy zkopírovat, vložit do textového souboru a uložit s příponou .md.

K jeho zobrazení můžeme v Linuxu použít nástroje jako Okular, Visual Studio Code nebo nějaký program. je připraven, Mimo jiné.

Vzít v úvahu

Přestože nástroj vytvořila společnost Microsoft, ne vždy vše dopadne dobře. Abyste dosáhli nejlepších výsledků, musíte použít správné možnosti. Například, dát a # Titular o ## Título 2, musíte to vybrat v možnostech Word nebo Writer. Totéž s uspořádanými nebo neuspořádanými seznamy, odkazy, obrázky... Pokud místo použití správných možností vybereme text a vložíme tučné a větší písmo, Markdown takto nefunguje a můžeme získat smíšené výsledky. Pro více informací o podporovaných značkách vás odkazujeme na odkaz, který najdete v prvním odstavci této poznámky.

Nyní je to oficiální nástroj společnosti Microsoft a může to být nejlepší možnost pro převod podporovaných souborů do Markdown.


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.