Inventarizace IT majetku bývá v praxi spojena s ručním zpracováním fotografií inventárních štítků, dohledáváním údajů a jejich přepisem do evidenčních tabulek. Ukazujeme, jak lze tento proces s využitím OCR a jazykových modelů zrychlit, zpřesnit a převést do opakovatelné automatizované pipeline.
Inventarizace jako administrativně náročný proces
Inventarizace IT majetku patří mezi nezbytné provozní procesy, které však v řadě organizací stále znamenají významnou administrativní zátěž. Zvlášť ve firmách s decentralizovaným fungováním, kde zaměstnanci pracují na více lokalitách nebo vzdáleně, nebývá realistické soustředit veškerou techniku na jedno místo a provádět inventarizaci tradičním způsobem.
Častou alternativou proto bývá sběr fotografií inventárních štítků zasílaných e-mailem. Takový přístup ale přináší novou vrstvu manuální práce. Je potřeba otevřít e-mailové zprávy, projít přílohy, dohledat relevantní údaje a přepsat je do přehledových tabulek nebo návazných evidenčních systémů. S rostoucím objemem zařízení se tento postup stává časově náročným, obtížně škálovatelným a náchylným k chybám.
Právě tento typ opakující se administrativy představuje vhodnou oblast pro automatizaci s využitím AI.
Kde je skutečný problém
Na první pohled se může zdát, že inventarizace založená na fotografiích štítků je jednoduchá úloha: stačí z obrázku přečíst inventární číslo a zapsat jej do evidence. V reálném provozu je však situace výrazně složitější.
Fotografie se liší kvalitou, rozlišením, úhlem pořízení, osvětlením i ostrostí. Samotné štítky navíc často nejsou zcela jednotné a mohou obsahovat více různých identifikátorů — například inventární číslo, sériové číslo nebo interní označení. Technický problém tedy nespočívá pouze v extrakci textu z obrázku, ale především v určení, která hodnota je pro inventarizaci skutečně relevantní.
V takových situacích narážejí čistě pravidlové přístupy na své limity, protože předpokládají vyšší míru konzistence vstupu, než jaká bývá v praxi k dispozici.
Vícekroková pipeline jako základ řešení
Navržené řešení stojí na vícekrokové automatizované pipeline, která odděluje jednotlivé fáze zpracování a umožňuje jejich samostatnou optimalizaci.
Proces začíná automatickým zpracováním e-mailových příloh. Obrazové soubory jsou převzaty ze specializované schránky a ukládány do strukturovaného úložiště, které umožňuje jejich další systematické zpracování. Součástí tohoto kroku je také práce s informacemi z e-mailu, zejména identifikace odesílatele zprávy. Díky tomu lze vytěžené inventární číslo následně propojit s konkrétním zaměstnancem nebo odpovídajícím záznamem v evidenci, aniž by bylo nutné tuto vazbu dohledávat ručně. Následně nad obrazovými soubory probíhá OCR extrakce, která převádí obsah inventárních štítků do textové podoby.
Extrahovaný text je dále normalizován tak, aby vznikl stabilní vstup pro další interpretaci. Nad takto připraveným textem pak pracuje jazykový model, jehož úkolem je identifikovat inventární čísla, zejména v případech, kdy je nelze spolehlivě určit pomocí jednoduchých pravidel.
Výstupem celého procesu je strukturovaný přehled údajů připravený pro další zpracování a aktualizaci inventarizačních tabulek. V případech, kdy si systém není výsledkem dostatečně jistý, lze do procesu zařadit finální lidskou kontrolu.
Přínosy a limity řešení
Hlavním přínosem navrženého přístupu je výrazné omezení ruční práce. Místo manuálního otevírání e-mailů, prohlížení příloh a přepisování údajů vzniká opakovatelný proces, který je rychlejší, konzistentnější a lépe škálovatelný. Vedle úspory času přináší automatizace také vyšší standardizaci výstupů a menší prostor pro chyby vznikající při ručním přepisu.
Stejně jako u jiných řešení pracujících s nestrukturovanými vstupy ale ani zde nelze očekávat absolutní přesnost bez ohledu na kvalitu podkladů. Výsledky závisejí na čitelnosti fotografií, podobě inventárních štítků i konzistenci způsobu jejich pořizování. Právě proto se v praxi osvědčuje model, kdy systém zvládne většinu běžných případů a člověk řeší pouze nejednoznačné situace.
Přenositelnost do dalších oblastí
Zajímavým aspektem tohoto přístupu je jeho širší přenositelnost. Architektura založená na kombinaci zpracování vstupních souborů, OCR, normalizace a sémantické interpretace není využitelná pouze pro inventarizaci IT majetku.
Obdobně lze postupovat všude tam, kde organizace pracují s fotografiemi, skeny nebo jinými nestrukturovanými podklady a potřebují z nich získávat konkrétní údaje ve strukturované podobě. Typickými příklady mohou být formuláře, identifikační štítky, servisní protokoly nebo dodací dokumenty.
Závěr
Automatizace inventarizace IT majetku ukazuje, že kombinace OCR technologií a jazykových modelů může být velmi efektivní při zpracování nestrukturovaných vstupů. Přestože kvalita výsledků zůstává závislá na kvalitě vstupních dat a v některých situacích je stále vhodná lidská kontrola, přínosy v podobě rychlosti, konzistence a škálovatelnosti jsou zřejmé.
Skutečná hodnota podobných řešení nespočívá jen v samotné technologii, ale především v tom, že uvolňují kapacitu lidí od rutinní administrativy a umožňují soustředit se na činnosti s vyšší přidanou hodnotou.