The Digital Maktaba platform: a tool for semi-automatic document cataloguing and searching
- Autori: Bergamaschi, S.; Ruozzi, F.; Ciccarello, D.; Vigliermo, R.; Sala, L.; El Ganadi, A.; Sullutrone, G.; Aftar, S.
- Anno di pubblicazione: 2025
- Tipologia: Capitolo o Saggio
- OA Link: http://hdl.handle.net/10447/695545
Abstract
Digital Maktaba affronta la complessa questione della creazione di una piattaforma online efficiente per aiutare gli specialisti linguistici e i catalogatori meno esperti a produrre record bibliografici coerenti con le scritture non latine. A questo scopo, la soluzione sperimentata sia dagli informatici che dagli esperti umanisti del team sfrutta diverse tecnologie di OCR implementate ad hoc che coinvolgono anche gli LLM e VLM più recenti, in un flusso di lavoro innovativo orientato ad ottenere l'estrazione di metadati per testi scritti in alfabeti non latini, a partire dall'arabo, per il loro impiego nei servizi bibliotecari
