Jump to content

SUBIECTE NOI
« 1 / 5 »
RSS
E-Mail in serie prin Excel si Out...

Modul alimentare rulou/jaluzea ex...

Recuperare fișiere dupa form...

Aplicatii stress test RAM
 Asigurare auto hibrid

Asus B550M - PC-ul nu porneste di...

Tzanca Uraganu - Inconjurat de Fe...

explicatie montaj breadboard
 3 Doors Down - Kryptonite

Semnalizati cand virati pe un dru...

Succesiune - mostenire apartament...

Donez Siofor de 1000mg ( diabet t...
 Izolatie intre parter si etaj

Hranirea pasarilor din orase -pro...

[unde] goarna tramvai

UPGRADE interfon de bloc Electra?
 

PDF OCR in Synology/Xpenology - SynOCR

- - - - -
  • Please log in to reply
11 replies to this topic

#1
Adm

Adm

    Property Caretaker

  • Grup: Administrators
  • Posts: 24,038
  • Înscris: 22.05.2003
Sa zicem ca aveti fisiere scanate PDF.
Acestea sunt imagini jpg incapsulate intr-un fisier pdf.
In aceste fisiere pdf nu poti face cautari.

Ideea este ca folosind tutorialul de mai jos, sa sfarsiti prin a transforma un pdf imagine intr-unul in care se pot cauta cuvinte cheie.

Ce avem nevoie?

1. Synology DSM (oficial sau xpennology), cu sistem de fisere BRFS (necesar pt pasul 2) .
2. Instalati Docker system.


Instalare
3. In Docker - Registry, cautati ocrmypdf si descarcati versionea polyglot, cu toate limbile, inclusiv romana.

Attached File  1.jpg   64.31K   29 downloads

4. Rulati noua masina virtuala
5. Creati un Shared Folder numit SCANNED, cu drepturi de scriere Read/Write pentru Admin.
6. Creati in SCANNER, folderele urmatoare:
_INPUT - aici se pun fisierele pdf
_BACKUP - aici vor fi mutate fisierele din _INPUT, dupa ce au fost prelucrate
_LOG - loguri
_OUTPUT - fisierele prelucrate, cu OCR inclus

Attached File  2.jpg   27.62K   26 downloads

4. Descarcati din "Package Center" aplicatia synOCR (din pacate interfata e in limba germana.
Threadul de suport poate fi consultat aici. (google translate, din lb germana)

Daca nu gasiti aplicatia, adaugati https://www.cphub.net la Package sources

Attached File  Screenshot 2020-03-28 at 13.04.04.jpg   40.69K   18 downloads

5. Rulati synOCR so modificati optiunile ca in imagine, apoi salvati (butonul default, albastru)
Attached File  4.jpg   74.63K   22 downloads

====

Puneti imaginile pdf in directorul _INPUT

Rulati synOCR

Verificati directorul _OUTPUT

Attached File  5.jpg   77.73K   20 downloads

=====

Suporta cuvinte cheie, si organizeaza pe directoare in _OUTPUT (citi threadul de suport).


Eu am imprimanta care salveaza pe ftp, direct pe Xpenology, iar acum planuiesc sa fac totul cu OCR.

#2
Ak-33

Ak-33

    Member

  • Grup: Members
  • Posts: 670
  • Înscris: 06.01.2020
Multumesc

#3
dcrst755

dcrst755

    Active Member

  • Grup: Members
  • Posts: 1,294
  • Înscris: 26.08.2008
Mersi pt efort!
am Docker pe DSM 5.2 pentru alte imagini. Daca descarc imaginea data, la lansare se opreste imediat. ii trebuie neaparat btrfs? Ca pe DSM5.2 am ext4.
Ma intereseaza chiar foarte mult subiectul.

#4
Adm

Adm

    Property Caretaker

  • Grup: Administrators
  • Posts: 24,038
  • Înscris: 22.05.2003
E normal sa se opreasca, ea nu ruleaza decat cat prelucreaza fisierul pdf

Docker nu poate fi instalat pe DSM 6.1 fara BRFS, deci aviz amatorilor de ugprade.

Pt upgrade la BRFS trebuie sa faci backup, sa refaci matricea RAID si sa iei totul de la 0 + restore.

#5
born2lose

born2lose

    Senior Member

  • Grup: Senior Members
  • Posts: 7,769
  • Înscris: 06.09.2004
rahat, chiar ma gandeam ca mi-ar fi de folos, si cand colo modelul meu - 418play - nu este suportat (pt docker). ds218+ , care are exact aceleasi specificatii h/w este suportat, ceea ce ma face sa cred ca synology face o diferentiere artificiala intre modele in functie de marketingul pt fiecare model. urat, synology, foarte urat   :(

#6
Adm

Adm

    Property Caretaker

  • Grup: Administrators
  • Posts: 24,038
  • Înscris: 22.05.2003
418play e cu procesor Intel si ar trebui sa mearga.
Pe arm nu merge Docker.

https://tylermade.ne...d-synology-nas/

#7
ogo

ogo

    Senior Member

  • Grup: Senior Members
  • Posts: 4,524
  • Înscris: 07.03.2006
Poti incerca asa:
https://tylermade.ne...d-synology-nas/

LE
Adm a fost mai rapida

#8
dcrst755

dcrst755

    Active Member

  • Grup: Members
  • Posts: 1,294
  • Înscris: 26.08.2008

View PostAdm, on 28 martie 2020 - 20:29, said:

E normal sa se opreasca, ea nu ruleaza decat cat prelucreaza fisierul pdf
chiar n-am prins-o p-asta. Cum e normal sa se opreasca o MV !? cum sa mai functioneze (sa verifica directoarele) daca e oprita?

#9
dcrst755

dcrst755

    Active Member

  • Grup: Members
  • Posts: 1,294
  • Înscris: 26.08.2008
cred ca stiu confuzia, tu vorbesti de MV si eu de Docker container. Asta mi se opreste imediat dupa pornire

#10
Adm

Adm

    Property Caretaker

  • Grup: Administrators
  • Posts: 24,038
  • Înscris: 22.05.2003
Containerul de ocr ruleaza in request, proceseaza pdf, apoi se inchide.
Asa e gandit.
Poti programa rularea sa.

#11
born2lose

born2lose

    Senior Member

  • Grup: Senior Members
  • Posts: 7,769
  • Înscris: 06.09.2004

View PostAdm, on 28 martie 2020 - 22:05, said:

418play e cu procesor Intel si ar trebui sa mearga.
Pe arm nu merge Docker.

https://tylermade.ne...d-synology-nas/

de aici pleca frustrarea mea - desi modelul meu are procesor intel, nu e suportat de synology pentru ca e din seria play, deci cu alta destinatie (docker nu este suportat pe niciun model play) - consecinta fiind ca aplicatia pur si simplu nu apare in package center. chestia e ca de vreo 2 ani ma uitam ocazional prin catalog sa vad daca apare ceva legat de docker, si nu gaseam nimic   Posted Image

acum am instalat si eu pachetul manual si merge, sunt doar nervos (jumatate chiar pe mine) ca nu l-am gasit mai devreme Posted Image

Edited by born2lose, 30 March 2020 - 09:46.


#12
HUHA

HUHA

    Junior Member

  • Grup: Members
  • Posts: 82
  • Înscris: 31.12.2008
AM testat si eu si vad ca merge , in cadrul acelui pdf poti sa cauti cuvinte.
Dar se poate merge un pic mai departe ? Exista vreo metoda ca din acel PDF sa exporti in excel ? Gen "avize de insotire a marfii" .

Anunturi

Chirurgia spinală minim invazivă Chirurgia spinală minim invazivă

Chirurgia spinală minim invazivă oferă pacienților oportunitatea unui tratament eficient, permițându-le o recuperare ultra rapidă și nu în ultimul rând minimizând leziunile induse chirurgical.

Echipa noastră utilizează un spectru larg de tehnici minim invazive, din care enumerăm câteva: endoscopia cu variantele ei (transnazală, transtoracică, transmusculară, etc), microscopul operator, abordurile trans tubulare și nu în ultimul rând infiltrațiile la toate nivelurile coloanei vertebrale.

www.neurohope.ro

0 user(s) are reading this topic

0 members, 0 guests, 0 anonymous users

Forumul Softpedia foloseste "cookies" pentru a imbunatati experienta utilizatorilor Accept
Pentru detalii si optiuni legate de cookies si datele personale, consultati Politica de utilizare cookies si Politica de confidentialitate