Forumul SoftpediaBursa auto / moto / veloAnunƣuri imobiliareAnunƣuriOferte de serviciiLocuri de muncă Ɵi cursuri de specializareBloguriJocuriTeste / ReviewsÎntrebări Ɵi răspunsuriChestionareFotoStatistici

Bine ai venit ( Autentificare | Înregistrare )

> Atentie!

Discuțiile despre scripturi și aplicatii web (CMS-uri, galerii foto, forumuri, bloguri precum Wordpress, etc, în PHP sau nu) se desfășoară pe o arie dedicată (Webmaster).

Discuțiile despre baze de date (proiectare, optimizare, query-uri, etc) se desfășoară tot pe o arie dedicată (Database).

Întrebarile avansate țin în mare de: XML, OOP Patterns, design algoritmic (nu vizual), securitate, regexps, frameworks, decizii, compromise, modularizare, fezabilitate. Dacă nu ai o idee concretă în teorie și în practică despre toți acești termeni, atunci întreabă mai întâi pe subforumul Începatori.

 
Reply to this topicStart new topic
> citire pdf
_Zack_
mesaj 8th November 2009, 19:47
Mesaj #1


Junior

Grup: Members
Mesaje: 281
Data înscrierii: 8-August 07
Locație: De nicaieri
ID membru: 211 899





am facut un script php care citeste fisierele pdf de o anumita forma (cele care daca le deschizi cu notepad gasesti de exemplu un cod de genul:
CITAT
ET
BT
/F1 8.04 Tf
54.4000 246.0320 Td
(text )Tj

iar "text" din paranteze este un text carese afiseaza in pdf daca il deschizi cu adobe pdf reader)
acum am nevoie sa modific scriptul sa citeasca si fisierele pdf pe care daca le deschizi cu notepad gasesti un cod ca in imaginea afisata
care e diferenta intre cele doua tipuri de fisiere pdf? doar versiunea (1.3 respectiv 1.5 in exemple) ? cum as putea adapta scriptul?
Fișiere atașate
Fișier atașat  2.png ( 31.69KB ) Număr de descărcări: 34
 
Go to the top of the page
 
+Quote Post
_Zack_
mesaj 9th November 2009, 18:59
Mesaj #2


Junior

Grup: Members
Mesaje: 281
Data înscrierii: 8-August 07
Locație: De nicaieri
ID membru: 211 899



am incercat cu pdf2ps si ps2pdf13 dar ramane la fel daca il deschid cu notepad
nu poate fi extras textul din astfel de fisiere?
Go to the top of the page
 
+Quote Post
OriginalCopy
mesaj 9th November 2009, 19:05
Mesaj #3


I'm harmful, fear me please! :))

Grup: Moderators
Mesaje: 4 940
Data înscrierii: 10-August 06
Locație: .AT
ID membru: 90 638



Va trebui sa te uiti atent la fisier. Deschide-l cu un viewer (okular sub linux/kde4 afiseaza astfel de informatii) si vezi ce versiune are fisierul - formatul PDF exista in mai multe versiuni, cum este si cazul HTML de exemplu.

Acest mesaj a fost modificat de OriginalCopy: 9th November 2009, 19:08
Go to the top of the page
 
+Quote Post
_Zack_
mesaj 9th November 2009, 20:01
Mesaj #4


Junior

Grup: Members
Mesaje: 281
Data înscrierii: 8-August 07
Locație: De nicaieri
ID membru: 211 899



nu am linux pe pc eu am incercat comenzile alea in php cu exec pe server
dar versiunea formatului nu este cea de care am zis si eu mai sus? 1.3 1.4 etc
Go to the top of the page
 
+Quote Post
OriginalCopy
mesaj 9th November 2009, 20:35
Mesaj #5


I'm harmful, fear me please! :))

Grup: Moderators
Mesaje: 4 940
Data înscrierii: 10-August 06
Locație: .AT
ID membru: 90 638



Nu cred ca poate cineva sa-ti spuna ce versiune este doar uitandu-se la un screenshot cu o reprezentare binara, iar tu parca scoti din burta 1.3, 1.4 ...
Eventual ataseaza pdf-ul, daca nu ai un program care-ti afiseaza versiunea formatului.
Oricum, intrebarea ta "cum adaptez scriptul" este foarte complexa.
Go to the top of the page
 
+Quote Post
_Zack_
mesaj 9th November 2009, 20:43
Mesaj #6


Junior

Grup: Members
Mesaje: 281
Data înscrierii: 8-August 07
Locație: De nicaieri
ID membru: 211 899



nu am zis ca nu stiu ce versiune este (in adobe reader->proprietes scrie versiunea) am zis doar ca din fisierul cu formatul 1.3 poate fi extras textul iar din celalalt 1.5 nu poate fi extras pentru ca textul afisat de adobe reader nu se afla si in ceea ce citesc cu php din fisier
exista vreo solutie sa pot extrage textul din versiunile de format pdf mai noi (1.5,1.6,1.7)?
Go to the top of the page
 
+Quote Post
OriginalCopy
mesaj 9th November 2009, 20:54
Mesaj #7


I'm harmful, fear me please! :))

Grup: Moderators
Mesaje: 4 940
Data înscrierii: 10-August 06
Locație: .AT
ID membru: 90 638



Va trebui sa te documentezi cu privire la versiunea formatului PDF care te intereseaza (nu stiu daca adobe ofera o referinta). Oricum, probabil exista deja o clasa ceva pentru acea versiune, pe care o poti ori 1. folosi direct, in locul ce ai facut tu sau 2. citi si intelege formatul dupa ce vezi ce face acel cod, apoi extinde "scriptul" tau.

Un google dupa: pdf format 1.5 reference
ar trebui sa-ti fie de ajuns.

Dupa o privire mai atenta, se pare ca PDF ofera compresie, deci probabil vezi acel text binar si nu "cod normal" pentru ca este compresat cu LZW, CCITT sau JPEG/JPEG2000


Acest mesaj a fost modificat de OriginalCopy: 9th November 2009, 20:50
Go to the top of the page
 
+Quote Post
_Zack_
mesaj 19th November 2009, 23:58
Mesaj #8


Junior

Grup: Members
Mesaje: 281
Data înscrierii: 8-August 07
Locație: De nicaieri
ID membru: 211 899



mersi de ajutor
scuze de raspunsul intarziat
am gasit si am folosit asta: http://en.wikipedia.org/wiki/Pdftotext
Go to the top of the page
 
+Quote Post
Reclama
mesaj A minute ago
Mesaj #




Grup: Bot






In curand... autoevolution.ro

Teste, stiri, ghiduri, jurnale, forum si multe altele!
Go to the top of the page
 

Reply to this topicStart new topic
1 utilizatori citesc acest subiect (1 utilizatori neautentificați și 0 anonimi)
0 Membri:

 

RSS Versiune simplificată Data: 22nd November 2009 - 16:01
© 2001 - 2009 Softpedia. All rights reserved.
Softpedia® and Softpedia logo are registered trademarks of Soft News NET SRL.
Privacy Policy | Terms of Use | Contact Softpedia