Jump to content

SUBIECTE NOI
« 1 / 5 »
RSS
Recomandare centrala termica apar...

samsung Xcover 5 Nu mai vrea

Telefon de budget pentru filme 10...

Recomandare serviciu / firma recu...
 La mulți ani @Piniuli!

Pret inghetata corso kaufland?

La multi ani @Constantin si Elena...

La mulți ani @Ion_Bumbu!
 Obiecte vechi și inutile car...

Mentenanta Acoperis

Cheder deteriorat , zgariat, cum ...

Laptop HP 15-AF001NQ, AMD E1-6015...
 Blat de bucatarie lungime 4,60 m

Termostat incalzire si racire

Configurare retea cu modem Vodafo...

Curtea Penala Internationala soli...
 

Imacros ajutor

- - - - -
  • Please log in to reply
24 replies to this topic

#1
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Buna, doresc sa fac un script care sa imi extraga datele de pe un site, folosind programul Imacros pentru Chrome.

VERSION BUILD=5301016 RECORDER=CR
TAB T=1
TAG POS=1 TYPE=H1 ATTR=TXT:* EXTRACT=TXT
SET !VAR1 {{!EXTRACT}}
SET !EXTRACT NULL

TAG POS=1 TYPE=DIV ATTR=CLASS:product_text&&TXT:* EXTRACT=TXT
SET !VAR2 {{!EXTRACT}}
SET !EXTRACT NULL

TAG POS=1 TYPE=DIV ATTR=CLASS:price&&TXT:* EXTRACT=TXT
SET !VAR3 {{!EXTRACT}}
SET !EXTRACT NULL

Codul problema este la VAR2, si anume, imi extrage textul, dar fara formatarea de pe site (eu as vrea exact ca si acolo)

http://anunturi-auto...07-1140166.html  --> un exemplu de descriere.

Va multumesc pentru ajutor.

#2
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006
Incearca EXTRACT=HTM  in loc de EXRACT=TXT


P.S. Ce vrei sa faci cu textul extras? Poate iti da cineva o varianta mai eleganta. Am fost si sunt mare fan al iMacrosului, dar sunt alte solutii mai eficiente decat el.

Edited by kruger, 15 February 2016 - 12:32.


#3
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
cu HTM imi scoate textul cu <br><p> etc :) deci nu ma ajuta.

Vreau sa extrag TITLUL, DESCRIEREA si PRETUL pentru a pune anunturile pe un alt site (sa nu mai dau copy paste manual, etc). Pentru auto fill la campurile respective de pe celalalt site, am codul, dar numai descrierea imi da batai de cap.

#4
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 15 februarie 2016 - 12:34, said:

cu HTM imi scoate textul cu <br><p> etc Posted Image deci nu ma ajuta.

Vreau sa extrag TITLUL, DESCRIEREA si PRETUL pentru a pune anunturile pe un alt site (sa nu mai dau copy paste manual, etc). Pentru auto fill la campurile respective de pe celalalt site, am codul, dar numai descrierea imi da batai de cap.
Posted Image
Pai vezi, de asta te-am intrebat ce vrei sa faci cu descrierea. Ai zis ca vrei formatarea, pai tag-urile alea <br><p> asta fac: formateaza textul sa arate ca acolo pe anunturi-auto. Ce extragi cu HTM poti pune in html-ul site-ului tau.
Explica te rog ce vrei sa spui cand zici ca vrei sa iei "formatarea textului"

Edited by kruger, 15 February 2016 - 13:38.


#5
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Etrier Fata Dreapta Citroen C4  1.4 Benzina 2007Ani fabricare model:20042005200620072008200920102011An: 2007Motorizare: 1.4 BenzinaNumar stoc masina: 131 Dezmembrari CoruncaOferim livrare si garantie oriunde in tara.Piesele sunt verificate inainte de a fi puse in vanzare. ---> el asa imi extrage cu TXT.

Eu as vrea sa arate descrierea frumos, pe randuri cum e si pe 4tuning. Site-ul pe care urmeaza sa pun, nu stie de html, deci ar fi cu tot cu tag-uri.

#6
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006
Uite, ruleaza scriptul asta putin:
VERSION BUILD=8961227 RECORDER=FX
TAB T=1
URL GOTO=http://anunturi-auto.4tuning.ro/etriere/mures/etrier-fata-dreapta-citroen-c4-1-4-benzina-2007-1140166.html
TAG POS=1 TYPE=DIV ATTR=CLASS:product_text&&TXT:* EXTRACT=HTM
SAVEAS TYPE=EXTRACT FOLDER=* FILE=test.htm


Asta iti face un fisier "test.htm" in folderul Downloads din iMacros. Deschide fisierul in browser si zi-mi daca arata cum vrei tu. Apoi mergem mai departe.

Edited by kruger, 15 February 2016 - 16:18.


#7
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Il face "test.htm.csv", daca sterg csv, intr-adevar, il deschid cu browserul, arata cum trebuie.

#8
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 15 februarie 2016 - 16:44, said:

Il face "test.htm.csv", daca sterg csv, intr-adevar, il deschid cu browserul, arata cum trebuie.
Ok iar tu vrei sa pui informatia aia pe un alt site... ca sa arate asa, trebuie sa o scrii in felul ala. :)

#9
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011

View Postkruger, on 15 februarie 2016 - 19:34, said:

Ok iar tu vrei sa pui informatia aia pe un alt site... ca sa arate asa, trebuie sa o scrii in felul ala. Posted Image

doar ca orice-as face, ori nu aranjeaza calumea, ori mi-o copiaza cu tot cu tag-uri html :D am facut o metoda mai putin practica, dar...o sa ma folosesc de ea daca altfel nu pot :(

#10
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Am linkul http://anunturi-auto...s&filter=active si vreau sa extrag linkurile din td-ul class "col_title".

Am codul de mai jos:

VERSION BUILD=8340723 RECORDER=CR
SET !EXTRACT_TEST_POPUP NO
TAG POS={{!LOOP}} TYPE=TD ATTR=CLASS:col_title*
TAG POS=R{{!LOOP}} TYPE=A ATTR=TXT:* EXTRACT=HREF
SAVEAS TYPE=EXTRACT FOLDER=* FILE=urls.csv


dar nu merge ...imi extrage bine linkul 1,4,7,10,13, etc.

#11
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 17 februarie 2016 - 14:45, said:

Am linkul http://anunturi-auto...s&filter=active si vreau sa extrag linkurile din td-ul class "col_title".

Am codul de mai jos:

VERSION BUILD=8340723 RECORDER=CR
SET !EXTRACT_TEST_POPUP NO
TAG POS={{!LOOP}} TYPE=TD ATTR=CLASS:col_title*
TAG POS=R{{!LOOP}} TYPE=A ATTR=TXT:* EXTRACT=HREF
SAVEAS TYPE=EXTRACT FOLDER=* FILE=urls.csv


dar nu merge ...imi extrage bine linkul 1,4,7,10,13, etc.
Trebuie sa fii logat ca sa ajungi pe pagina de unde extragi alea? Pentru ca eu nu gasesc niciun element care sa aiba clasa aia.
In plus, vad ca tu incrementezi atat pozitia ancorei cat si a elementului fata de ancora ... esti sigur ca asta vrei ?

Edited by kruger, 17 February 2016 - 14:52.


#12
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Da, e pagina cu anunturile de pe contul respectiv. Am tot incercat cu "tag pos=1, tag pos=R{{!LOOP}" etc...cam toate variantele posibile aici, poate gresesc eu...daca vreau toate linkurile de pe pagina, mi le extrage, dar eu vreau numai cele din titlul anuntului (care duce la anuntul respectiv), nu de pe toata pagina.

#13
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 17 februarie 2016 - 14:56, said:

Da, e pagina cu anunturile de pe contul respectiv. Am tot incercat cu "tag pos=1, tag pos=R{{!LOOP}" etc...cam toate variantele posibile aici, poate gresesc eu...daca vreau toate linkurile de pe pagina, mi le extrage, dar eu vreau numai cele din titlul anuntului (care duce la anuntul respectiv), nu de pe toata pagina.
Flirteaza putin cu javascript. De exemplu:

var count = 10 //pui tu aici nr. de anunturi la care vrei sa iei titlul
for (i=1;i<=count;i++){
	macro = "CODE:";
	macro += "SET !EXTRACT NULL" + "\n";
	macro += "TAG POS="+ i +"TYPE=TD ATTR=CLASS:col_title EXTRACT=HREF*";
	iimPlay(macro);
	titlu = iimGetLastExtract(1);
	save_results(titlu)
}
function save_results(titlu){
	macro = "CODE:";
	macro += "SET !EXTRACT NULL" + "\n";
	macro += "SET !EXTRACT " + titlu + "\n";
	macro += "SAVEAS TYPE=EXTRACT FOLDER=* FILE=titluri.csv" + "\n";
	iimPlay(macro);
}


Tagul ala unde fac EXTRACT nu cred ca e cel pe care il vrei tu...poti sa il corectezi, dar zi-mi daca intelegi care e ideea scriptului. Apropo, trebuie sa il salvezi cu extensia .js  dar il vei vedea in iMacros sidebar langa .iim-uri Posted Image

Edited by kruger, 17 February 2016 - 15:23.


#14
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Nu salveaza nimic...

NS_ERROR_FILE_IS_LOCKED: Component returned failure code: 0x8052000e (NS_ERROR_FILE_IS_LOCKED) [nsIFileOutputStream.init], line 3 (Error code: -1001)

Edited by d4rk_ang3l91, 17 February 2016 - 15:29.


#15
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 17 februarie 2016 - 15:29, said:

Nu salveaza nimic...

NS_ERROR_FILE_IS_LOCKED: Component returned failure code: 0x8052000e (NS_ERROR_FILE_IS_LOCKED) [nsIFileOutputStream.init], line 3 (Error code: -1001)
Asigura-te ca fisierul nu e deschis in vreun program sau schimba-i numele.

#16
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Nu mai da eroarea, dar nu imi salveaza nimic...un fisier csv gol.

https://drive.google...iew?usp=sharing

am atasat un print, cu codul site-ului.

Pe mine ma intereseaza linkul la fiecare anunt de pe pagina respectiva, doar linkul, fara titlu, fara nimic.

Edited by d4rk_ang3l91, 17 February 2016 - 15:49.


#17
kruger

kruger

    Guru Member

  • Grup: Moderators
  • Posts: 11,928
  • Înscris: 04.02.2006

View Postd4rk_ang3l91, on 17 februarie 2016 - 15:42, said:

Nu mai da eroarea, dar nu imi salveaza nimic...un fisier csv gol.
Bun, asta pentru ca nu a gasit elementul pe care ai incercat sa il extragi. Cum spuneam mai sus, tag-ul ala nu e bun pentru ca n-am cum sa vad exact ce vrei tu sa extragi neavand acces la pagina.

Ai folosit ancore mai sus; spune-mi, ai mai lucrat cu ancore in iMacros pana acum si esti sigur ca ai nevoie de ele ca sa iei titlurile, sau poate e suficient sa incrementezi POS  ?

Edited by kruger, 17 February 2016 - 15:51.


#18
d4rk_ang3l91

d4rk_ang3l91

    Member

  • Grup: Members
  • Posts: 379
  • Înscris: 23.11.2011
Nu am lucrat foarte mult, doar ceva simplu. Am gasit exemplu "excractandfill" de la ei, si am incercat sa il adaptez...

Anunturi

Second Opinion Second Opinion

Folosind serviciul second opinion ne puteți trimite RMN-uri, CT -uri, angiografii, fișiere .pdf, documente medicale.

Astfel vă vom putea da o opinie neurochirurgicală, fără ca aceasta să poată înlocui un consult de specialitate. Răspunsurile vor fi date prin e-mail în cel mai scurt timp posibil (de obicei în mai putin de 24 de ore, dar nu mai mult de 48 de ore). Second opinion – Neurohope este un serviciu gratuit.

www.neurohope.ro

0 user(s) are reading this topic

0 members, 0 guests, 0 anonymous users

Forumul Softpedia foloseste "cookies" pentru a imbunatati experienta utilizatorilor Accept
Pentru detalii si optiuni legate de cookies si datele personale, consultati Politica de utilizare cookies si Politica de confidentialitate