Googlebot


mr_ady_bmw


Cum pot folosi aceste informatii furnizate de Googlebot? Sau ce pot sa fac sa le imbunatatesc? Sunt bune sau sunt rele? biggrin.gif
soul4blade
pai astea exista deja, tu poti face variatiuni pe care observi ca nu le-ai cuprins in linkurile externe (alte saituri catre tine)...
 
mr_ady_bmw
La statistici Sitemaps imi arata asa:

Sitemap stats
Total URLs: 347
Indexed URLs: 0

Ce anume reprezinta acel "indexed URLs"? E ok daca e zero, sau ar trebui sa fie mai mare sau chiar egal cu "Total URLs"?
again
ar trebuii sa fie egal cu total urls
mr_ady_bmw
QUOTE (again @ May 15 2009, 17:05) *
ar trebuii sa fie egal cu total urls


Ok, dar ce reprezinta acele URLs? Site-ul e vechi de aproximativ 1 an si acel indexed e tot zero? sad.gif
ciuly
exista mai multe motive pt care in sitempa ai x url-uri dar la indexate sunt mai putine, si teoretic cel putin (si chiar practic daca te chinui) poti avea in sitemap mai putine urluri decat indexate.
practic, tu pe site ai niste urluri, A. in sitemap ai niste urluri, B. ele nu sunt neaparat egale. in marea majoritate a cazurilor A>B.
apoi gogu iti indexeaza niste urluri de la site, C. in general A>C. deasemenea, B-C si C-B nu sunt neaparat egale, adica vei avea urluri in sitemap care nu sunt indexate si poti avea urluri indexate care nu sunt in sitemap.

acuma, analizand cazul tau particular, tu ai niste urluri in sitemap dar nici unul din el enu e indexat. lucru destul de ciudat. se pune intrebarea: paginile respective sunt resurse neindexabile? link-uri catre cine stie ce tipuri de fisiere nerecunoscute de google, sau pagini html care sunt cu noindex, sau poate ca sunt blocate din robots.txt.

treaba e sa iei primul link de acolo si sa vezi de ce gogu nu il inghite. verifici robots.txt ca prim pas si apoi, daca nimic, verifici continutul paginii. il treci si ptrin-un validator html ( http://validator.w3.org/ ) si vezi daca ai mult prea multe erori, le corectezi. se prea poate ca sa ai foarte multe erori si robotu de indexare sa zica pas. el poate lucra cu un anumit numar si anumite tipuri de erori, dar are si el limitarile lui si unele chestii nu pot fi ghicite sau nu au un comportament default.
mr_ady_bmw
QUOTE (ciuly @ May 16 2009, 20:42) *
exista mai multe motive pt care in sitempa ai x url-uri dar la indexate sunt mai putine, si teoretic cel putin (si chiar practic daca te chinui) poti avea in sitemap mai putine urluri decat indexate.
practic, tu pe site ai niste urluri, A. in sitemap ai niste urluri, B. ele nu sunt neaparat egale. in marea majoritate a cazurilor A>B.
apoi gogu iti indexeaza niste urluri de la site, C. in general A>C. deasemenea, B-C si C-B nu sunt neaparat egale, adica vei avea urluri in sitemap care nu sunt indexate si poti avea urluri indexate care nu sunt in sitemap.

acuma, analizand cazul tau particular, tu ai niste urluri in sitemap dar nici unul din el enu e indexat. lucru destul de ciudat. se pune intrebarea: paginile respective sunt resurse neindexabile? link-uri catre cine stie ce tipuri de fisiere nerecunoscute de google, sau pagini html care sunt cu noindex, sau poate ca sunt blocate din robots.txt.

treaba e sa iei primul link de acolo si sa vezi de ce gogu nu il inghite. verifici robots.txt ca prim pas si apoi, daca nimic, verifici continutul paginii. il treci si ptrin-un validator html ( http://validator.w3.org/ ) si vezi daca ai mult prea multe erori, le corectezi. se prea poate ca sa ai foarte multe erori si robotu de indexare sa zica pas. el poate lucra cu un anumit numar si anumite tipuri de erori, dar are si el limitarile lui si unele chestii nu pot fi ghicite sau nu au un comportament default.


Oau, mersi. Am accesat acel validator si am o gramada de erori sad.gif 167 sad.gif Naspa rau de tot.
Ai putea sa ma ajuti?
 
mr_ady_bmw
Salut, am verificat robots.txt si spre surprinderea am gasit urmatoaele lucruri notate acolo:
User-agent: *
Disallow:
Sitemap: http://www.nume.org/sitemap.xml.gz
Banuiesc ca acel "disallow" nu prea are ce cauta acolo, astfel l-am inlocuit cu asta:
[b]User-Agent: *
Allow: /.


Asta sa fie o cauza pentru care google nu mi-a indexat nici o pagina?

O alta cauza banuiesc ca sunt acele erori care mi-au rezultat in urma verificarii pe http://validator.w3.org/, doar ca acolo imi apareau o gramada de erori, iar cand intram in sursa situl nu gaseam care e greseala.
Am adaugat aici 2 printscreen-uri sa vedeti si voi.
ciuly
validatoru ala iti sp
une care e eroarea, si unde. in plus iti explica si de ce nu e bine. so, in loc sa ghocesti in orez, mai bine ia prima eroare raportata, vezi pe ce linie e in fisier, du-te pe lina aia si vezi ce ai tu si ce zice validatoru ca nu e bine. daca nu te pricpei fie postezi aici siteul (ca noi cel putin nu stim sa ghicim care e) fie angajezi pe cine, fie inveti.
si apropo de invatat, daca te bagi in ceva si habar n-ai despre ce e vorba, inainte sa faci vreo modificare, documenteaza-te: http://www.google.ro/search?hl=en&q=ro...G=Google+Search
mr_ady_bmw


QUOTE (ciuly @ May 17 2009, 15:41) *
validatoru ala iti sp
une care e eroarea, si unde. in plus iti explica si de ce nu e bine. so, in loc sa ghocesti in orez, mai bine ia prima eroare raportata, vezi pe ce linie e in fisier, du-te pe lina aia si vezi ce ai tu si ce zice validatoru ca nu e bine. daca nu te pricpei fie postezi aici siteul (ca noi cel putin nu stim sa ghicim care e) fie angajezi pe cine, fie inveti.
si apropo de invatat, daca te bagi in ceva si habar n-ai despre ce e vorba, inainte sa faci vreo modificare, documenteaza-te: http://www.google.ro/search?hl=en&q=ro...G=Google+Search


Ok, mi-am dat si eu seama si am mai corectat cateva erori, insa sunt unele care nu ai cum sa le modifici deoarece sunt erori de la tot felul de scripturi, cum ar fi, scriptul de contoizare d ela trafic.ro si wta.ro, embeded videos de pe youtube, etc.
Acelea cum poti sa le modifici? Nu ai cum.
In final mi-am permis sa erific pe validator si forumul softpedia si spre surprinderea mea si aici sunt erori, la fel si youtube.com are erori. Asta inseamna ca si aceste site-uri au probleme cu indexarea paginilor din cauza aceasta?
ciuly
reciteste atent ce am spus in ultima parte a postului #6.
mr_ady_bmw
QUOTE (ciuly @ May 16 2009, 19:42) *
acuma, analizand cazul tau particular, tu ai niste urluri in sitemap dar nici unul din el enu e indexat. lucru destul de ciudat. se pune intrebarea: paginile respective sunt resurse neindexabile? link-uri catre cine stie ce tipuri de fisiere nerecunoscute de google, sau pagini html care sunt cu noindex, sau poate ca sunt blocate din robots.txt.


Treaba e ca am citit si pe robots.org si am vazut in mare cam cum ar trebui sa arate un robots.txt astfel incat googlebot sa acceseze paginile. tin sa anunt ca nu am continut interzis sau blocat, ca sa vedeti si voi va las link-ul aici Ziceti si voi daca vi se pare ca am continut blocat sau catre pagini care google nu le accepta.


QUOTE (ciuly @ May 16 2009, 19:42) *
treaba e sa iei primul link de acolo si sa vezi de ce gogu nu il inghite. verifici robots.txt ca prim pas si apoi, daca nimic, verifici continutul paginii. il treci si ptrin-un validator html ( http://validator.w3.org/ ) si vezi daca ai mult prea multe erori, le corectezi. se prea poate ca sa ai foarte multe erori si robotu de indexare sa zica pas. el poate lucra cu un anumit numar si anumite tipuri de erori, dar are si el limitarile lui si unele chestii nu pot fi ghicite sau nu au un comportament default.


Da, am citit si paragraful asta si din 167 erori cate aveam acum 2 zile, am redus numarul lor la 13, destul de ok, avand in vedere ca au ramas doar acele erori care am zis si in postul precedent ca aprtin trafic.ro, wta.ro.
ciuly
vad ca ti wordpress: asta ti-ai instalat? daca nu, nu e nici un bai. dar e un +
google are indexate pagini de la tine destule
m-am uitta la sitemapu tau. nu stiu de unde ne-ai zis tu de 347 de url-uri in sitemap ca eu vad numai 8. mai mult, arata destul de ciudat acolo cu unele link-uri avand frecventa de schimbare lunara, iar altele cu ultimele schimbari din aprilie. ma rog, daca chiar asa stau lucrurile, nu ma mir ca gogu nu intra. pai daca tu ii spui ca pagina cutare s-a schimbat anu trecut ultima oara, si gogu a trecut de atunci prin ea amu 9 luni, doar nu te astepti de la el sa treaca si azi prin ea.
de ex /stiri-de-ultima-ora/ are frecventa de schimbare lunara? sa fim seriosi. sigur, chestiile astea se intampal cand folosesti nu stiu ce tooluri care probabil nu sunt configurate corect sau .. continutul chiar nu se schimba.
mr_ady_bmw
QUOTE (ciuly @ May 18 2009, 10:34) *
vad ca ti wordpress: asta ti-ai instalat? daca nu, nu e nici un bai. dar e un +
google are indexate pagini de la tine destule
m-am uitta la sitemapu tau. nu stiu de unde ne-ai zis tu de 347 de url-uri in sitemap ca eu vad numai 8. mai mult, arata destul de ciudat acolo cu unele link-uri avand frecventa de schimbare lunara, iar altele cu ultimele schimbari din aprilie. ma rog, daca chiar asa stau lucrurile, nu ma mir ca gogu nu intra. pai daca tu ii spui ca pagina cutare s-a schimbat anu trecut ultima oara, si gogu a trecut de atunci prin ea amu 9 luni, doar nu te astepti de la el sa treaca si azi prin ea.
de ex /stiri-de-ultima-ora/ are frecventa de schimbare lunara? sa fim seriosi. sigur, chestiile astea se intampal cand folosesti nu stiu ce tooluri care probabil nu sunt configurate corect sau .. continutul chiar nu se schimba.


Mersi pentru plugin, il downloadez si il instalez, iar problema cu linkuri-le din sitemap e urmatoarea: Pentru acel site am instalate 3 wordpres-uri, iar pt fiecare wordpress am cate un sitemap sad.gif Asa am crezut atunci cand l-am facut ca e cel mai bine, dar cred ca m-am inselat biggrin.gif Ce probleme sunt daca am mai multe sitemap-uri pt acelasi domeniu cum ar veni? U unde te-ai uitat sa vezi cate pagini are situ-l meu indexate?
ciuly
am zis eu undeva cate pagini are siteul tau indexate? ma indoiesc. eu in postul de mai sus am vorbit doar de sitemap. pt pagini indexate exista diverse tehnici si tooluri mentionate de nu stiu cate ori pe aici pe forum. cauta.
sitemap este, dupa cum spune cuvantul, o harta al unui site. un site este nume.tld, unde nume este compus dintr-unul sau mai multe subdomenii. ("nume" este subdomeniu al .tld, unde tld e top level domain: .ro, .com. net, samd)
prin urmare, nu conteaza cate softuri ai instalate pe un site, va fi doar un singur sitemap. un sitemap per site. daca ai de ex
domeni/
domeniu/pagina/
domeniu/altapagina/
cele 3 softuri instalate, atunci cele 3 sitemapuri generate de ele trebuiesc merge-uite, corect, intr-unul singur.
daca in schimb ai
domeniu
pagina.domeniu
altapagina.domeniu
atunci vei avea 3 sitemapuri independente
pt ca daca in oricare din variante, tu generezi sitemul sa fie
domeniu/sitemap.xml
atunci fiecare soft va suprascrie respectivul sitemap.
soul4blade
iar ca sa vezi cate pagini ai indexate e simplu...
scrie in Google

site:domeniultau.ro

ciuly
nu-l prosti pe om smile.gif sa ii spunem ca in google, respectiva cautare va afisa doar unele din paginile indexate. yahoo e ceva mai relaxat si ofera mai multe informatii, dar trebuie tinut cont ca e posibil ca yahoo sa fi indexat mai multe pagini ca google. valabil si la restu motoarelor. cel mai sigur de verificat care pagina si cand a fost vizitata (nu implica neaparat si indexarea in acel moment) este pe baza logurilor serverului web. dar asta deja e ceva mai complicat si mai ales nu e accesibil oricui.
mr_ady_bmw
QUOTE (ciuly @ May 19 2009, 02:17) *
am zis eu undeva cate pagini are siteul tau indexate? ma indoiesc. eu in postul de mai sus am vorbit doar de sitemap. pt pagini indexate exista diverse tehnici si tooluri mentionate de nu stiu cate ori pe aici pe forum. cauta.
sitemap este, dupa cum spune cuvantul, o harta al unui site. un site este nume.tld, unde nume este compus dintr-unul sau mai multe subdomenii. ("nume" este subdomeniu al .tld, unde tld e top level domain: .ro, .com. net, samd)
prin urmare, nu conteaza cate softuri ai instalate pe un site, va fi doar un singur sitemap. un sitemap per site. daca ai de ex
domeni/
domeniu/pagina/
domeniu/altapagina/
cele 3 softuri instalate, atunci cele 3 sitemapuri generate de ele trebuiesc merge-uite, corect, intr-unul singur.
daca in schimb ai
domeniu
pagina.domeniu
altapagina.domeniu
atunci vei avea 3 sitemapuri independente
pt ca daca in oricare din variante, tu generezi sitemul sa fie
domeniu/sitemap.xml
atunci fiecare soft va suprascrie respectivul sitemap.


Ok, si atunci cum as putea sa fac sa am un singur sitemap? Am adaugat un plugin la wordpress XML-Sitemap, care genereaza automat, adica modifica sitemap-ul cand modifici ceva pe site, insa cum am zis si mai sus nu am reusit sa fac un singur sitemap pentru tot situl. Acel plugin iti da oportunitatea sa alegi unde exact este acel sitemap pe site, iar daca la fiecare soft pun acelasi url pentru sitemap nu e bine deoarece in sitemap imi arata doar linkuri de la ultimul soft care l-am modificat sad.gif
ciuly
uite un raspuns bun la problema ta: http://googlewebmastercentral.blogspot.com...-directory.html
am mai invatat si eu ceva cu ocazia asta biggrin.gif
mr_ady_bmw
QUOTE (ciuly @ May 19 2009, 16:31) *
uite un raspuns bun la problema ta: http://googlewebmastercentral.blogspot.com...-directory.html
am mai invatat si eu ceva cu ocazia asta biggrin.gif


Ok, am facut ce au zis ei ... sau cel putin asa cred. Am facut un fisier .xml cum au aratat ei in model, dar cand il deschid in browser nu imi apare nimic deosebit. Imi apare acel cod care l-am facut eu. Nu ar trebui sa apara linkurile de la toate sitemap-urile cumulate? sad.gif
ciuly
nu. dar eu in http://www.movie-time.org/sitemap.xml vad tot ce era si inainte.
mr_ady_bmw
QUOTE (ciuly @ May 19 2009, 16:54) *
nu. dar eu in http://www.movie-time.org/sitemap.xml vad tot ce era si inainte.


Da, i-am dat de capat. Am adaugat sitemap_index.xml pe server si apoi l-am adaugat si in contul de la google webmaster tools si astfel imi arata ca imi adauga toate url-urile din restul sitemap-urilor care le-am selecat.
E tare chestia asta, sa speram ca da rezultate wink.gif Uite asa arata sitemap_index.xml

Intrebarea mea este: Ar trebui sa streg celelate sitemap-uri din google webmaster tools sau sa le las acolo? Eu ma gandeam ca daca las si alea si sitemap_index s-ar putea sa imi dubleze fiecare URL, si asta am vazut ca mi-a si scris la total URL 760, in loc de 380 cate aveam inante.
Reclama
In curand... autoevolution.ro

Teste, stiri, ghiduri, jurnale, forum si multe altele!
Aceasta este o versiune simplificatã a paginii originale. Pentru a vizita versiunea originala click aici.