Jump to content

SUBIECTE NOI
« 1 / 5 »
RSS
polita RCA ONLINE

Va rog recomandati echipa serioa...

Termostat frigider - verificare

Mai au PC-urile vreun viitor?
 Centrala termica immergas

Amenda in Lipsa ?

Acoperire gol extrior intre termo...

Intreprindere individuala fara ac...
 Marci Biciclete - recomandari

Lipsa Tensiune pe o Faza, bransam...

Recomandare bicicleta copil 5 ani.

Recomandare kit automat acces usa
 Stimulente AJOFM

Cumparare auto cu nr Germania afl...

[email][nvidia] Your GeForce NOW ...

Site nesigur
 

Cu diacritice si charset=iso-8859-2, cum se face indexarea?

- - - - -
  • This topic is locked This topic is locked
95 replies to this topic

#1
webc

webc

    Junior Member

  • Grup: Members
  • Posts: 223
  • Înscris: 09.08.2007
Motoarele sunt sensitive la diacritice?

Sa luam de exemplu, Google, care deja este ..."geolocat", dar ma intereseaza si celelalte...

Eu cred ca mai putin de juma de utilizatori (calc, net, web, etc...) in Ro au instalata optiunea de limba, setarile regionale, etc... Ce rezultate le apar lor cand introduc cuvintele pe en spelling, iar pagina tinta este iso-8859-2, si continutul este editat cu diacritice?!

Sau, invers, sa zicem ca utilizatorul are RO pe language bar, scrie corect cu diacritice "bălți, pești" in fereastra de cautare, dar in META si in continutul paginilor tinta sunt "balti" si "pesti"?!

Subliniez ca problema asta nu este asa simpla, adica, "pai scrie corect românește...", atat in META, cat si in continut, cat si in cautare...
Sa mai consideram cazul ca un roman din afara intra de la un calc public si da o cautare unde sa isi petreaca vacanta in tara... Si fiind in Franta, sau Spania, de ex. si fiind calc public, scrie in spelling francez, sau spaniol, sau ma rog, default 8859-1, cum e instalat acolo... Deci nu o sa primeasca rezultate eronate?

Edited by webc, 26 December 2007 - 22:54.


#2
darkstar_tfd

darkstar_tfd

    Member

  • Grup: Members
  • Posts: 461
  • Înscris: 18.08.2005
Rezultatele tot o sa fie, doar ca o sa fie influentate de factorii de care vorbeai tu mai sus

Nu cred ca jumatate au instalata optiunea de limba, incearca sa faci un raport ( use Awstats si Analytics in paralel ) sa vezi care si cum sunt cautarile pentru o pagina care poate avea ambele variante. Cand folosesti diacriticele in numele/url unei pagini rescrise deja ai probleme.

Diferenta dintre text si meta nu ar trebui sa existe, daca faci o pagina o faci intr-un singur fel. Insa nu as acorda asa de multa importanta pentru meta decat poate daca site-ul e nou.  Aici e cam acelasi caz cu folosirea de limbaj comun si limbaj oficial, depinde de ceea ce cauta utilizatorul. E o discutie apropiata de tema asta aici ( citeste commenturile care sa intelegi mai multe ).

Cum spune si Krumel prin articolul ala, exista acea comoditate a utilizatorului. Totusi daca vrei sa fii sigur pe ceea ce vezi si nu pe ceea ce ti se spune, incearca sa faci un raport asa cum ti-am spus mai sus.

Bafta.

Edited by darkstar_tfd, 27 December 2007 - 14:32.


#3
miromulus

miromulus

    c'mon inner peace...!

  • Grup: Senior Members
  • Posts: 9,613
  • Înscris: 25.01.2006
Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste

#4
webc

webc

    Junior Member

  • Grup: Members
  • Posts: 223
  • Înscris: 09.08.2007

 miromulus, on Dec 29 2007, 00:00, said:

Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste
Pai cam aici asteptam niste informatii din surse ..."avizate", --cum se face indexarea, ce se inscrie efectiv in campul/ campurile alea de cuvinte "cheie"?!

Dupa cum spui tu, inseamna ori ca se face o conversie la iso-8859-1 inainte de inregistrare, ori ca inregistrarile se fac impreuna cu o "familie" de cuvinte asociate, sau asa ceva...

#5
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004
ISO/IEC 8859-1 encodeaza caractere pentru a putea fi citite de browsere.

Quote

Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste.
casă, casã, casä, caså.
Nu comentez.  :mellow:

Uite o "nisa": căși.  :coolspeak:

Edited by Krumel, 31 December 2007 - 16:52.


#6
miromulus

miromulus

    c'mon inner peace...!

  • Grup: Senior Members
  • Posts: 9,613
  • Înscris: 25.01.2006
ca sa fiu ceva mai clar - vorbeam de greutatea transferata de un link cu diacritice si unul fara.

Edited by miromulus, 31 December 2007 - 16:51.


#7
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004

 miromulus, on Dec 31 2007, 16:46, said:

ca sa fiu ceva mai clar - vorbeam de greutatea transferata de un link cu diacritice si unul fara.

Greutatea e aceeasi, backlink-ul transfera aceeasi masura/greutate.
Dar, anchor-ul conteaza: allinanchor:casã, allinanchor:casă, allinanchor:casä, allinanchor:caså.

Puterea unui anchor sta in link-ul care il sustine, nu in caracterul de encodare.

#8
webc

webc

    Junior Member

  • Grup: Members
  • Posts: 223
  • Înscris: 09.08.2007

 Krumel, on Dec 31 2007, 16:43, said:

casă, casã, casä, caså. Nu comentez.  :mellow: ..."nisa": căși.  :coolspeak:

Bun exemplul, mersi!

Si totusi, ca sa revenim la "greutatea" continutului, in general, (-si nu a legaturilor, in particular...), care ar fi concluzia?!
Ca odata cu encoding-ul regional, si cu diacriticele specifice, va trebuie sa dezvoltatm cate o teorie pentru fiecare caz in parte: casa, casă, casã, casä, caså, si ...căși  :huh: ?

Chiar e socant cat sunt de diferite rezultatele pe cele 4 exemple, +"căși"=5, +"casa"...6. N-am confruntat chiar toate paginile 2 cate 2, sau 1 vs. 5, sau etc..., dar la prima vedere sunt ridicol de diferite!

Pentru mine e o dovada clara ca "algoritmul" nu are cea mai ...fericita logica. Daca cineva considera ca eu gresesc, rog sa imi spuneti ce elemente neglijez in rationamentul meu...

#9
miromulus

miromulus

    c'mon inner peace...!

  • Grup: Senior Members
  • Posts: 9,613
  • Înscris: 25.01.2006
webc, problema e simpla: de unde sa stie G ca tu vrei sa caut rată sau rață, tară sau țară? Nu e o problema de algoritm, ci o problema de "tastatura" si obsinuinta, daca vrei.

#10
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004

 miromulus, on Jan 3 2008, 23:22, said:

webc, problema e simpla: de unde sa stie G ca tu vrei sa caut rată sau rață, tară sau țară? Nu e o problema de algoritm, ci o problema de "tastatura" si obsinuinta, daca vrei.

Pai Html-ul are niste reguli pe care motoarele de cautare le respecta.
Una din ele e Character encodings.
Declare the Encoding specificarea encodarii unui site, ajuta la citirea lui de catre browsere si roboti.

Tu cum crezi ca inteleg motoarele de cautare diacriticile?
Latin-1 Entities, Character sets & encodings in XHTML, HTML and CSS.

Deasemenea, hostingul poate schimba/influenta encodingul.

Acum legat de anchor: consideram, iportetic macar, ca titlul unui site poate determina o influenta asupra unei pagini raportata la o cautare pe SE`s.
Atunci, buburuză pentru Google e un cuvant cu diacritice "vazut" si interpretat corect, in plus, pe langa afisarile normale la cautare...apar pagini cu titluri cu diactitice.

allinanchor:buburuză

Quote

Allinanchor of a keyword is a Google command that searches Internet pages that contain the keyword in their anchor texts.
Sursa.

Asta inseamna ca paginile afisate pentru allinanchor:buburuză au ca si cuvant buburuză, anchor.

Argumentatia?
allinanchor:buburuză vs. allinanchor:buburuza.

Parerea mea e ca nu greutatea unui anchor e problema si nici encodarea sau folosirea de diacritice, ci faptul ca userii nu folosesc si nu cauta cu diacritice.

#11
miromulus

miromulus

    c'mon inner peace...!

  • Grup: Senior Members
  • Posts: 9,613
  • Înscris: 25.01.2006
Bon, eu acum inteleg unde batea webc. Krumel, raspunsul dat de tine e simplu si la obiect. Dar nu rezolva problema lui webc, asa cum o vad eu. Care e greutatea unui anchor fara diacritice pentru o cautare cu diacritice sau pentru o pagina care foloseste numai diacritice?

Un exemplu, 80% din linkurile catre un site nu au in anchor diacritice iar 20% au. Valorile paginilor sunt relativ egale. Cele 20% din linkuri, ce au diacritice in anchor, vor ajuta cu 20% site-ul pentru o cautare fara diacritice?

#12
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004

 miromulus, on Jan 4 2008, 13:56, said:

Care e greutatea unui anchor fara diacritice pentru o cautare cu diacritice sau pentru o pagina care foloseste numai diacritice?

Nu poti lua ca si greutate doar anchorul, fara valoarea link-ului. De asta Seo nu e macelarie.
Sint conditii de indeplinit pentru un anchor sa poata avea greutate.
Link-urile au greutate, anchorul are relevanta. Deasemnea, link-ul are relevanta daca "leaga" site-uri din aceeasi categorie/domeniu de activitate.

Un anchor fara diacritice poate sustine o pagina pentru o cautare cu diacritice, doar ca relevanta si greutatea e diferita fata de a unui anchor cu diacritice.
Indicat e ca pentru o pagina cu diacritice, sa ai anchor cu diacritice...asta nu inseamna ca un anchor fara diacritice nu e folositor.

Cu cat e folositor un anchor fara diactitice pentru o pagina cu diacritice...asta nu prea iti poti da seama, doar daca link-ul de pe care vine anchorul fara diactritice si relevanta lui fata de site e considerabila.

 miromulus, on Jan 4 2008, 13:56, said:

Un exemplu, 80% din linkurile catre un site nu au in anchor diacritice iar 20% au. Valorile paginilor sunt relativ egale. Cele 20% din linkuri, ce au diacritice in anchor, vor ajuta cu 20% site-ul pentru o cautare fara diacritice?
Vor ajuta site-ul in special pentru cautarea cu diacritice, restul de 80% vor ajuta pentru cautarea fara.
Dar, ca afisare a unor rezultate dupa o cautare (cu sau fara diacritice) cele 20% pot influienta un rezultat in functie de % pe care concurentii il au pentru acea cautare. Sansele sint mici ca la o cautare fara diacritice sa apara rezultate cu. Invers, e valabil.

Trebuie sa luati in calcul si valoarea link-ului de pe care vine anchor-ul. Plus multe alte conditii. Hostingul are deasemenea o influenta.

#13
miromulus

miromulus

    c'mon inner peace...!

  • Grup: Senior Members
  • Posts: 9,613
  • Înscris: 25.01.2006
Si asa am ajuns la inceput: nu stim clar cum influenteaza diacriticele pozitia in SERPs. Situatia e evidenta doar pentru anchor-uri si cautari cu diacritice.

#14
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004
Nu stim cum, stim doar ca influenteaza. :)

#15
webc

webc

    Junior Member

  • Grup: Members
  • Posts: 223
  • Înscris: 09.08.2007

 miromulus, on Jan 4 2008, 16:58, said:

Si asa am ajuns la inceput...
Inca si la inceput si tot ar fi fost bine...

Dar mi-e teama ca ne-am risipit de tot..., pe vre-o 4-5 directii diferite, si ar trebui sa ne (re-) focalizam!

@Krumel, stiu, am auzit, ca esti bun, ca sti..., ca esti documentat pe SEO, dar acum, aici, cred ca miromulus m-a inteles ceva mai bine... Sa nu ma intelegi gresit, ma interseaza comentariile tale, dar pe subiectul, pe aspectul prezentat de mine.

Deci sa ne intoarcem cam aici:

 Krumel, on Jan 4 2008, 10:18, said:

Parerea mea e ca nu greutatea unui anchor e problema si nici encodarea sau folosirea de diacritice, ci faptul ca userii nu folosesc si nu cauta cu diacritice.
Cam de aici incepem sa ne incurcam pentru ca tu ...intorci cauza in efect si efectul in ...cauza!
Pai tocmai asta era premisa de la care plecam eu si anume "ca userii nu folosesc si nu cauta cu diacritice"! Si in functie de asta ce ar fi de facut pentru o cautare relevanta?

Si nu te supara, dar mai departe te si contrazici un pic... Pentru ca undeva spuneai ca nu toate motoarele au aceleasi criterii, proceduri de indexare, ...respectiv afisare a rezultatelor, ca apoi, aici mai sus, sa generalizezi "greutatile" si corespondentele cu si fara diacritice la cam toate motoarele.

In plus rationamentul tau mai este oarecum inconsistent si cu exemplul dat chiar de tine cu case, unde se vede bine la rezultate ca output-ul este confuz si sub aspectul corespondentei meta <--> continut, si cred ca la un studiu mai atent, -si sub aspectul links, anchors, etc... Deci, totul devine nu doar o problema de optimizare din partea webmasterilor, sau de comportament al utilizatorilor, ci si de ..."algoritm"

Deocamdata, va rog sa ne lamurim in primul aspect, anume:
Da! Plecam de la premisa ca userii nu folosesc, sau nu folosesc corect diacriticele (-cum de altfel, ai facut chiar si tu testul acela...).
Si atunci, cum procedam pentru a nu ..."iesi din carti"?! Mai scriem sau nu cu diacritice, mai optimizam sau nu..., mai specificam encoding, sau lasam ...soarta?!?

Edited by webc, 04 January 2008 - 18:09.


#16
darkstar_tfd

darkstar_tfd

    Member

  • Grup: Members
  • Posts: 461
  • Înscris: 18.08.2005
Ca si raspuns la a doua problema pusa de webc, cred ca ar fi interesant de observat urmatoarea situatie.

Exista acest articol pe blog. Articolul este scris de altcineva folosind diacritice, in timp ce eu de obicei scriu fara. Deci chestia cu encodingul e lamurita.
Apoi la verificare search keywords ( thanks to awstats ) gasim cateva ( deci MAI MULTE - nu e singur caz ) pentru " Ãźntâlniri " care defapt e echivalentul ( nu e chiar corect zis, dar sper ca se intelege ideea ) a "intalniri", cuvantul exista si in titlul si spunem ca ne legam si de explicatia lui Krumel de mai sus.

Google search pt respectivul string si observam " Rezultatele 1 - 10 din aproximativ 97 Română pagini pentru Ãźntâlniri. (0,20 secunde) "

Apoi inca un search pentru varianta corect scrisa a "întâlniri" si din nou observam "Rezultatele 1 - 10 din aproximativ 234.000 Română pagini pentru întâlniri. (0,20 secunde)" iar acum la primul rezultat verificam encoding.

E clar ca google s-a dus destul de departe si face legatura chiar daca poate parea o problema cu encoding in prima faza.

Acum sa continuam cu exemplu blogul de mai sus. Avem asa :

http://www.google.ro.....ta=lr=lang_ro
http://www.google.ro.....ta=lr=lang_ro
http://www.google.ro.....ta=lr=lang_ro

Pagina are 0 linkuri spre ea, nu a fost promovata, deci e un simplu blogpost. Nici technoratt, nimic, 0 linkuri.

Nu stiu daca ce am postat pana acum ajuta la foarte multe, insa  sunt argumente pentru a duce discutia mai departe.

#17
Krumel

Krumel

    Active Member

  • Grup: Members
  • Posts: 1,371
  • Înscris: 19.05.2004
webc, discutia asta (fara sa vrea) a ajuns cam pe n directii:
- diacticile nu sint folosite pentru cautari si destul de putin pentru a scrie continut
- encodarea tine de browsere si nu de roboti si indexare
- encodarea poate fi influientata si de hosting
- anchorul cu discritice poate avea o influenta asupra unui site/pagini in functie de anumite criterii
- link-urile sint cele care dau putere unul anchor, iar anchorul creaza relevanta

Probabil aspecte mai sint, astea sint in mare.

Dupa cum vezi, ceea ce ai intrebat e destul de complex si pentru a multumi pe toti trebuie sa desfaci firul in 4. Ca pana la urma sa ne dam seama cu totii ca nu despre asta ai intrebat.

Raspunsul l-ai primit inca din primul post:

Quote

Rezultatele tot o sa fie, doar ca o sa fie influentate de factorii de care vorbeai tu mai sus

Daca o sa urmaresti toate directiile si ipotezele cu argumente din topic, o sa iti dai seama ca subiectul nu e asa usor si ca pentru a primi un raspuns trebuiesc "atacate" mai multe directii.

Eu nu cred ca m-am contrazis cu nimic, mai ales ca am specificat : Seo nu e macelarie. Influentele sint multe, strategiile sint destul de complexe, necunostinta poate da rezultate "spectaculoase".


Am ajuns la inceput, doar ca avem ceva mai multe cunostinte. :)

#18
webc

webc

    Junior Member

  • Grup: Members
  • Posts: 223
  • Înscris: 09.08.2007
@Krumel, vezi ca deja m-ai inteles gresit...?!

Te justifici de parca eu te-asi fi facut pe tine raspunzator ca discutia a deviat. Chiar m-am exprimat "ne-am risipit de tot" <{POST_SNAPBACK}>!
Sigur ca trebuie abordat pe n directii pentru a ajunge la o concluzie in problema asta complexa, spuneam doar sa ne focalizam pe rand asupra unor aspecte, si cand avem ceva concluzii partiale, sa le coroboram pentru a trage o concluzie ...globala.

Uite, eu nu zic sa purtam discutia pe firul meu, mergem pe directiile tale. Spre exemplu:

 Krumel, on Jan 4 2008, 18:36, said:

- diactricile nu sint folosite pentru cautari si destul de putin pentru a scrie continut
(Pentru tot spuneam de contradictii, de a ne contrazice, sau a nu ne ...)

Pai, tocmai, ca din ce in ce mai multe site-uri sunt editate cu diacritice. Asta este o realitate.
Din moment ce vine Google si face interfata pe .ro cu diacritice, iar Mozilla te localizeaza si iti face update-ul si iti da temele direct cu diacriticele limbii respective, mi se pare jenant ca eu ca webmaster sa nu scriu corect in limba mea, pentru utilizatorii tarii mele.

Iar, odata ce utilizatorii se vor obisnui cu keyboard RO, vor incepe sa scrie in fereastra de cautare cu diacritice. Deci, cat de curand diacriticile vor fi "folosite pentru cautari"

Dar, sa lasam asta si sa mergem la urmatoarea ta afirmatie

 Krumel, on Jan 4 2008, 18:36, said:

- encodarea tine de browsere si nu de roboti si indexare
Pai atunci tu cum vezi explicatia propriului tau exemplu cu casele <{POST_SNAPBACK}>, daca encodarea tine de browsere?!??

Si daca nu te deranjeaza (-nici pe tine, nici pe restul vizitatorilor...) zic sa ne oprim un pic asupra rezultatelor acelea complet ridicole. Intrebarea este cum a fost posibil sa afiseze pagini .ro, cu meta si continut .ro, cautari care aveau &atilde; &auml; sau &aring; ... ?!?? (...Ceea ce inseamna ca encodarea nu tine numai de browsere, ci si "de roboti si indexare"!)

Edited by webc, 04 January 2008 - 23:21.


Anunturi

Chirurgia cranio-cerebrală minim invazivă Chirurgia cranio-cerebrală minim invazivă

Tehnicile minim invazive impun utilizarea unei tehnologii ultramoderne.

Endoscoapele operatorii de diverse tipuri, microscopul operator dedicat, neuronavigația, neuroelectrofiziologia, tehnicile avansate de anestezie, chirurgia cu pacientul treaz reprezintă armamentarium fără de care neurochirurgia prin "gaura cheii" nu ar fi posibilă. Folosind tehnicile de mai sus, tratăm un spectru larg de patologii cranio-cerebrale.

www.neurohope.ro

0 user(s) are reading this topic

0 members, 0 guests, 0 anonymous users

Forumul Softpedia foloseste "cookies" pentru a imbunatati experienta utilizatorilor Accept
Pentru detalii si optiuni legate de cookies si datele personale, consultati Politica de utilizare cookies si Politica de confidentialitate