Forumul SoftpediaBursa auto / moto / veloAnunƣuri imobiliareAnunƣuriOferte de serviciiLocuri de muncă Ɵi cursuri de specializareBloguriJocuriTeste / ReviewsÎntrebări Ɵi răspunsuriChestionareFotoStatistici

Bine ai venit ( Autentificare | Înregistrare )

> REGULI

In cadrul acestei arii sunt permise doar discutiile pe tematici liber alese de catre WEBMASTERI !!!

NU SUNT permise link-urile decat cele catre articole de interes relevante si din surse consacrate !

Linkurile catre site-uri vor fi acceptate doar ca fiind relevante si de stricta necesitate pentru discutii.
Editarea lor se afla la discretia moderatorilor.

SPAM-ul va fi aspru pedepsit !

6 V   1 2 3 > »   
Closed TopicStart new topic
> Cu diacritice si charset=iso-8859-2, cum se face indexarea?, Trebuie sa punem doua randuri de META, si en si ro?!
webc
mesaj 26th December 2007, 22:51
Mesaj #1


Junior

Grup: Members
Mesaje: 223
Data înscrierii: 9-August 07
ID membru: 212 401





Motoarele sunt sensitive la diacritice?

Sa luam de exemplu, Google, care deja este ..."geolocat", dar ma intereseaza si celelalte...

Eu cred ca mai putin de juma de utilizatori (calc, net, web, etc...) in Ro au instalata optiunea de limba, setarile regionale, etc... Ce rezultate le apar lor cand introduc cuvintele pe en spelling, iar pagina tinta este iso-8859-2, si continutul este editat cu diacritice?!

Sau, invers, sa zicem ca utilizatorul are RO pe language bar, scrie corect cu diacritice "bălți, pești" in fereastra de cautare, dar in META si in continutul paginilor tinta sunt "balti" si "pesti"?!

Subliniez ca problema asta nu este asa simpla, adica, "pai scrie corect românește...", atat in META, cat si in continut, cat si in cautare...
Sa mai consideram cazul ca un roman din afara intra de la un calc public si da o cautare unde sa isi petreaca vacanta in tara... Si fiind in Franta, sau Spania, de ex. si fiind calc public, scrie in spelling francez, sau spaniol, sau ma rog, default 8859-1, cum e instalat acolo... Deci nu o sa primeasca rezultate eronate?

Acest mesaj a fost modificat de webc: 26th December 2007, 22:54
Go to the top of the page
 
+Quote Post
darkstar_tfd
mesaj 27th December 2007, 14:31
Mesaj #2


Junior

Grup: Members
Mesaje: 457
Data înscrierii: 18-August 05
Locație: Timisoara / Uricani
ID membru: 44 232



Rezultatele tot o sa fie, doar ca o sa fie influentate de factorii de care vorbeai tu mai sus

Nu cred ca jumatate au instalata optiunea de limba, incearca sa faci un raport ( use Awstats si Analytics in paralel ) sa vezi care si cum sunt cautarile pentru o pagina care poate avea ambele variante. Cand folosesti diacriticele in numele/url unei pagini rescrise deja ai probleme.

Diferenta dintre text si meta nu ar trebui sa existe, daca faci o pagina o faci intr-un singur fel. Insa nu as acorda asa de multa importanta pentru meta decat poate daca site-ul e nou. Aici e cam acelasi caz cu folosirea de limbaj comun si limbaj oficial, depinde de ceea ce cauta utilizatorul. E o discutie apropiata de tema asta aici ( citeste commenturile care sa intelegi mai multe ).

Cum spune si Krumel prin articolul ala, exista acea comoditate a utilizatorului. Totusi daca vrei sa fii sigur pe ceea ce vezi si nu pe ceea ce ti se spune, incearca sa faci un raport asa cum ti-am spus mai sus.

Bafta.


Acest mesaj a fost modificat de darkstar_tfd: 27th December 2007, 14:32
Go to the top of the page
 
+Quote Post
miromulus
mesaj 29th December 2007, 00:00
Mesaj #3


Active Member

Grup: Members
Mesaje: 1 914
Data înscrierii: 25-January 06
Locație: Calea Lactee, pe dreapta
ID membru: 63 004



Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste
Go to the top of the page
 
+Quote Post
webc
mesaj 29th December 2007, 18:13
Mesaj #4


Junior

Grup: Members
Mesaje: 223
Data înscrierii: 9-August 07
ID membru: 212 401



QUOTE (miromulus @ Dec 29 2007, 00:00) *
Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste

Pai cam aici asteptam niste informatii din surse ..."avizate", --cum se face indexarea, ce se inscrie efectiv in campul/ campurile alea de cuvinte "cheie"?!

Dupa cum spui tu, inseamna ori ca se face o conversie la iso-8859-1 inainte de inregistrare, ori ca inregistrarile se fac impreuna cu o "familie" de cuvinte asociate, sau asa ceva...


Go to the top of the page
 
+Quote Post
Krumel
mesaj 31st December 2007, 16:43
Mesaj #5


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640



ISO/IEC 8859-1 encodeaza caractere pentru a putea fi citite de browsere.

QUOTE
Din experienta mea, Google nu mai face diferente intre diacritice si corespondentele lor. Pentru el, românește == romaneste.

casă, casã, casä, caså.
Nu comentez. (IMG:style_emoticons/default/mellow.gif)

Uite o "nisa": căși. (IMG:style_emoticons/default/coolspeak.gif)

Acest mesaj a fost modificat de Krumel: 31st December 2007, 16:52
Go to the top of the page
 
+Quote Post
miromulus
mesaj 31st December 2007, 16:46
Mesaj #6


Active Member

Grup: Members
Mesaje: 1 914
Data înscrierii: 25-January 06
Locație: Calea Lactee, pe dreapta
ID membru: 63 004



ca sa fiu ceva mai clar - vorbeam de greutatea transferata de un link cu diacritice si unul fara.

Acest mesaj a fost modificat de miromulus: 31st December 2007, 16:51
Go to the top of the page
 
+Quote Post
Krumel
mesaj 31st December 2007, 17:01
Mesaj #7


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640



QUOTE (miromulus @ Dec 31 2007, 16:46) *
ca sa fiu ceva mai clar - vorbeam de greutatea transferata de un link cu diacritice si unul fara.


Greutatea e aceeasi, backlink-ul transfera aceeasi masura/greutate.
Dar, anchor-ul conteaza: allinanchor:casã, allinanchor:casă , allinanchor:casä, allinanchor:caså.

Puterea unui anchor sta in link-ul care il sustine, nu in caracterul de encodare.
Go to the top of the page
 
+Quote Post
webc
mesaj 1st January 2008, 23:36
Mesaj #8


Junior

Grup: Members
Mesaje: 223
Data înscrierii: 9-August 07
ID membru: 212 401



QUOTE (Krumel @ Dec 31 2007, 16:43) *


Bun exemplul, mersi!

Si totusi, ca sa revenim la "greutatea" continutului, in general, (-si nu a legaturilor, in particular...), care ar fi concluzia?!
Ca odata cu encoding-ul regional, si cu diacriticele specifice, va trebuie sa dezvoltatm cate o teorie pentru fiecare caz in parte: casa, casă, casã, casä, caså, si ...căși (IMG:style_emoticons/default/huh.gif) ?

Chiar e socant cat sunt de diferite rezultatele pe cele 4 exemple, +"căși"=5, +"casa"...6. N-am confruntat chiar toate paginile 2 cate 2, sau 1 vs. 5, sau etc..., dar la prima vedere sunt ridicol de diferite!

Pentru mine e o dovada clara ca "algoritmul" nu are cea mai ...fericita logica. Daca cineva considera ca eu gresesc, rog sa imi spuneti ce elemente neglijez in rationamentul meu...
Go to the top of the page
 
+Quote Post
miromulus
mesaj 3rd January 2008, 23:22
Mesaj #9


Active Member

Grup: Members
Mesaje: 1 914
Data înscrierii: 25-January 06
Locație: Calea Lactee, pe dreapta
ID membru: 63 004



webc, problema e simpla: de unde sa stie G ca tu vrei sa caut rată sau rață, tară sau țară? Nu e o problema de algoritm, ci o problema de "tastatura" si obsinuinta, daca vrei.
Go to the top of the page
 
+Quote Post
Krumel
mesaj 4th January 2008, 10:18
Mesaj #10


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640





QUOTE (miromulus @ Jan 3 2008, 23:22) *
webc, problema e simpla: de unde sa stie G ca tu vrei sa caut rată sau rață, tară sau țară? Nu e o problema de algoritm, ci o problema de "tastatura" si obsinuinta, daca vrei.


Pai Html-ul are niste reguli pe care motoarele de cautare le respecta.
Una din ele e Character encodings.
Declare the Encoding specificarea encodarii unui site, ajuta la citirea lui de catre browsere si roboti.

Tu cum crezi ca inteleg motoarele de cautare diacriticile?
Latin-1 Entities, Character sets & encodings in XHTML, HTML and CSS.

Deasemenea, hostingul poate schimba/influenta encodingul.

Acum legat de anchor: consideram, iportetic macar, ca titlul unui site poate determina o influenta asupra unei pagini raportata la o cautare pe SE`s.
Atunci, buburuză pentru Google e un cuvant cu diacritice "vazut" si interpretat corect, in plus, pe langa afisarile normale la cautare...apar pagini cu titluri cu diactitice.

allinanchor:buburuză

QUOTE
Allinanchor of a keyword is a Google command that searches Internet pages that contain the keyword in their anchor texts.

Sursa.

Asta inseamna ca paginile afisate pentru allinanchor:buburuză au ca si cuvant buburuză, anchor.

Argumentatia?
allinanchor:buburuză vs. allinanchor:buburuza.

Parerea mea e ca nu greutatea unui anchor e problema si nici encodarea sau folosirea de diacritice, ci faptul ca userii nu folosesc si nu cauta cu diacritice.
Go to the top of the page
 
+Quote Post
miromulus
mesaj 4th January 2008, 13:56
Mesaj #11


Active Member

Grup: Members
Mesaje: 1 914
Data înscrierii: 25-January 06
Locație: Calea Lactee, pe dreapta
ID membru: 63 004



Bon, eu acum inteleg unde batea webc. Krumel, raspunsul dat de tine e simplu si la obiect. Dar nu rezolva problema lui webc, asa cum o vad eu. Care e greutatea unui anchor fara diacritice pentru o cautare cu diacritice sau pentru o pagina care foloseste numai diacritice?

Un exemplu, 80% din linkurile catre un site nu au in anchor diacritice iar 20% au. Valorile paginilor sunt relativ egale. Cele 20% din linkuri, ce au diacritice in anchor, vor ajuta cu 20% site-ul pentru o cautare fara diacritice?
Go to the top of the page
 
+Quote Post
Krumel
mesaj 4th January 2008, 16:20
Mesaj #12


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640



QUOTE (miromulus @ Jan 4 2008, 13:56) *
Care e greutatea unui anchor fara diacritice pentru o cautare cu diacritice sau pentru o pagina care foloseste numai diacritice?


Nu poti lua ca si greutate doar anchorul, fara valoarea link-ului. De asta Seo nu e macelarie.
Sint conditii de indeplinit pentru un anchor sa poata avea greutate.
Link-urile au greutate, anchorul are relevanta. Deasemnea, link-ul are relevanta daca "leaga" site-uri din aceeasi categorie/domeniu de activitate.

Un anchor fara diacritice poate sustine o pagina pentru o cautare cu diacritice, doar ca relevanta si greutatea e diferita fata de a unui anchor cu diacritice.
Indicat e ca pentru o pagina cu diacritice, sa ai anchor cu diacritice...asta nu inseamna ca un anchor fara diacritice nu e folositor.

Cu cat e folositor un anchor fara diactitice pentru o pagina cu diacritice...asta nu prea iti poti da seama, doar daca link-ul de pe care vine anchorul fara diactritice si relevanta lui fata de site e considerabila.

QUOTE (miromulus @ Jan 4 2008, 13:56) *
Un exemplu, 80% din linkurile catre un site nu au in anchor diacritice iar 20% au. Valorile paginilor sunt relativ egale. Cele 20% din linkuri, ce au diacritice in anchor, vor ajuta cu 20% site-ul pentru o cautare fara diacritice?

Vor ajuta site-ul in special pentru cautarea cu diacritice, restul de 80% vor ajuta pentru cautarea fara.
Dar, ca afisare a unor rezultate dupa o cautare (cu sau fara diacritice) cele 20% pot influienta un rezultat in functie de % pe care concurentii il au pentru acea cautare. Sansele sint mici ca la o cautare fara diacritice sa apara rezultate cu. Invers, e valabil.

Trebuie sa luati in calcul si valoarea link-ului de pe care vine anchor-ul. Plus multe alte conditii. Hostingul are deasemenea o influenta.
Go to the top of the page
 
+Quote Post
miromulus
mesaj 4th January 2008, 16:58
Mesaj #13


Active Member

Grup: Members
Mesaje: 1 914
Data înscrierii: 25-January 06
Locație: Calea Lactee, pe dreapta
ID membru: 63 004



Si asa am ajuns la inceput: nu stim clar cum influenteaza diacriticele pozitia in SERPs. Situatia e evidenta doar pentru anchor-uri si cautari cu diacritice.
Go to the top of the page
 
+Quote Post
Krumel
mesaj 4th January 2008, 17:36
Mesaj #14


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640



Nu stim cum, stim doar ca influenteaza. (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
 
+Quote Post
webc
mesaj 4th January 2008, 18:04
Mesaj #15


Junior

Grup: Members
Mesaje: 223
Data înscrierii: 9-August 07
ID membru: 212 401



QUOTE (miromulus @ Jan 4 2008, 16:58) *
Si asa am ajuns la inceput...

Inca si la inceput si tot ar fi fost bine...

Dar mi-e teama ca ne-am risipit de tot..., pe vre-o 4-5 directii diferite, si ar trebui sa ne (re-) focalizam!

@Krumel, stiu, am auzit, ca esti bun, ca sti..., ca esti documentat pe SEO, dar acum, aici, cred ca miromulus m-a inteles ceva mai bine... Sa nu ma intelegi gresit, ma interseaza comentariile tale, dar pe subiectul, pe aspectul prezentat de mine.

Deci sa ne intoarcem cam aici:
QUOTE (Krumel @ Jan 4 2008, 10:18) *
Parerea mea e ca nu greutatea unui anchor e problema si nici encodarea sau folosirea de diacritice, ci faptul ca userii nu folosesc si nu cauta cu diacritice.

Cam de aici incepem sa ne incurcam pentru ca tu ...intorci cauza in efect si efectul in ...cauza!
Pai tocmai asta era premisa de la care plecam eu si anume "ca userii nu folosesc si nu cauta cu diacritice"! Si in functie de asta ce ar fi de facut pentru o cautare relevanta?

Si nu te supara, dar mai departe te si contrazici un pic... Pentru ca undeva spuneai ca nu toate motoarele au aceleasi criterii, proceduri de indexare, ...respectiv afisare a rezultatelor, ca apoi, aici mai sus, sa generalizezi "greutatile" si corespondentele cu si fara diacritice la cam toate motoarele.

In plus rationamentul tau mai este oarecum inconsistent si cu exemplul dat chiar de tine cu case, unde se vede bine la rezultate ca output-ul este confuz si sub aspectul corespondentei meta <--> continut, si cred ca la un studiu mai atent, -si sub aspectul links, anchors, etc... Deci, totul devine nu doar o problema de optimizare din partea webmasterilor, sau de comportament al utilizatorilor, ci si de ..."algoritm"

Deocamdata, va rog sa ne lamurim in primul aspect, anume:
Da! Plecam de la premisa ca userii nu folosesc, sau nu folosesc corect diacriticele (-cum de altfel, ai facut chiar si tu testul acela...).
Si atunci, cum procedam pentru a nu ..."iesi din carti"?! Mai scriem sau nu cu diacritice, mai optimizam sau nu..., mai specificam encoding, sau lasam ...soarta?!?

Acest mesaj a fost modificat de webc: 4th January 2008, 18:09
Go to the top of the page
 
+Quote Post
darkstar_tfd
mesaj 4th January 2008, 18:07
Mesaj #16


Junior

Grup: Members
Mesaje: 457
Data înscrierii: 18-August 05
Locație: Timisoara / Uricani
ID membru: 44 232



Ca si raspuns la a doua problema pusa de webc, cred ca ar fi interesant de observat urmatoarea situatie.

Exista acest articol pe blog. Articolul este scris de altcineva folosind diacritice, in timp ce eu de obicei scriu fara. Deci chestia cu encodingul e lamurita.
Apoi la verificare search keywords ( thanks to awstats ) gasim cateva ( deci MAI MULTE - nu e singur caz ) pentru " Ãźntâlniri " care defapt e echivalentul ( nu e chiar corect zis, dar sper ca se intelege ideea ) a "intalniri", cuvantul exista si in titlul si spunem ca ne legam si de explicatia lui Krumel de mai sus.

Google search pt respectivul string si observam " Rezultatele 1 - 10 din aproximativ 97 Română pagini pentru Ãźntâlniri. (0,20 secunde) "

Apoi inca un search pentru varianta corect scrisa a "întâlniri" si din nou observam "Rezultatele 1 - 10 din aproximativ 234.000 Română pagini pentru întâlniri. (0,20 secunde)" iar acum la primul rezultat verificam encoding.

E clar ca google s-a dus destul de departe si face legatura chiar daca poate parea o problema cu encoding in prima faza.

Acum sa continuam cu exemplu blogul de mai sus. Avem asa :

http://www.google.ro/search?hl=ro&q=in...ta=lr%3Dlang_ro
http://www.google.ro/search?hl=ro&q=%C...ta=lr%3Dlang_ro
http://www.google.ro/search?hl=ro&q=%C...ta=lr%3Dlang_ro

Pagina are 0 linkuri spre ea, nu a fost promovata, deci e un simplu blogpost. Nici technoratt, nimic, 0 linkuri.

Nu stiu daca ce am postat pana acum ajuta la foarte multe, insa sunt argumente pentru a duce discutia mai departe.

Go to the top of the page
 
+Quote Post
Krumel
mesaj 4th January 2008, 18:36
Mesaj #17


Active Member

Grup: Members
Mesaje: 1 371
Data înscrierii: 19-May 04
Locație: "Why should I go where everyone goes?"
ID membru: 16 640



webc, discutia asta (fara sa vrea) a ajuns cam pe n directii:
- diacticile nu sint folosite pentru cautari si destul de putin pentru a scrie continut
- encodarea tine de browsere si nu de roboti si indexare
- encodarea poate fi influientata si de hosting
- anchorul cu discritice poate avea o influenta asupra unui site/pagini in functie de anumite criterii
- link-urile sint cele care dau putere unul anchor, iar anchorul creaza relevanta

Probabil aspecte mai sint, astea sint in mare.

Dupa cum vezi, ceea ce ai intrebat e destul de complex si pentru a multumi pe toti trebuie sa desfaci firul in 4. Ca pana la urma sa ne dam seama cu totii ca nu despre asta ai intrebat.

Raspunsul l-ai primit inca din primul post:
QUOTE
Rezultatele tot o sa fie, doar ca o sa fie influentate de factorii de care vorbeai tu mai sus


Daca o sa urmaresti toate directiile si ipotezele cu argumente din topic, o sa iti dai seama ca subiectul nu e asa usor si ca pentru a primi un raspuns trebuiesc "atacate" mai multe directii.

Eu nu cred ca m-am contrazis cu nimic, mai ales ca am specificat : Seo nu e macelarie. Influentele sint multe, strategiile sint destul de complexe, necunostinta poate da rezultate "spectaculoase".


Am ajuns la inceput, doar ca avem ceva mai multe cunostinte. (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
 
+Quote Post
webc
mesaj 4th January 2008, 23:14
Mesaj #18


Junior

Grup: Members
Mesaje: 223
Data înscrierii: 9-August 07
ID membru: 212 401



@Krumel, vezi ca deja m-ai inteles gresit...?!

Te justifici de parca eu te-asi fi facut pe tine raspunzator ca discutia a deviat. Chiar m-am exprimat "ne-am risipit de tot" *!
Sigur ca trebuie abordat pe n directii pentru a ajunge la o concluzie in problema asta complexa, spuneam doar sa ne focalizam pe rand asupra unor aspecte, si cand avem ceva concluzii partiale, sa le coroboram pentru a trage o concluzie ...globala.

Uite, eu nu zic sa purtam discutia pe firul meu, mergem pe directiile tale. Spre exemplu:
QUOTE (Krumel @ Jan 4 2008, 18:36) *
- diactricile nu sint folosite pentru cautari si destul de putin pentru a scrie continut
(Pentru tot spuneam de contradictii, de a ne contrazice, sau a nu ne ...)

Pai, tocmai, ca din ce in ce mai multe site-uri sunt editate cu diacritice. Asta este o realitate.
Din moment ce vine Google si face interfata pe .ro cu diacritice, iar Mozilla te localizeaza si iti face update-ul si iti da temele direct cu diacriticele limbii respective, mi se pare jenant ca eu ca webmaster sa nu scriu corect in limba mea, pentru utilizatorii tarii mele.

Iar, odata ce utilizatorii se vor obisnui cu keyboard RO, vor incepe sa scrie in fereastra de cautare cu diacritice. Deci, cat de curand diacriticile vor fi "folosite pentru cautari"

Dar, sa lasam asta si sa mergem la urmatoarea ta afirmatie
QUOTE (Krumel @ Jan 4 2008, 18:36) *
- encodarea tine de browsere si nu de roboti si indexare

Pai atunci tu cum vezi explicatia propriului tau exemplu cu casele *, daca encodarea tine de browsere?!??

Si daca nu te deranjeaza (-nici pe tine, nici pe restul vizitatorilor...) zic sa ne oprim un pic asupra rezultatelor acelea complet ridicole. Intrebarea este cum a fost posibil sa afiseze pagini .ro, cu meta si continut .ro, cautari care aveau &atilde; &auml; sau &aring; ... ?!?? (...Ceea ce inseamna ca encodarea nu tine numai de browsere, ci si "de roboti si indexare"!)

Acest mesaj a fost modificat de webc: 4th January 2008, 23:21
Go to the top of the page
 
+Quote Post
Anunțuri noi
mesaj A minute ago
Mesaj #


Anunțuri publicate recent de forumiști >>

Grup: Bot






PROMOTIE DUAL SIM DUBAO K328 5 ZI...
Preț: 250 RON
Localitate: Bucuresti
Timp rămas: 22 zile
Vand Nikon D40 Kit
Preț: 1.000 RON
Localitate: Bucuresti
Timp rămas: 85 zile
Cumpar Media Player Xtreamer
Preț: 500 RON
Localitate: chiajna
Timp rămas: 88 zile
Cartier v8 Luxury DUAL SIM-suflat...
Preț: 599 RON
Localitate: Bucuresti
Timp rămas: 22 zile
   Anunțuri publicate recent de forumiști în secțiunea dedicată de anunțuri a Forumului Softpedia. Poți adăuga (gratuit) anunțurile tale chiar acum!
Go to the top of the page
 

6 V   1 2 3 > » 
Closed TopicStart new topic
1 utilizatori citesc acest subiect (1 utilizatori neautentificați și 0 anonimi)
0 Membri:

 

RSS Versiune simplificată Data: 9th February 2010 - 21:36
© 2001 - 2010 Softpedia. All rights reserved.
Softpedia® and Softpedia logo are registered trademarks of Soft News NET SRL.
Privacy Policy | Terms of Use | Contact Softpedia