PageRank – Un bun indicativ pentru calitatea paginii

 

Pentru a examina acuratetea indicativului PageRank in ceea ce priveste calitatea paginilor web, vom analiza premisele pe care se constituie PageRank:

  1. Daca o pagina trimite un link catre o alta pagina, este ca si cum aceasta ar da un vot favorabil paginii catre care face trimitere, asadar pagina tinta este considerata o pagina importanta.
  2. Daca mai multe pagini fac trimitere catre o anumita pagina, atunci se considera ca pagina tinta primeste mai multe „voturi de incredere”, deci teoretic importanta ei ar trebui sa fie si mai mare.

Ideea centrala a conceptului este: „Oamenii fac trimitere din site-urile proprii numai catre site-uri (pagini) inrudite din punct de vedere tematic pe care le considera importante pentru ei si, in general, de calitate.” .

Nu ar fi prea greu sa descoperim insa ca aceasta premisa este, nu rareori, gresita. Cateva motive pentru care proiectantii de pagini web nu aleg neaparat sa-si lege paginile de alte pagini importante si de calitate ar fi:

  1. Conceptul de linkuri reciproce: „Tu imi dai un link mie si eu iti dau un link tie.”
  2. Necesitatea plasarii unui anumit link in pagina: „Utilizarea scriptului nostru pe site-ul dvs. este permisa numai cu plasarea unui link din pagina in cauza catre pagina noastra.” sau „Iti vom facilita un bonus la oferta noastra actuala in contul unui link plasat din pagina ta catre pagina noastra.”
  3. Apelarea la programe online de inregistrare si raportare a traficului pentru o anumita pagina, programe care afisaza automat in cadrul contorului plasat in pagina si un link

Analizand in continuare, sesizam urmatorul aspect de actualitate:

Aproape orice webdesigner care poseda un site aflat temporar in pozitii de varf in cadrul clasamentelor unui motor de cautare major, va sesiza ca, fara sa faca absolut nimic, exista o tendinta de inmultire a legaturilor externe catre site-ul propriu, dinspre site-uri despre a caror existenta in unele cazuri nici macar nu are idee. Si acest lucru nu neparat pentru ca site-ul lui este bun, sau mai bine zis „de calitate” (desi majoritatea celor clasate pe primele locuri chiar sunt).

Explicatia rezida de multe ori in alta cauza: presupunand ca majoritatea proiectantilor web care debuteaza cu un site nou pe Internet, doresc sa furnizeze, din spirit de credibilitate, in cadrul unei pagini separate, linkuri catre site-uri consacrate din domenii de interes similare sau inrudite, primul lucru pe care il vor face in acest sens va fi sa genereze cateva cautari in Google dupa domeniile de interes vizate si sa aleaga cateva din site-urile afisate in primele 1-2 pagini de rezultate.

Site-urile web astfel selectionate pentru trimitere de link nu vor fi neaparat dintre cele de cea mai buna calitate (in ideea ca se pot regasi printre aceste rezultate si site-uri care au urmarit doar manipularea clasamentelor in favoarea lor, fara alte obiective calitative imediate), alegerea lor datorandu-se mai degraba usurintei cu care au fost gasite si/sau credibilitatii pe care o inspira proiectantului site-urile listate in primele rezultate ale clasamentului Google.

In conditiile in care o pagina de o calitate indoielnica (din punct de vedere al unui rationament uman) este aleasa in acest mod pentru a fi linkuita, imbunatatirea indicativului PageRank al acesteia ca rezultat direct al linkurilor primite de la site-urile debutante va contribui (aproape inevitabil) la propagarea inadvertentelor de calitate in clasamente.

PageRank-Primele 1000 de rezultate dintr-o cautare cu Google 

Dupa cum am sugerat pana in momentul de fata, numai factorul PageRank nu poate asigura unui site web aparitia in primele rezultate ale unei cautari. Am mentionat anterior ca PageRank este un multiplicator. Asadar, daca scorul pentru toti celilalti factori este 0 dar PageRank este 20.000.000 , in continuare, scorul final va fi 0 (ultimul dintre rezultate).

Daca se va efectua cu Google o cautare dupa o expresie extrem de populara, va aparea pe bara albastra o cifra uriasa de potentiale rezultate gasite, cateodata si cateva zeci de milioane. Oricum , desi nimeni nu a mers vreodata mai departe de cateva sute, daca va avea curiozitatea sa ajunga la prima mie, va constata ca afisarea rezultatelor se opreste la rezultatul cu numarul 1000. Intelegerea acestui fenomen (explicat in cele ce urmeaza) va conduce la intelegerea rationamentului pentru care intotdeauna este necesar ca proiectantul sa se concentreze mai intai asupra factorilor de pagina si asupra strategiei linkurilor text  si doar apoi asupra aspectelor legate de factorul PageRank.

Presupunem ca un utilizator oarecare intreprinde o cautare cu Google care genereaza conform datelor de pe bara albastra 200.000 de rezultate. Daca am calcula fiecarui element de algoritm pentru toate cele 200.000 de pagini, ne putem imagina timpul necesar alocat unei astfel de operatiuni de anvergura. Totusi, cautarea utilizatorului dureaza in jur de 0,34 secunde. In acest moment apare intrebarea „Cum a fost posibil?”.

Rapiditatea cautarii s-a datorat stabilirii in prealabil a unui subset de documente considerate cele mai relevante in raport cu expresia cheie a utilizatorului. Mai exact, motorul de cautare a interogat sectorul tematic corespunzator din baza de date a motorului in functie de 2, maxim 3 factori, selectand in acest mod primele 2000 de rezultate.

Motorul aplica apoi asupra acestor 2000 de rezultate plauzibile toti ceilalti factori si, in cele din urma, le afisaza intr-un clasament final pe primele 1000 dintre ele. Afisarea doar a primelor 1000 se datoreaza degradarii exponentiale dupa prima jumatate a relevantei rezultatelor relativ la subiectul cautarii. Cei 2-3 factori ai cautarii initiale cu siguranta ca nu includ nici pe departe indicativul PageRank ci, elemente de pagina considerate de baza .

 

PageRank – a fi sau a nu fi luat in considerare in munca de optimizare?

Sa presupun ca se efectueaza o interogare (o cautare in Google) in urma careia se genereaza ca rezultat Pagina A, respectiv Pagina B. Scorurile totale obtinute de fiecare din cele doua pagini pentru acea interogare reprezinta totalitatea scorurilor obtinute pentru fiecare factor in parte (inlusiv PageRank) cu privire la fiecare dintre paginile respective. Sa persupunem ca scorul total obtinut de Pagina A pentru interogarea respectiva este 900, respectiv pentru Pagina B 500.

Evident ca Pagina A va fi listata prima. Fara nici o schimbare cu privire la factorul PageRank, dar abordand schimbari majore in sfera celorlalte elemente de optimizare, este posibil ca Pagina B sa-si imbunatateasca scorul final, ajungand la un moment dat sa fie listata inaintea Paginii A. Exista o multime de interogari ca acestea in Google la ora actuala, unde pagini cu PageRank 4 sunt detronate de pagini cu PageRank 1. Lucrul acesta e valabil in special in cazul interogarilor din domenii slab competitive.

Acum sa presupunem ca Pagina A isi imbunatateste scorul total pana la valoarea 1100. De data aceasta, Pagina B nu mai are sanse prea mari sa poata invinge Pagina A fara sa-si imbunatateasca PageRank-ul. Dupa toate aparentele, Pagina B se pare ca trebuie sa-si imbunatateasca si celelalte elemente cheie (de pagina si de linkuri text) pentru a se putea mentine in competitie cu Pagina A.

Exista o observatie importanta care trebuie facuta in acest moment: 

Pentru a putea tine pasul cu concurenta intr-un domeniu competitiv de prezenta online, proiectantul va trebui sa optimizeze la maxim factorii de pagina si de popularitatea+reputatia linkurilor, apoi sa abordeze aspectul ceva mai complicat cu privire la factorul PageRank.

Sa consideram in acest sens strategiile diametral opuse a doi proiectanti de pagini web. Persoana A considera aspectul PageRank ca fiind total lipsit de importanta, in timp ce Persoana B acorda toata atentia indicativului PageRank, fiind complet dezinteresata de elementele de pagina.

 

Persoana A a optimizat pagini web d.p.d.v al aspectelor de pagina ani de zile, asadar este familiarizata cu strategiile de pagina si de linkuri text si poate obtine relativ usor un scor maxim la aceste categorii (non PageRank). Obtinand implicit si cateva linkuri de pe urma unei minimale promotii online si / sau offline (pe care orice site web o initiaza la debut), Persoana A isi vede site-ul propulsat auomat in clasamente (SERPS). Atat timp cat poate fi gasit in SERPS si continutul informational oferit este bun, site-ul Persoanei A tinde sa obtina linkuri din paginile site-urilor inrudite sau complementare, fara macar sa le ceara in mod explicit. Aceste site-uri vor oferi acea „picatura” de PageRank care va ajuta site-ul Persoanei A sa-si consolideze pozitia in clasamente.

 

Persoana B opereaza practic in sens invers fata de Persoana A. Cu totii am vazut in listingurile de rezultate pagini web neavand aproape deloc continut explicit relativ la termenii cautati, ci doar o clasare exceptionala (in cazul numelor de marca, gen portalul Yahoo, acest lucru constituie un fapt firesc si se intampla extrem de des). Persoana B intelege bine mecanismul si importanta factorului PageRank si se concentreaza asupra tuturor aspectelor cu privire la acesta. Trepat, pagina Persoanei B va incepe sa adune „picatura cu picatura” un scor favorabil si in sfera factorilor ce nu privesc PageRank-ul si tot fara sa faca nimic in acest sens. Faptul in sine este posibil o data prin intermediul continutului text al paginilor (atat cat este – mult sau putin), apoi prin colectarea cu ajutorul strategiei PageRank (asupra careia Persoana B isi canlizeaza toate eforturile) de linkuri text care intrunesc conditiile de link text favorabil (respectand conceptele prezentate in Capitolul 4 cu privire la relevanta linkurilor). De data aceasta Persoana B reuseste sa obtina fara fara un efort explicit in acest sens un minim de parametri optimali non PageRank care o vor propulsa treptat in clasamente.

 

Cele doua cazuri prezentate sunt, fara doar si poate, 2 extreme, insa ceea ce trebuie inteles de aici este ca cele doua strategii, luate separat, converg una catre cealalta, tinzand catre acelasi rezultat, evident cu avantaje si dezavantaje:

 

AvantajeDezavantaje
Persoana A

 

(care tine cont numai de factorii de pagina)

 

 

 

 

 

Persoana B

 

(care tine cont numai de PR)

  • Intrare rapida in SERPS vizate;

 

  • Linkurile generate implicit reduc mult din volumul de munca.
  • Securitate slaba a strategiilor, codul fiind usor de copiat de catre competitie.

 

  • Reactie lenta si de durata pentru a compensa o eventuala detronare a paginii de catre competitie.

 

  • Pozitie solida. Se pot cu usurinta optimiza elemente de pagina daca se impune un salt rapid in clasamente.

 

  • Probabil ca site-ul va obtine un trafic mare si din alte surse decat motare de cautare (vizitatori provenind, spre exemplu, din numeroasele pagini din care se fac trimiteri).

 

  • Intrare lenta in SERPS (campaniile de colectare a legaturilor pentru un PageRank considerabil sunt lungi si anevoioase).

 

  • Dificultatea de a obtine trafic de calitate (e mai probabila listarea paginii in rezultate generate ca urmare a unor cautari nu tocmai inrudite cu tematica si subiectul central al site-ului).

Este aproape evident ca ambele strategii pot sa functioneze si chiar funtioneaza. Ambele strategii se folosesc in cele din urma (direct sau indirect) atat de factorul PageRank cat si de factorii non PageRank. Deoarece apare evidenta necesitatea unui mixaj, cel mai intelept lucru este ca fiecare proiectant sa se concentreze asupra ambelor categorii de factori, uzand intr-un grad mai mare sau mai mic de unii factori sau de altii, in functie de obiectivele vizate pe termen scurt, mediu si lung.

Segmentele de piata online extrem de competitive

 

Exista domenii de interogari (expresii de cautare) unde competitia este acerba, astfel incat, pentru o afisare in primele 3 pagini de rezultate trebuie intruniti la maxim toti factorii de clasament componenti ai algoritmilor de pozitionare. In astfel de situatii este practic imposibila clasarea in rezultatele de top doar prin intermediul factorului PageRank sau intrunind optim numai factorii non PageRank.