10 SEO problema sa kojima se ne susrećete tako često
Posao SEO stručnjaka je odavno izašao iz okvira definisanja meta tagova i kreiranja sadržaja. Način na koji korisnici konzumiraju sadržaj i razvoj veb tehnologija nas je uslovio da pored marketinških veština koju svaki SEO stručnjak treba da poseduje, moramo razvijati i druge, tehničke veštine, kako bi sa druge strane mogli da razumemo pretraživače odnosno tržište na kome delujemo.
U ovom tekstu ćemo probati da vam dočaramo 10 nesvakidašnjih SEO problema sa kojima smo se suočili u prethodnom periodu i uspeli da ih rešimo. Svaki od problema biće predstavljen kao kratak Case Study pa krenimo redom.
Diplirani sadržaj na višejezičkom sajtu na istom domenu
Dupliran sadržaj na istom domenu nije problem sa kojim se tako retko srećemo. Međutim, kada se radi o višejezičkim sajtovima sa edicijama za pojedine zemlje ovaj problem za SEO može biti veoma ozbiljan.
Dupliran sadržaj na višejezičkim sajtovima sa edicijama može dovesti do toga da pretraživači ne mogu da odrede koji sadržaj je u stvari relevantniji u odnosu na drugi, odnosno sadržaj smatraju duplikatom i kao takvom umanjuju mu SEO vrednost što rezultira lošim rangiranjem stranica, ili ne prikazivanjem stranica u pretrazi, iako su sa stanovišta autoriteta i sadržajno kvalitetnije od stranica konkurentnih sajtova.
Ovaj problem se često dešava sa sajtovima kompanija koje posluju u više zemalja i sadržaj sajta plasiraju na više jezika i edicija u zavisnosti od lokacije odakle se pristupa sajtu. Recimo da na sajtu su postoje stranice za englesko govorno područje koje bi trebalo da se plasiraju u Kanadi, Velikoj Britaniji i Americi koje imaju isti sadržaj.
Na primer:
https://www.exapmle.com/en-GB/something/funny.html
https://www.exapmle.com/en-US/something/funny.html
https://www.exapmle.com/en-CA/something/funny.html
U ovom slučaju, u SERP-u treba da se nadje jedna stranica koja će biti relevantana za korisnike na određenom geografskom području, a sa druge strane da se zadrže edicije sajta za sve zemlje zbog prilagođenih ponuda za određena tržišta. Kreiranjem novih, globalnih verzija stranica bez edicija sa sadržajem na određenom jeziku (u ovom slučaju engleskom) i pravilnim postavljanjem canoncal meta tagova na svim stranciama edicija koje će voditi na globalnu verziju sajta uspeli smo da u SERP-u dobijemo samo jednu stranicu na određenom jeziku koja je relevantana za posetioce na svim geografskim tržištima. Rešili smo problem dupliranog sadžaja potavljanjem canonical tagova i zadržali smo stranice edicija. Ovim pristupom smo uspeli da stranice koje se nisu prikazivale na SERP-u ili su bile na 3 ili 4 strani pretrage, rangiramo između 1-3 pozicije na SERP za najrelevantnije upite i povećamo posetu i za 500%.
Primer:
https://www.exapmle.com/en/page/seo.html
< link rel="canonical" href="https://www.exapmle.com/en/page/seo.html" />
https://www.exapmle.com/en-GB/page/seo.html
< link rel="canonical" href="https://www.exapmle.com/en/page/seo.html" />
https://www.exapmle.com/en-US/page/seo.html
< link rel="canonical" href="https://www.exapmle.com/en/page/.html" />
https://www.exapmle.com/en-CA/page/seo.html
< link rel="canonical" href="https://www.exapmle.com/en/page/seo.html" />
Dupliran sadržaj na poddomenu
Jedan od pristupa prikazivanja sadržaja u zavisnosti od zemlje iz koje se pristupa jeste postavljanje sajta svakog jezika sa edicijama na poddomen koji će imati sadržaj samo na tom jeziku. Sa SEO aspekta ovaj pristup nije baš idealan jer je u ovom slučaju potrebno mnogo više resursa za optimizaciju stranica svih jezika. Drugi razlog zbog čega izbegavamo ovaj pristup je kreiranje dupliranog saržaja sadržaja na poddomenima i stranicama edicija za pojedina tržišta.
Stranice sa istim sadržajem:
rs.example.com/rs/something.html
en.example.com/en/something.html
en.example.com/us/something.html
Poslednji, ali ne i manje bitan razlog zbog koga smo se odlučili za promenu SEO strategije jeste to što se autoritet domena, koji je najčešće veći od unutrašnjih stranica, ne preliva na sve jezike jer se oni praktično nalazi na drugom poddomenu.
U ovom slučaju je bilo potrebno da se pre svega sve stranice na svim jezicma i edicijama prabace sa poddomena na domen i da se za svaki od jezika kreiraju globalne verzije stranica.
Na primer:
example.com/en/something.html - Globalna verzija sajta na engleskom
example.com/en-gb/something.html - Edicija za Veliku Britaniju
example.com/en-us/something.html - Edicija za Ameriku
Pored toga bilo je potrebno pravilno postaviti rel canonical tagove na stranice edicija koji će voditi na globalnu verziju sajta.
Na primer stranica example.com/en-gb/something.html će imati rel canoncical tag koji vodi na globalnu verziju example.com/en/something.html.
Sve stranice na istom jeziku koje imaju jednu ili više edicija bi trebalo da imaju postavljen rel canonical koji će voditi na stranicu globalne verizje sajta.
Ovom SEO strategijom smo izbegli bespotrebno rasipanje resursa, Google je indexirao samo stranice koje smo želeli, rešili problem dupliciranog sadržaja i zadržali sve edicije sajta.
Kako CDN serveri utiču na SEO
CDN ili Content Delivery Network predstavlja mrežu servera koji su raspoređeni na različitim geografskim lokacijama i koji se između ostalog koriste i za bržu isporuku sadržaja, odnosno povećavaju brzinu sajta, što je kao što znamo jedan od značajnijih SEO faktora. Ono što treba da znamo vezano za naš slučaj i za CDN je to da oni isporučuju sadržaj sa najbliže geografske lokacije na kojoj se server nalazi u odnosu na mesto odakle se šalje upit. Jedan od najpoznatijih CDN provajdera je CloudFlare koji poseduje svoje servere u Beogradu, te ako se upit vrši iz Srbije sadržaj će se distribuirati sa najbližeg servera a to je u Beogradu.
U našem slučaju, klijent se javio sa problemom da je Google indexirao samo stranice engleske verzije sajta, iako je sa tehničke strane sajt postavljen dobro, i da je poseta značajno opala u odnosu na prethodni period.
S obzirom da Google User-Agent najčeće pristupaju iz US, njima će se prilikom krolovanja sajta isporučivati sadržaj sa najbližeg servera a to je u Americi. Obzirom da je sajt postavljen tako da se forsiraju stranice na SERP-u u odnosu na zemlju pretraživanja odnosno slanja upita, Google robotima je bio omogućen samo pristup engleskoj verziji sajta ali ne i drugim jezicima, zbog čega su stranicame drugih jezika ostale neindexirane.
U ovom slučaju bilo je potrebno pravilno podesiti CDN server da bi stranice svih jezika bile indexirane, odnosno bilo je potrebno staviti Google User-Agente na whiite list kako bi mogli da pristupe vašem sajtu.
Podešavanja na CDN serveru podrazumevaju:
- IP Access Roles - podesiti raspon IP adresa Google robota
- Firewall Rules i IP Access Rules - ne smeju da blokiraju posete iz US
- Postavljanje Google User-Agente na White list
Spisak najčešćih User Agenat-a:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +https://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36 |
Googlebot/2.1 (+https://www.google.com/bot.html |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +https://www.google.com/bot.html) Safari/537.36 |
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +https://www.google.com/bot.html) |
Mozilla/5.0 (iPhone; CPU iPhone OS 8_3 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12F70 Safari/600.1.4 (compatible; Googlebot/2.1; +https://www.google.com/bot.html |
Mozilla/5.0 (iPhone; CPU iPhone OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5376e Safari/8536.25 (compatible; Googlebot/2.1; +https://www.google.com/bot.html) |
Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html) |
Ovim podešavanjima smo uspeli brzo da vratimo sajt na SERP ali i da ostanemo pod zaštitom od DDoS napada.
Druga stvar koja takođe može biti uzrok pada u pozicijama ili deindexiranja stranica od strane Google jeste deljena IP adresa na CDN serveru. Naime, CDN serveri dodeljuju jednu IP adresu za više različitih sajtova i u tom slučaju se na istoj IP adresi može naći vaš sajt ali i sajt koji ima lošu SEO istoriju, odnosno sajt koji je iz nekog razloga penalizovan od strane Google.
U ovom slučaju je najbolje zatražiti od CDN provajdera dedicated IP adresu, odnosno jedinstvenu IP adresu za vaš sajt. Dodatno, potrebno je kupiti i SSL sertifikat koji će omogućiti bezbedan protok podataka od CDN servera do vašeg origin servera.
Prikazivanje sadržaja prema IP GEO lokaciji - Blokiranje Google robota zbog forsiranja sadržaja prema lokaciji
Personalizacija sadržaja i korisničkog iskustva je poznata SEO tehnika koja se koristi u svrhu povećanja konverzija na sajtu. U personalizaciju sadržaja spada i prikazivanje sadržaja u zavisnosti od toga iz koje zemlje posetilac dolazi i/ili koji jezik koristi. Ovu tehniku najčešće koriste kompanje koje posluju na više geografskih tržišta kako bi predstavile posebnu ponudu za određeno tržište. Na primer, online prodavnice žele da prikažu cene u različitim valutama za različite zemlje ili posebnu ponudu za praznike koji su karakteristični samo u toj zemlji.
U slučaju sa kojim smo se susreli Google je indexirao samo englesku verziju sajta, dok stranice drugih jezika bivaju izbačene iz indexa i redirektovane 307 (Temporary Redirect) privremenom redirekcijom na stranice engleske verzije sajta.
Google roboti prilikom slanja upita za neku stranicu u header-u ne šalju parametere jezika ali šalju parametre GEO lokacije preko IP adrese sa koje pristupaju. U ovom slučaju kada je na sajtu aktivirano forsiranje sadržaja prema IP lokaciji, Google će uvek pristupati samo engleskoj verziji sajta jer je IP adresa sa koje pristupa iz US, odnosno engleskog govornog područja.
Iz skripte koja izvršava funkciju forsiranja sadržaja prema GEO lokacije treba da se izuzmu Google User-Agenti kako bi roboti mogli da indexiraju i stranice drugih jezika. Nakon ovog podešavanja stranice svih jezika su bile indexirane i više nisu imale status kod 307 (privremene redirekcije).
SEO problemi uzrokovani zbog loše definisane mape sajta (sitemap.xml )
Jedan od problema koji se ne sreću tako često, ili se retko obraća pažnja na njega, jeste pogrešno kreiranje sajt mape. Sajt mapa pomaže pretraživačima da lakše indexiraju sajt i da na brz način saznaju više o stanicama sajta. Pomoću meta tagova koji se definišu za svaki URL možemo reći Google na kom jeziku je stranica napisana, kada je poslednji put modifikovana i koliko često se modifikuje.
U sajt mapi treba da se nalaze samo URL-ovi sa status codom 200, odnosno samo URL-ovi onih stranica koje se stvarno nalaze na sajtu. Sajt mapa sa URL-ovima koji su redirektovani 301 redirekcijom ili sa nepostojećim stranicama sa 404 status codom se najčešće javljaju kod online prodavnica koja ima veliki broj stranica. Iako postoji više tipova sajt mape najčešće koristimo XML sajt mape koje moraju biti tipa application/xml.
Pojava nepotrebnih stranica u sajt mapi, kao što su stranice sa 404 ili 301 status kodom, može dovesti do sporijih SEO rezultata, a u nekim slučajevima i do izbacivanja pojedinih stranica iz Google indexa.
U sajt mapi treba da se nalaze samo URL-ovi sa status codom 200!
Ne zaboravite da dodate link do sajt mape u robots.txt fajl :).
302 i 307 redirekcije i optimizacija
Brisanjem stranica, promenom CMS ili promenom strukture URL-ova sajta na bilo koji način, dolazi do pojave error stranica sa 404 status coodom. Ovo je znak za SEO stručnjake da je potrebno uraditi odgovarajuće redirekcije. Kako je ovo često posao programera kojima SEO stručnjaci daju uputstva koje stranice treba redirektovati, može se desiti da se greškom urade privremene redirekcije 307 odnosno 302.
Nakon nekog vremena pošto su urađene redirekcije primećujemo da stranice na koje su redirektovani stari URL-ovi više ne rangiraju za određene upite kao ranije, čak se i ne pojavljuju u pretrazi. Autoritet stranice koji smo gradili mesecima i/ili godinama srušio se za jedan dan. Kada proveravamo redirekcije fizički (klikom na link) vidimo da je stranica redirektovana na onu na koju želimo ali često ne proverimo status cod redirektovane stranice.
Proverom status koda redirektovanih URL-ova možemo utvrditi o kom tipu redirekcija se radi. Ukoliko je to privremena redirekcija 302 ili 307 trebamo znati da ovaj tip redirekcija ne prenosi autoritet na stranicu na koju upućuje. Privremene redirekcije se koriste isključivo ukoliko stvarno želimo privremeno da uputimo posetioce na neku drugu stranicu. Primer privremenih 307 redirekcija može biti emergency stranica koja se aktivira za sve stranice na sajtovima avio kompanija kad dođe do nesreće ili na online prodavnicama ukoliko je neki proizvod trenutno nedostupan.
Trajne redirekcije ili redirekcije URL-ova koje više nećemo koristiti se vrše isključivo pomoću 301 redirekcije koje prenosi sav autoritet na URL na koji je redirektovana.
Problem sa indexiranjem sajta
Iako je sajt i sa sadržajne i sa tehničke strane potpuno optimizovan, nekada i previše, dešava se da Google jednostavno ne prikazuje niti jednu njegovu stranicu u pretrazi. Postoji mnogo razloga zbog kojih se to dešava, ali oni sa kojima smo se mi susreli nisu tako česti.
Jedan od razloga zbog kojih se ovo dešava jeste uklanjanje stranica iz Google indexa kroz Google Searach Console. Google-ov alat, Remove URLs se koristi da uklonimo stranice koje ne želimo da redirektujemo i nećemo ih više korisiti. Iz nekog razloga klijenti ili neko ko upravlja GSC pogrešno definiše stranice koje želi da izbaci iz indexa i tako onemogući Google da ih indexira.
Drugi problem sa indexiranjem sajtova se može javiti kada se prilikom prebacivanja sajta iz razvojnog okruženja na produkciono okruženje, zaboravi da se ukloni content="noindex" meta tag. Sa druge strane ako se content="noindex" ukloni pre prebacivanja sajta na produkciju postoji mogućnost indexiranja razvojnog sajta koji se nalazi na poddomenu ili drugom domenu i onda se javlja duplicirani sadržaj.
Filteri mogu biti jako korisni naročito na online prodavnicma, međutim ukoliko se URL-ovi filtera nađu u indexu to može stvoriti SEO problem jer se u tom slučaju javljaju stranice sa dupliranim sadržajem. Da bi zabranili Google da indexira filtere i u indexu ostavili samo jednu stranicu potrebno je da na neki način to i kažete Google. U zavisnosti od vaše SEO strategije ili strukture sajta to možete uraditi primenom meta tagova kao što su rel canonical ili nofollow.
Još jedan način da se pametno iskoriste filteri jeste da se na sajt ugradi funkcija prepisanih URL-ova koja omogućava da URL sa filterom prepišemo u kao URL koji će Google indexirati i tako dobiti stranicu koju dalje možemo da optimizujemo.
Primer:
Stranica sa noindex tagom i primenjenim filterima.
https://www.example.com/index.php?page=autosearch&autocateg=6699&autosubcateg=6RRW
Ista stranica sa index tagom i primenjnim filterima koju možemo optimizovati.
https://www.example.com/autocategory-parts-123/
Wordpress je noćna mora za indexiranje i neindexiranje stranica, zbog čega, između ostalog i preproučujemo Custom CMS. Ukoliko nije dobro podešeno šta treba a šta ne treba da se indexira, može doći do pojavljivanja nepotrebnih stranica u pretrazi kao što su draftovane stranice, razne arhive ili autori.
Struktura sajta sa SEO aspekta
Struktura veb sajta ne samo da utiče na korisničko iskustvo već i na SEO rezultate u šta smo imali prilike i da se uverimo. Nakon redizajna sajta uspeli smo da zadržimo strukturu URL-ova ali ne i strukturu sajta što se odrazilo na pad u pozicijama na SERP-u.
Pre redizajniranja struktura sajta je bila takva da se sa početne strane (kojia se nalazila na root domena) moglo doći do pojedinačnih stranica usluga. Nakon redizajna, početna stranica (domen) je bila podeljena na dva dela, odakle su vodila samo dva linka ka delu namenjenom korisnicima usluga i delu namenjenom stručnjacima iz određene oblast. U ovom slučaju autoritet početne stranice koji se pre redizajniranja prelivao na unutrašnje stranice je potpuno nestao jer sa nje nije bilo linkova ka njima.
Malim dizajnerskim korekcijama na početnoj strani i linkovanjem ka unutrašnjim stranicama sa početne strane, odakle je linkovanje i pre redizajniranja sajta uspeli smo da povratimo autoritet drugih stranica što nam je pomoglo da stranice vratimo na pozicije koje su imale pre redizajna, a za neke čak i da poboljšamo poziciju.
JavaScript i SEO
JavaScript njegovi framework oblici su sve više zastupljeni u web tehnologiji jer su jednostavniji za korišćenje, brži u smislu izvršavanja funkcija i mogu da komuniciraju i sa klijenotm i serverom bez potrebe korišćenja drugih programskih jezika. Potiskujući tako PHP i druge programske jezike na kojima se još uvek zasniva većina veb sajtova, neretko se srećemo sa veb sajtovima koji su delimično ili potpuno izgradjeni primenom JS-a. Sa SEO aspekta brzina i funkcionalnost koju donosi ova tehnologija od velike je vrednosti, ali samo ako se pravilno upotrebi.
Da bi ispravno primenili ovu tehnologiju moramo da znamo i kako ona funkcioniše sa aspekta Googla. Google stranice sajta koje koriste JS indexira iz tri faze: krolovanjem, izvršavanjem JS skripte i indexiranjem. Da bi Google mogao ispravno da pročita stranicu koja je izrađena primenom JS ili čiji su delovi izrađeni primenom JS on mora imati dozvolu da pročita te skripte.
Zabranom indexiranja URL-ova u robots.txt fajlu na kojima se nalazi JS skripta koja služi za prikazivanje određenog sadržaja ili meta tagova Google neće moći ispravno da indexira stranice već će videti samo statični HTML deo sajta. Zato je neophodno omogućiti Google robotima da indexiraju JS skirpte koje se odnose na prikaz sadržaja i/ili meta tagaova.
Pogrešna primena JS tehnologije za interlinking na sajtu je u jednom slučaju sa kojim smo se susreli dovela do toga da se autoritet stranice sa koje se linkovalao do unutrašnjih stranica uopšte nije prenosio na njih, još gore, unutrašnje stranice su ređe krolovane od strane Google.
Linkovanje između stranica se isključivao vrši primenom a href taga, a ne JS funkcijom kojom će se stranica pozivati iz baze podataka. Ova tehnika linkovanja je daleko jednostavnija za programere ali veoma štetna za SEO.
Ukoliko programeri sa kojima sarađujete primenjuju JS za prikaz bilo kakvog sadržaja uputite ih kako da primene JS pre nego što se odluče za primenu ove tehnologije, jer je nekada veoma teško otkriti uzrok lošeg SEO procesa koji je rezultat pogrešne primene JS. Idealan scenario za primenu ove tehnologije za izradu sajta jeste da se JS skripte izvršavaju na serveru, odnosno da se stranica u trenutku pozivanja od strane Google ili posetioca formira na serveru i u celini se se prikaže.
Linkovanje između stranica se isključivao vrši primenom a href taga!
Sinhronizacija sajta sa ERP i drugim poslovnim sistemima
ERP sistemi su neizostavni deo gotovo svake online prodavnice te integracija sa sajtom i upravljanje ovim poslovnim rešenjem je od krucijalnog značaja za SEO. Enterprise Resource Planning ili ERP sistemi pre svega služe za upravljanje i planiranje resursa preduzeća. Jedna od najvažnijih njegovih funkcionalnosti jeste virtualno skladište gde se odvijaju svi procesi vezani za proizvode, od ulaza proizvoda od dobavljača, preko kreiranja popusta do isporuke do krajnjeg kupca.
Prva stvar koju treba uraditi prilikom integracije ERP-a sa veb prodavnicom jeste tačno definisanje načina na koji će ova dva sistema biti povezana, kako i koje podatke će sajt dobijati iz ERP-a i u kom formatu, na koji način i koliko često će se vrštiti sinhronizacija.
Povezivanje ova dva poslovna sistema bi trebalo isključivo vršiti preko jednistvenih vrednosti ID koji se najčešće dodeljuju proizvodnim kategorijama i proizvodima. Povezivanje preko drugih vrednosti kao što su URL kategorije ili naziv kategorije može ugroziti sav SEO trud koji ste uložili. U slučaju takvog povezivanja možemo doći u situaciju da izmenom naziva kategorije u ERP-u dodje do promene URL-a stranice kategorije i/ili meta Title taga i naslova same stranice što je dovole do česte pojave 404 stranica i do velikog broja redirekcija.
Autor:Strahinja Radovanović