Mi az a gyorsítótárazott oldal?
A gyorsítótárazott oldal egy weboldal másolata, amely egy „cache”-nek nevezett ideiglenes információtárolóban van elmentve.
A gyorsítótárazás célja (az adatok tárolása és elérése a cache-ből) az, hogy fájlokat tároljon az adatok visszakeresésének teljesítményének javítása érdekében. Röviden: a cache biztosítja, hogy a jövőbeni kéréseket ugyanazon adatokra gyorsabban lehessen kiszolgálni.
Érdemes megjegyezni, hogy többféle gyorsítótár létezik – a két fő típus a szerver és a böngésző gyorsítótárazása.
A felhasználó oldalán a böngésző tárolja az oldalt, hogy gyorsabban meg tudja jeleníteni anélkül, hogy minden alkalommal újratöltené a tartalmat a szerverről, amikor a felhasználó meglátogatja az adott oldalt vagy erőforrást.
Létezik továbbá a szerver gyorsítótárazás is. A CDN-ek (Tartalomelosztó Hálózatok) gyorsítótárazzák a webes tartalmakat (képeket, videókat és weboldalakat) az úgynevezett „proxy szervereken”, amelyek közelebb vannak a végfelhasználóhoz, mint a weboldal szerverei.
Ezen kívül a keresőmotorok – például a Google – is gyorsítótárazhatnak oldalakat:
A Google webes robotjai rendszeresen átfésülik az internetet és indexelik az új oldalakat. Az internet átfésülése közben a keresőmotor biztonsági másolatokat készít a weboldalakról, hogy azokat a felhasználóknak meg tudja mutatni, még akkor is, ha az élő oldal éppen nem elérhető.
2024-es frissítés: A Google eltávolította a gyorsítótárazott oldalak hivatkozását a találati oldalakról (SERP-ekről).
Miért fontosak a gyorsítótárazott oldalak?
Webböngészőkben
Amikor egy felhasználó betölt egy adott weboldalt, a böngészőjének rengeteg adatot kell letöltenie, hogy megfelelően meg tudja jeleníteni az oldalt. Azonban, ha a gyorsítótárazás engedélyezve van, a szerver tárolja a HTML fájlokat, a JavaScriptet és a képeket – lényegében egy másolatot az adott oldal tartalmáról – a felhasználó merevlemezén.
Így amikor a felhasználó újra betölti ugyanazt az oldalt, nincs szükség arra, hogy a szerver ismét letöltse a webes dokumentumokat; a HTML fájl már készen áll és elküldhető a böngészőnek. Ez pedig csökkentheti a betöltési időt, valamint a sávszélesség használatot és a szerver terhelését.
Más szavakkal, a gyorsítótárazás lehetővé teszi, hogy a böngésző gyorsabban jelenítse meg az oldalakat.
CDN-ekben
A CDN-ek (Tartalomelosztó Hálózatok) – például a CloudFlare – az internet különböző pontjain több különböző szerveren (más néven „proxy szervereken”) tárolják a weboldalak másolatait. Így a CDN a kért tartalmat a felhasználóhoz legközelebbi proxy szerverről tudja kiszolgálni, ami jelentősen felgyorsítja a folyamatot.
Itt egy példa:
Tegyük fel, hogy Franciaországban vagy, és egy olyan weboldalt látogatsz meg, amelynek szervere Ausztráliában található. Egy Franciaországban lévő szerverről gyorsabb lenne betölteni az oldalt, mint az Ausztráliában található szerverhez küldeni a kérést – itt jön képbe a gyorsítótárazás.
Ha a CDN-nek van egy másolata (vagy gyorsítótárazott oldala) a kért oldalról egy Franciaországban lévő proxy szerveren, akkor azt fogják használni a felhasználó kérésének kiszolgálására és az oldal betöltésére.
Keresőmotorokban
Amikor a Google feldolgozza az éppen bejárt weboldalt, készít róla egy „képernyőképet”, amely biztonsági másolatként szolgál az adott oldalról. Így a felhasználó hozzáférhet a gyorsítótárazott oldalhoz akkor is, ha az élő oldal, amit megpróbál elérni, ideiglenesen nem elérhető vagy lassú.
Ezek az oldalak a Google gyorsítótárának részét képezik, tehát a SERP-eken keresztül megtekintheted az oldal gyorsítótárazott verzióját.
Kattints a három pontra (vagy egy lefelé mutató nyílra) a webhely URL-je mellett a keresési eredmények között, és válaszd a „Gyorsítótárazott” gombot az „Erről az eredményről” felugró ablakban, ahogy az alábbiakban látható:
Gyorsítótárazott keresési eredmények a Google-nél
Ha nem szeretnéd, hogy a Google a gyorsítótárazott verzióit jelenítse meg weboldalaidról a SERP-eken, használhatsz Robots meta tageket – különösen a Noarchive Tag-et –, hogy megakadályozd a keresőmotort a tartalmaid gyorsítótárazásában.
Általában a következő kódrészletet használhatod, hogy hozzáadj egy Noarchive Tag-et a weboldaladhoz:
<Meta name=“Robots” Content=“Noarchive”>
Azonban, ha kifejezetten a Google robotjait célozod meg, használd ezt a módszert:
<Meta Name=“GoogleBot” Content=“Noarchive”>