Internet, Blogs

Bagaimana untuk menghapuskan laman atau serpihan daripada indeks Google

Mengikut konsep pengindeksan yang diguna pakai oleh Google, menyumbang kesempurnaan, objektiviti maklumat dan pematuhan kepada pertanyaan carian dalam penerbitan keputusan. Jika indeks laman web jatuh dengan kandungan haram, atau sumber untuk spam, muka surat laman web ini tidak akan ditandakan dalam enjin carian pangkalan data yang sama. Bagi kami ia adalah penting untuk mengetahui bagaimana untuk mengeluarkan sesuatu daripada penerbitan keputusan server carian.

Varian sifar pengindeksan Google

Setelah carian robot - program untuk mengumpul maklumat tentang sumber-sumber baru - akan mengimbas halaman laman oleh halaman, maka, apabila di bawah keperluan dasar Google untuk menghuraikan, ia akan diindeks. Tetapi kita juga menunjukkan kepada anda bagaimana untuk menghapuskan tapak atau serpihan anda untuk enjin carian melalui robots.txt - indeks dan mencari di perhentian masa yang sama.

Untuk mengecualikan daripada terbitan sumber secara keseluruhan, dalam folder akar pelayan di mana laman web itu terletak, mewujudkan kawasan teks tertentu - kata robots.txt. Zon ini dirawat dengan enjin carian dan bertindak mengikut arahan yang dibaca.

Perlu diingat bahawa indeks enjin carian Google halaman, walaupun jika pengguna mempunyai akses untuk melihat diharamkan. Apabila penyemak imbas menjawab dengan 401 atau 403 "Akses tidak sah", ia hanya terpakai kepada pelawat, dan bukannya program yang berkumpul untuk ini enjin carian.

Untuk memahami bagaimana untuk menghapuskan tapak daripada pengindeksan enjin carian, penunjuk teks mesti memasukkan baris berikut:

User-agent: Googlebot

Tidak membenarkan: /

Ini menunjukkan kepada crawler kepada indeks larangan semua kandungan pada laman web ini. Berikut adalah bagaimana untuk menghapuskan sebuah laman Google, supaya kedua tidak cache sumber dalam senarai daripada dikesan.

Penjelmaan imbasan protokol yang berlainan

Jika anda perlu senarai standard komunikasi individu, yang mana anda mahu untuk memohon peraturan khas untuk mengindeks Google, sebagai contoh, secara berasingan bagi hiperteks protokol http / https, ia juga perlu untuk mendaftar dalam robots.txt dengan cara yang berikut (contoh).

(Http://yourserver.com/robots.txt) - nama domain laman web anda (mana-mana)

User-agent: * - mana-mana enjin carian

Membolehkan: / - membolehkan indeksasi penuh

Bagaimana untuk mengeluarkan sesuatu dari isu itu sepenuhnya kepada protokol https yang

(Https://yourserver.com/robots.txt):

User-agent: *

Tidak membenarkan: / larangan lengkap mengenai pengindeksan

Dipercepatkan alamat sumber penyingkiran URL- dari Google SERPs

Jika anda tidak mahu menunggu untuk dilantik indeksasi-, dan laman web yang anda mahu menyembunyikan seperti, saya mengesyorkan untuk menggunakan http://services.google.com/urlconsole/controller perkhidmatan yang secepat mungkin. robots.txt pra perlu diletakkan di dalam direktori akar pelayan laman web ini. Perlu ditetapkan arahan yang sesuai.

Jika penunjuk atas sebab tertentu tidak boleh diedit dalam direktori akar, membuat ia cukup dalam folder dengan sasaran yang mana anda mahu untuk menyembunyikan dari enjin carian. Apabila anda melakukan ini dan merujuk kepada perkhidmatan yang secara automatik mengeluarkan alamat hiperteks, Google tidak akan mengimbas folder yang dinyatakan kecacatan dalam robots.txt.

Tempoh halimunan ini ditetapkan selama 3 bulan. Selepas tempoh ini, direktori yang dikeluarkan dari isu, sekali lagi akan diproses oleh pelayan Google.

H ow mengeluarkan tapak untuk mengimbas sebahagiannya

Apabila bot carian membaca kandungan robots.txt, bahawa keputusan tertentu dibuat atas dasar kandungannya. Katakan anda mahu mengecualikan daripada dipaparkan seluruh direktori yang dipanggil Anatom. Ia sudah cukup untuk menetapkan peraturan-peraturan itu:

User-agent: Googlebot

Tidak membenarkan: / Anatom

Atau, sebagai contoh, anda mahu bukan indeks semua jenis imej GIF. Untuk melakukan ini, tambah senarai berikut:

User-agent: Googlebot

Tidak membenarkan: /*.gif$

Berikut adalah contoh yang lain. Hendaklah itu dipadamkan daripada menghuraikan maklumat di muka surat yang dijana secara dinamik, sambil menambah jenis entri indeks:

User-agent: Googlebot

Tidak membenarkan: / *?

Itulah kira-kira, dan menyatakan kaedah-kaedah untuk enjin carian. Perkara yang lain adalah bahawa ia adalah lebih mudah untuk hanya menggunakan tag META ini. Dan webmaster sering menggunakan hanya seperti standard pengawalseliaan pengendalian enjin carian. Tetapi kita akan membincangkan perkara ini dalam artikel akan datang.

Internet, Blogs

Bagaimana untuk menghapuskan laman atau serpihan daripada indeks Google

Similar articles

Internet

Internet

Internet

Internet

Internet

Internet

Trending Now

Makanan dan minuman

Pembentukan

Teknologi

Kewangan

Makanan dan minuman

Kewangan

Newest

Kewangan

Kesederhanaan

Seni dan Hiburan

Kesihatan

Hobi

Rumah dan Keluarga