Internet, Blogs
Bagaimana untuk menghapuskan laman atau serpihan daripada indeks Google
Mengikut konsep pengindeksan yang diguna pakai oleh Google, menyumbang kesempurnaan, objektiviti maklumat dan pematuhan kepada pertanyaan carian dalam penerbitan keputusan. Jika indeks laman web jatuh dengan kandungan haram, atau sumber untuk spam, muka surat laman web ini tidak akan ditandakan dalam enjin carian pangkalan data yang sama. Bagi kami ia adalah penting untuk mengetahui bagaimana untuk mengeluarkan sesuatu daripada penerbitan keputusan server carian.
Varian sifar pengindeksan Google
Setelah carian robot - program untuk mengumpul maklumat tentang sumber-sumber baru - akan mengimbas halaman laman oleh halaman, maka, apabila di bawah keperluan dasar Google untuk menghuraikan, ia akan diindeks. Tetapi kita juga menunjukkan kepada anda bagaimana untuk menghapuskan tapak atau serpihan anda untuk enjin carian melalui robots.txt - indeks dan mencari di perhentian masa yang sama.
Untuk mengecualikan daripada terbitan sumber secara keseluruhan, dalam folder akar pelayan di mana laman web itu terletak, mewujudkan kawasan teks tertentu - kata robots.txt. Zon ini dirawat dengan enjin carian dan bertindak mengikut arahan yang dibaca.
Perlu diingat bahawa indeks enjin carian Google halaman, walaupun jika pengguna mempunyai akses untuk melihat diharamkan. Apabila penyemak imbas menjawab dengan 401 atau 403 "Akses tidak sah", ia hanya terpakai kepada pelawat, dan bukannya program yang berkumpul untuk ini enjin carian.
Untuk memahami bagaimana untuk menghapuskan tapak daripada pengindeksan enjin carian, penunjuk teks mesti memasukkan baris berikut:
User-agent: Googlebot
Tidak membenarkan: /
Ini menunjukkan kepada crawler kepada indeks larangan semua kandungan pada laman web ini. Berikut adalah bagaimana untuk menghapuskan sebuah laman Google, supaya kedua tidak cache sumber dalam senarai daripada dikesan.
Penjelmaan imbasan protokol yang berlainan
Jika anda perlu senarai standard komunikasi individu, yang mana anda mahu untuk memohon peraturan khas untuk mengindeks Google, sebagai contoh, secara berasingan bagi hiperteks protokol http / https, ia juga perlu untuk mendaftar dalam robots.txt dengan cara yang berikut (contoh).
(Http://yourserver.com/robots.txt) - nama domain laman web anda (mana-mana)
User-agent: * - mana-mana enjin carian
Membolehkan: / - membolehkan indeksasi penuh
Bagaimana untuk mengeluarkan sesuatu dari isu itu sepenuhnya kepada protokol https yang
(Https://yourserver.com/robots.txt):
User-agent: *
Tidak membenarkan: / larangan lengkap mengenai pengindeksan
Dipercepatkan alamat sumber penyingkiran URL- dari Google SERPs
Jika anda tidak mahu menunggu untuk dilantik indeksasi-, dan laman web yang anda mahu menyembunyikan seperti, saya mengesyorkan untuk menggunakan http://services.google.com/urlconsole/controller perkhidmatan yang secepat mungkin. robots.txt pra perlu diletakkan di dalam direktori akar pelayan laman web ini. Perlu ditetapkan arahan yang sesuai.
Jika penunjuk atas sebab tertentu tidak boleh diedit dalam direktori akar, membuat ia cukup dalam folder dengan sasaran yang mana anda mahu untuk menyembunyikan dari enjin carian. Apabila anda melakukan ini dan merujuk kepada perkhidmatan yang secara automatik mengeluarkan alamat hiperteks, Google tidak akan mengimbas folder yang dinyatakan kecacatan dalam robots.txt.
Tempoh halimunan ini ditetapkan selama 3 bulan. Selepas tempoh ini, direktori yang dikeluarkan dari isu, sekali lagi akan diproses oleh pelayan Google.
H ow mengeluarkan tapak untuk mengimbas sebahagiannya
Apabila bot carian membaca kandungan robots.txt, bahawa keputusan tertentu dibuat atas dasar kandungannya. Katakan anda mahu mengecualikan daripada dipaparkan seluruh direktori yang dipanggil Anatom. Ia sudah cukup untuk menetapkan peraturan-peraturan itu:
User-agent: Googlebot
Tidak membenarkan: / Anatom
Atau, sebagai contoh, anda mahu bukan indeks semua jenis imej GIF. Untuk melakukan ini, tambah senarai berikut:
User-agent: Googlebot
Tidak membenarkan: /*.gif$
Berikut adalah contoh yang lain. Hendaklah itu dipadamkan daripada menghuraikan maklumat di muka surat yang dijana secara dinamik, sambil menambah jenis entri indeks:
User-agent: Googlebot
Tidak membenarkan: / *?
Itulah kira-kira, dan menyatakan kaedah-kaedah untuk enjin carian. Perkara yang lain adalah bahawa ia adalah lebih mudah untuk hanya menggunakan tag META ini. Dan webmaster sering menggunakan hanya seperti standard pengawalseliaan pengendalian enjin carian. Tetapi kita akan membincangkan perkara ini dalam artikel akan datang.
Similar articles
Trending Now