KomputerPerisian

Carian terperinci dan bahasa query. Bahasa pertanyaan enjin carian

Bahasa Pertanyaan - adalah buatan dicipta oleh bahasa pengaturcaraan yang digunakan untuk query pangkalan data dan sistem maklumat.

Secara umum, apa-apa kaedah pertanyaan boleh dikelaskan bergantung kepada sama ada ia digunakan untuk pangkalan data, atau cari maklumat. Perbezaannya ialah bahawa permintaan untuk perkhidmatan tersebut komited untuk memberikan jawapan berdasarkan fakta kepada soalan-soalan, manakala enjin carian cuba untuk mencari dokumen yang mengandungi maklumat yang berkaitan dengan pengguna yang berminat dalam bidang ini.

Pangkalan data

Bahasa pertanyaan pangkalan data termasuk contoh-contoh berikut:

  • QL - objek berorientasikan, merujuk kepada pangkalan data hubungan; pengganti Datalog.
  • Konteks (CQL) - bahasa rasmi pembentangan permintaan untuk sistem dapatan semula maklumat (seperti indeks web atau katalog bibliografi).
  • CQLF (CODYASYL) - untuk pangkalan data CODASYL-TYPE.
  • Konsep berorientasikan bahasa pertanyaan (COQL) - digunakan dalam model masing-masing (com). Ia adalah berdasarkan kepada prinsip-prinsip pemodelan construpt data dan menggunakan operasi seperti unjuran dan de unjuran analisis multivariat, operasi analisis dan kesimpulan.
  • DMX - digunakan dalam model perlombongan.
  • Datalog - satu bahasa pertanyaan untuk pangkalan data deduktif.
  • Gellish Bahasa Inggeris - bahasa yang boleh digunakan untuk query pangkalan data dalam Gellish bahasa Inggeris dan membolehkan perbualan (permintaan dan jawapan), dan juga berfungsi untuk maklumat pemodelan pengetahuan.
  • HTSQL - menterjemahkan http-pertanyaan dalam SQL.
  • ISBL - digunakan untuk PRTV (a hubungan pertama sistem pengurusan pangkalan data).
  • LDAP - protokol untuk menyoal dan perkhidmatan direktori berjalan melalui protokol TCP / IP.
  • MDX - penting untuk pangkalan data OLAP.

bots

pertanyaan carian bahasa, seterusnya, bertujuan untuk mencari data dalam enjin carian. Ia dicirikan oleh fakta bahawa sebahagian daripada permintaan yang mengandungi teks biasa atau Hypertext dengan pilihan sintaks (contohnya, "dan" / "atau"). Ia berbeza dengan ketara daripada standard bahasa yang sama, yang ditadbir oleh peraturan yang ketat sintaksis atau perintah mengandungi parameter positional.

Pertanyaan carian dikelaskan?

Terdapat tiga kategori yang luas yang meliputi majoriti carian: maklumat, pelayaran, dan urus niaga. Walaupun pengelasan ini tidak ditetapkan secara teori, empirikal ia disahkan oleh kehadiran pertanyaan sebenar dalam enjin carian.

permintaan maklumat - mereka yang meliputi topik yang luas (contohnya, sebuah bandar tertentu atau trak model), berkenaan dengan yang boleh beribu-ribu hasil carian yang berkaitan diperolehi.

Navigation - ia minta yang sedang mencari sebuah laman web atau laman web mengenai topik tertentu (contohnya, YouTube).

Transaksi - mencerminkan niat pengguna untuk melaksanakan tindakan tertentu, sebagai contoh, untuk membeli kereta atau menempah penerbangan.

Enjin carian sering menyediakan jenis seperempat dari permintaan yang digunakan lebih kurang kerap. Ini yang dipanggil permintaan sambungan yang mengandungi rekod sambungan diindeks grafik web (bilangan pautan ke URL yang telah ditentukan, atau berapa banyak halaman diindeks dengan domain tertentu).

Bagaimana untuk menjadikan pencarian maklumat?

Kebanyakan sumber carian tidak mendedahkan log carian, jadi maklumat yang pengguna mencari di web, ia adalah amat sukar untuk mencari. Walau bagaimanapun, kajian saintifik pertama kali muncul pada tahun 1998. Ia kemudiannya semula belajar dilaksanakan pada tahun 2001, yang menganalisis permintaan muncul sebagai sangat relevan. Ia juga menjadi jelas bagaimana untuk menggunakan enjin carian bahasa query.

Mereka menjadi terkenal dengan ciri-ciri menarik yang berkaitan dengan Web:

Panjang purata adalah 2.4 carian perkataan yang dicari.

  • Kira-kira separuh daripada orang yang menghantar permintaan, tetapi sedikit kurang daripada satu pertiga daripada pengguna melakukan pertanyaan satu tiga atau lebih unik demi satu.
  • Hampir separuh daripada pengguna untuk melihat hanya yang pertama satu atau dua muka surat keputusan.
  • Kurang daripada 5% daripada pengguna menggunakan kemampuan carian maju (sebagai contoh, pilihan mana-mana kategori atau carian dalam carian tertentu).

Ciri-ciri tindakan tersuai

Kajian ini juga menunjukkan bahawa 19% daripada permintaan yang terkandung jangka geografi (contohnya, nama, poskod, ciri-ciri geografi, dan sebagainya. D.). Namun, ia adalah diperhatikan bahawa sebagai tambahan kepada pertanyaan ringkas (iaitu dengan pelbagai syarat) sering pola hadir dan boleh diramal di mana pengguna menukar frasa carian mereka.

Ia juga mendapati bahawa 33% daripada permintaan daripada seorang pengguna yang berulang-ulang, dan dalam 87% daripada kes-kes pengguna akan menekan keputusan yang sama. Ini menunjukkan bahawa ramai pengguna menggunakan permintaan berulang untuk menyemak atau mencari semula maklumat.

Taburan kekerapan permintaan

Di samping itu, pakar-pakar mengesahkan bahawa kekerapan permintaan pengedaran sesuai dengan undang-undang kuasa. Iaitu, sebahagian kecil daripada kata kunci yang berlaku pada senarai terbesar pertanyaan (contohnya, lebih daripada 100 juta), dan mereka yang paling sering digunakan. Sepanjang hukuman di bawah mata pelajaran yang sama digunakan kurang kerap dan lebih individu. Fenomena ini dipanggil prinsip Pareto (atau "80-20 peraturan"), dan ia adalah mungkin untuk menggunakan teknik pengoptimuman enjin carian seperti seperti pengindeksan atau pembahagian pangkalan data, caching dan preloading, dan juga memberi peluang untuk meningkatkan bahasa pertanyaan enjin carian.

Dalam tahun-tahun kebelakangan ini, ia telah mendedahkan bahawa purata panjang Pertanyaan semakin meningkat dari masa ke masa. Oleh itu, permintaan purata dalam bahasa Inggeris menjadi lebih lama. Dalam hal ini, Google telah memperkenalkan maklumat yang dinamakan "Hummingbird" (Ogos 2013), yang mampu untuk mengendalikan frasa carian lama tanpa protokol "bercakap" bahasa pertanyaan (seperti "Di mana kedai kopi yang terdekat?").

Untuk pertanyaan lagi menggunakan pemprosesan mereka - mereka dipecahkan kepada frasa, dinyatakan bahasa standard, dan memaparkan jawapan kepada bahagian yang berlainan secara berasingan.

Pertanyaan berstruktur

enjin carian yang menyokong operasi logik dan sintaks yang digunakan lebih bahasa pertanyaan lanjutan. Seorang pengguna yang sedang mencari dokumen, yang meliputi beberapa tema atau aspek, dapat menggambarkan setiap daripada mereka dalam pencirian logik perkataan. Pada terasnya, bahasa pertanyaan logik adalah satu set frasa tertentu dan tanda baca.

Apa yang carian lanjutan?

Bahasa "Yandex" dan "Google" pertanyaan yang dapat menjalankan carian yang lebih disasarkan, tertakluk kepada syarat-syarat tertentu. carian lanjutan boleh mencari nama halaman atau menggunakan pengepala awalan, dan juga dalam beberapa kategori dan senarai nama. Ia juga boleh mengehadkan carian untuk halaman yang mengandungi perkataan tertentu dalam tajuk atau di bawah kumpulan tema tertentu. Apabila digunakan dengan betul, bahasa pertanyaan yang ia boleh mengendalikan parameter suatu perintah magnitud lebih kompleks daripada permukaan pengeluaran enjin carian yang paling, termasuk perkataan yang ditetapkan pengguna ke akhir pembolehubah dan ejaan yang sama. Semasa mengemukakan hasil carian berkembang akan dipaparkan sebagai pautan ke bahagian yang berkenaan pada halaman.

Ia juga adalah mungkin untuk mencari semua halaman yang mengandungi frasa tertentu, manakala dalam pertanyaan standard enjin carian tidak boleh tinggal di mana-mana laman perbincangan. Dalam banyak kes, bahasa pertanyaan yang boleh membawa kepada mana-mana halaman, yang terletak di tag noindex.

Dalam beberapa kes, permintaan dibentuk dengan baik membolehkan anda untuk mencari maklumat, yang mengandungi beberapa aksara khas dan surat lain huruf (Cina aksara untuk contoh).

bahasa simbol pertanyaan bagaimana untuk membaca?

Atas dan kes yang lebih rendah, dan beberapa diakritik (aksen dan umlaut) tidak diambil kira dalam carian. Sebagai contoh, carian kata kunci untuk Citroen tidak akan mencari halaman yang mengandungi perkataan "Tsitroon". Tetapi beberapa huruf kembar sesuai dengan huruf individu. Sebagai contoh, mencari "Aeroskobing" dengan mudah mencari halaman yang mengandungi "Ereskebing" (AE = Æ).

Banyak aksara bukan abjad angka sentiasa diabaikan. Sebagai contoh, ia adalah mustahil untuk mencari maklumat untuk pertanyaan yang mengandungi rentetan | L | (Surat antara dua jalur menegak), walaupun pada hakikatnya bahawa simbol ini digunakan dalam beberapa template untuk menukar. Hasilnya hanya akan "LT" data. Beberapa simbol-simbol dan frasa dikendalikan dalam cara yang berbeza: pertanyaan "pinjaman (Kewangan)" memaparkan artikel dengan perkataan "kredit" dan "Kewangan", mengabaikan kurungan, walaupun terdapat satu artikel dengan nama sebenar "kredit (Kewangan)".

Terdapat banyak pilihan yang boleh anda gunakan dengan bahasa pertanyaan.

sintaks

Bahasa Pertanyaan "Yandex" dan "Google" boleh menggunakan beberapa tanda baca untuk mendapatkan hasil carian anda. Sebagai contoh, pendakap kerinting - {{}} carian. Frasa yang terkandung di dalamnya, akan tertakluk kepada cari keseluruhan tidak berubah.

Frasa dalam tanda petik membolehkan anda menentukan matlamat penggeledahan. Sebagai contoh, perkataan dalam tanda petikan akan diiktiraf seperti yang digunakan dalam erti kata kiasan, atau sebagai watak fiksyen, tanpa tanda petikan - maklumat yang lebih dokumentari watak.

Di samping itu, semua enjin carian utama menyokong "-" untuk yang logik "tidak", dan juga dan / atau. Pengecualian - istilah yang tidak boleh dipisahkan oleh sempang atau sengkang awalan.

Tidak sepadan dengan frasa carian ditandakan dengan ~. Sebagai contoh, jika anda tidak ingat kata-kata yang tepat sesuatu istilah atau nama, anda boleh memasukkannya ke dalam bar carian dengan simbol yang ditetapkan, dan akan dapat untuk mendapatkan keputusan dengan persamaan maksimum.

Parameter carian khusus

Terdapat juga kriteria yang intitle dan incategory. Penapis ini dipaparkan melalui kolon, sebagai "penapis: rentetan pertanyaan". Rentetan pertanyaan boleh mengandungi istilah carian atau frasa, atau sebahagian atau nama penuh halaman.

Fungsi «intitle: pertanyaan" memberikan keutamaan kepada hasil carian dengan nama, tetapi juga menunjukkan dan keputusan biasa pada header kandungan. Beberapa penapis ini boleh digunakan pada masa yang sama. Bagaimana boleh merebut peluang ini?

Pertanyaan jenis «intitle: nama lapangan terbang" akan memberikan semua barang yang mengandungi nama tajuk lapangan terbang. Jika kita merumuskan sebagai «letak kenderaan intitle: Nama lapangan terbang", maka anda akan mendapat artikel dengan nama lapangan terbang di tajuk dan dengan menyebut tentang tempat letak kenderaan dalam teks.

Carian penapis «incategory: Kategori" kerja-kerja pada prinsip pengeluaran awal artikel yang termasuk dalam kumpulan atau halaman senarai tertentu. Sebagai contoh, pertanyaan carian untuk jenis "Kuil incategory: Sejarah" akan menghasilkan keputusan mengenai sejarah kuil-kuil. Fungsi ini juga boleh digunakan sebagai sambungan, menetapkan pelbagai parameter.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ms.atomiyme.com. Theme powered by WordPress.