Komputer, Keselamatan

Sistem ini ... tanda - Encoding: pengekodan maklumat

Maklumat pengekodan adalah bidang pengetahuan yang sangat luas. Sudah tentu, ia secara langsung berkaitan dengan perkembangan teknologi digital. Di banyak institusi pendidikan moden topik yang paling popular adalah pengekodan maklumat. Hari ini kita akan mengkaji tafsiran utama fenomena ini berkaitan dengan pelbagai aspek kerja komputer. Kami akan cuba menjawab soalan: "Adakah pengekodan proses, kaedah, instrumen, atau semua fenomena ini secara serentak?"

Zeros dan Unit

Hampir semua jenis data yang dipaparkan pada skrin komputer, bagaimanapun, adalah kod perduaan yang terdiri daripada nol dan yang lain. Ini adalah kaedah penyulitan maklumat "tahap rendah" yang paling mudah, yang membolehkan PC memproses data. Kod binari adalah universal: ia difahami oleh semua komputer tanpa pengecualian (sebenarnya, untuk tujuan ini ia dicipta - untuk menyeragamkan penggunaan maklumat dalam bentuk digital).

Unit asas yang menggunakan pengekodan binari adalah bit (dari frasa "angka binari"). Ia sama ada 0 atau 1. Sebagai peraturan, bit tidak digunakan secara individu, tetapi digabungkan menjadi urutan 8 digit - bait. Dalam setiap mereka, sehingga, sehingga 256 kombinasi sifar dan yang (2 dalam darjah 8) dapat terkandung. Sebagai peraturan, bait tunggal digunakan untuk menulis sejumlah besar maklumat, tetapi skala yang lebih besar - dengan awalan "kilo", "mega", "giga", "ter", dan sebagainya, masing-masing 1000 kali lebih besar daripada yang sebelumnya .

Teks pengekodan

Jenis data digital yang paling biasa adalah teks. Bagaimana ia dikodkan? Ini adalah proses yang mudah dijelaskan. Satu huruf, tanda baca, nombor atau simbol boleh dikodkan oleh satu atau lebih bait, iaitu, komputer melihatnya sebagai urutan nol dan yang unik, dan kemudian, mengikut algoritma pengiktirafan tertanam, memaparkan pada skrin. Terdapat dua piawai dunia utama untuk "penyulitan" teks komputer - ASCII dan UNICODE.

Dalam sistem ASCII, setiap watak dikodkan dengan hanya satu bait. Iaitu, melalui piawaian ini, anda boleh "menyulitkan" sehingga 256 aksara - yang lebih daripada cukup untuk memaparkan simbol kebanyakan huruf dunia. Sudah tentu, semua sistem abjad nasional yang ada tidak sesuai dengan sumber ini. Oleh itu, setiap abjad mempunyai "subsistem" tersendiri bagi penyulitan. Terdapat pengekodan maklumat dengan bantuan sistem tanda, disesuaikan dengan sampel penulisan negara. Walau bagaimanapun, setiap sistem ini, sebaliknya, merupakan sebahagian daripada standard ASCII global yang diterima pakai di peringkat antarabangsa.

Dalam sistem ASCII, sumber sangat 256 aksara ini dibahagikan kepada dua bahagian. 128 pertama adalah simbol yang diberikan kepada abjad Inggeris (huruf dari a ke z), serta nombor, tanda baca asas dan beberapa simbol lain. 128 bait kedua disimpan, di bawah sistem surat kebangsaan. Ini adalah "subsistem" untuk abjad bukan bahasa Inggeris - Rusia, Hindi, Arab, Jepun, Cina dan banyak lagi.

Setiap daripada mereka dibentangkan sebagai jadual pengekodan berasingan. Iaitu, ia boleh berlaku (dan, sebagai peraturan, ia berlaku) supaya urutan kecil yang sama akan bertanggungjawab untuk huruf dan simbol yang berbeza dalam dua jadual "kebangsaan" berasingan. Selain itu, berkaitan dengan spesifikasi pembangunan sfera IT di negara-negara yang berbeza, walaupun mereka berbeza. Sebagai contoh, dua sistem pengekodan adalah yang paling biasa untuk bahasa Rusia: Windows-1251 dan KOI-8. Yang pertama muncul kemudian (serta sistem pengendalian, konsonan dengannya), tetapi sekarang ramai pakar IT menggunakannya sebagai perkara yang menjadi keutamaan. Oleh itu, komputer, supaya ia dapat dijamin membaca teks Rusia, harus dapat mengenali kedua-dua jadual dengan betul. Tetapi, sebagai peraturan, tidak ada masalah dengan ini (jika PC mempunyai sistem operasi moden).

Kaedah pengekodan teks terus dipertingkatkan. Sebagai tambahan kepada sistem ASCII "single-byte", yang mampu mengendalikan hanya 256 nilai untuk simbol, terdapat juga sistem UNICODE "dua-bait". Ia adalah mudah untuk mengira bahawa ia membolehkan pelaksanaan pengekodan teks dalam jumlah yang sama dengan 2 dalam gelar 16, iaitu 65 ribu 536. Ia, pada gilirannya, mempunyai sumber untuk secara serentak pengekodan praktikal semua huruf kebangsaan yang ada di dunia. Penggunaan UNICODE tidak kurang biasa daripada penggunaan standard "klasik" ASCII.

Mengekod grafik

Di atas, kami menentukan bagaimana teks "disulitkan" dan bagaimana bait digunakan. Bagaimana dengan foto dan gambar digital? Ia juga agak mudah. Sama seperti yang berlaku dengan teks, peranan utama dalam pengekodan grafik komputer dimainkan oleh semua bait yang sama.

Proses membina imej digital secara amnya adalah serupa dengan mekanisme di mana TV berfungsi. Pada skrin TV, jika anda melihat dengan teliti, gambar itu terdiri daripada satu set mata individu, yang bersama-sama membentuk angka yang diiktiraf pada jarak tertentu oleh mata. Matriks televisyen (atau projektor CRT) menerima dari pemancar koordinat mendatar dan menegak setiap mata dan secara beransur-ansur mengatur imej. Prinsip komputer pengekodan grafik berfungsi dengan sama. "Enkripsi" bait imej didasarkan pada menentukan setiap titik skrin koordinat yang sama (serta warna masing-masing). Ia mudah untuk bercakap. Sudah tentu, pengekodan grafik adalah proses yang lebih rumit daripada teks yang sama.

Kaedah menentukan koordinat dan parameter berwarna untuk titik disebut "raster". Begitu juga, banyak format fail untuk grafik komputer dipanggil. Koordinat setiap mata imej, serta warna mereka, ditulis dalam satu atau lebih bait. Apa yang menentukan nombor mereka? Terutamanya dari berapa warna warna yang akan "disulitkan". Satu byte, seperti yang anda tahu, adalah 256 nilai. Sekiranya terdapat cukup warna untuk membina gambar, kami akan menguruskan sumber ini. Terutama, 256 warna kelabu boleh muncul pada pelupusan kami. Dan ini akan cukup untuk menyandikan hampir semua imej hitam dan putih. Sebaliknya, untuk imej warna sumber ini jelas tidak cukup: mata manusia, seperti yang diketahui, dapat membezakan sehingga beberapa puluhan juta warna. Oleh itu, anda memerlukan "stok" bukan nilai 256, tetapi ratusan ribu kali lebih. Kenapa untuk menyandikan mata, tidak satu byte yang terlibat, tetapi beberapa: mengikut piawaian sedia ada, mereka boleh menjadi 16 (anda boleh "menyulitkan" 65,536 warna) atau 24 (16 juta 777 ribu 216 warna).

Tidak seperti standard teks, pelbagai yang setanding dengan bilangan bahasa dunia, grafiknya lebih mudah. Format fail yang paling biasa (seperti JPEG, PNG, BMP, GIF, dan lain-lain) diiktiraf pada kebanyakan komputer pada umumnya sama dengan baik.

Tiada apa-apa yang sukar difahami, mengikut prinsip-prinsip yang mana pengekodkan maklumat grafik dijalankan . 9 gred sekolah rata-rata mana-mana di Rusia, sebagai peraturan, termasuk kursus dalam sains komputer, di mana teknologi serupa diungkapkan dalam bahasa yang sangat mudah dan mudah difahami. Terdapat juga program latihan khusus untuk orang dewasa - mereka dianjurkan oleh universiti, lyceum, atau juga sekolah.

Oleh itu, orang Rusia moden mempunyai banyak pengetahuan mengenai kod yang penting dalam segi grafik komputer. Dan jika anda ingin berkenalan dengan pengetahuan asas sendiri, anda boleh memperoleh bahan pengajaran yang berpatutan. Ini termasuk, misalnya, bab "Pengekodan maklumat grafik (Gred 9, buku teks" Informatika dan ICT "di bawah pengarang Ugrinovich ND).

Mengekodkan data bunyi

Komputer digunakan secara kerap untuk mendengar muzik dan fail audio lain. Sama seperti dalam teks dan grafik, sebarang bunyi pada PC adalah semua bait yang sama. Mereka, pada gilirannya, "disahsulit" oleh kad audio dan mikrosirkuit lain dan ditukar kepada bunyi yang boleh didengar. Prinsip di sini adalah kira-kira sama seperti dalam kes plat gramophone. Di dalamnya, seperti yang anda ketahui, setiap bunyi sepadan dengan alur mikroskopik pada plastik, yang diiktiraf oleh pembaca, dan kemudian ia disuarakan. Komputer kelihatan seperti segala-galanya. Hanya peranan alur yang dimainkan oleh bait, dalam jenisnya, seperti dalam hal teks dan gambar, kebiasaan binari terletak.

Jika dalam kes imej komputer elemen tunggal adalah titik, maka apabila merakam bunyi, ini adalah yang disebut "undur". Di dalamnya, sebagai peraturan, dua bait ditugaskan, menjana sehingga 65 ribu 536 getaran mikro bunyi. Walau bagaimanapun, tidak seperti cara ia dilakukan dalam pembinaan imej, untuk meningkatkan kualiti bunyi, ia tidak menambah bait tambahan (mereka jelas lebih daripada cukup), tetapi meningkatkan bilangan "tuduhan". Walaupun dalam beberapa sistem audio, bait menggunakan nombor yang lebih kecil dan lebih besar. Apabila pengekodan audio dilakukan, unit standard untuk mengukur "ketumpatan fluks" bait adalah satu saat. Iaitu, getaran mikro, disulitkan dengan 8 ribu sampel sesaat, jelas akan lebih rendah daripada urutan bunyi yang dikodkan sebanyak 44 ribu "jumlah".

Penyeragaman antarabangsa fail audio, serta dalam hal grafik, telah dibangunkan dengan baik. Terdapat beberapa format media audio biasa - MP3, WAV, WMA, yang digunakan di seluruh dunia.

Mengekod video

Jenis "skema hibrid", di mana penyulitan bunyi digabungkan dengan pengekodan gambar, digunakan dalam video komputer. Biasanya, filem dan klip mengandungi dua jenis data - ini adalah bunyi itu sendiri dan video yang disertakan. Bagaimana komponen pertama adalah "disulitkan", kami menerangkan di atas. Dengan yang kedua sedikit lebih sukar. Prinsip-prinsip di sini adalah berbeza daripada kod grafik yang disebutkan di atas. Tetapi terima kasih kepada kesejagatan "konsep" bait, intipati mekanisme ini cukup difahami dan logik.

Marilah kita ingat bagaimana filem itu disusun. Ia tidak lebih daripada urutan bingkai individu (mereka, sebagai peraturan, 24). Dengan cara yang sama, klip video komputer dibina. Setiap bingkai adalah gambar. Mengenai bagaimana ia dibina menggunakan bait, yang kami jelaskan di atas. Sebaliknya, dalam urutan video terdapat bidang kod tertentu, yang membolehkan menghubungkan bingkai individu dengan satu sama lain. Satu jenis pengganti filem digital. Unit pengukuran aliran video yang berasingan (sama dengan mata untuk gambar dan sampel untuk bunyi, seperti dalam format filem dan video "filem"), dianggap sebagai bingkai. Yang terakhir dalam satu saat, mengikut piawaian yang diterima, boleh menjadi 25 atau 50.

Serta dalam kes audio, terdapat piawaian antarabangsa yang biasa untuk fail video - MP4, 3GP, AVI. Pengilang filem dan iklan cuba menghasilkan sampel media yang serasi dengan seberapa banyak komputer yang mungkin. Format fail yang dinyatakan - antara yang paling popular, mereka membuka hampir mana-mana PC moden.

Mampatan Data

Penyimpanan data komputer dijalankan pada pelbagai media - cakera, pemacu kilat, dan sebagainya. Seperti yang telah kami katakan di atas, bait biasanya "terlalu besar" dengan awalan "mega", "giga", "ter", dan sebagainya. Nilai fail yang dikodkan adalah sedemikian rupa sehingga tidak mungkin untuk menempatkannya dengan sumber yang tersedia pada cakera. Kemudian, pelbagai kaedah pemampatan data digunakan. Mereka, sebenarnya, juga mewakili pengekodan. Ini adalah satu lagi tafsiran yang mungkin mengenai istilah ini.

Terdapat dua mekanisme utama untuk pemampatan data. Pada mulanya mereka urutan bit ditulis dalam bentuk "dibungkus". Iaitu, komputer tidak dapat membaca kandungan fail (memperbanyaknya sebagai teks, gambar atau video), jika ia tidak melaksanakan prosedur "membongkar". Satu program yang melakukan pemampatan data dengan cara ini dipanggil arkitek. Prinsip operasinya agak mudah. Mengarkibkan data sebagai salah satu kaedah yang paling popular di mana ia mungkin untuk menyandikan maklumat, informatika di peringkat sekolah dikaji tanpa gagal.

Seperti yang kita ingat, proses "menyulitkan" fail dalam bait diseragamkan. Mari kita ambil standard ASCII. Untuk, katakan, menyulitkan perkataan "halo", kita memerlukan 6 bait, berdasarkan bilangan huruf. Itulah jumlah ruang fail dengan teks ini akan menempati cakera. Apa yang berlaku jika kita menulis perkataan "hello" 100 kali berturut-turut? Tiada apa yang istimewa - untuk ini kita memerlukan 600 bait, masing-masing, jumlah ruang cakera yang sama. Walau bagaimanapun, kita boleh menggunakan arkib, yang akan membuat fail di mana bilangan bait yang lebih kecil akan "disulitkan" arahan, yang kelihatan seperti ini: "hello multiply by 100". Setelah menghitung bilangan huruf dalam mesej ini, kami sampai pada kesimpulan bahawa kami hanya memerlukan 19 byte untuk menulis fail sedemikian. Dan ruang cakera yang sama. Apabila "membongkar" fail arkib yang sama, "penyahsulitan" berlaku, dan teks memperoleh bentuk asal dengan "100 salam". Oleh itu, menggunakan program khas yang menggunakan mekanisme pengekodan khas, kita dapat menyimpan sejumlah besar ruang pada cakera.

Proses di atas agak universal: tidak kira apa sistem tanda digunakan, pengekodan maklumat untuk pemampatan selalu mungkin melalui pengarsipan data.

Apakah mekanisme kedua? Pada tahap tertentu, ia adalah sama dengan apa yang digunakan dalam penyerang. Tetapi perbezaan utama ialah fail terkompresi boleh dipaparkan oleh komputer tanpa prosedur "membongkar". Bagaimanakah mekanisme ini berfungsi?

Seperti yang kita ingat, dalam bentuk asal perkataan "halo" mengambil 6 bait. Walau bagaimanapun, kita boleh pergi ke silap mata dan menulis seperti ini: "prvt". Terdapat 4 bait. Apa yang perlu dilakukan ialah untuk "mengajar" komputer untuk menambah huruf yang kami alih keluar semasa paparan fail. Saya harus mengatakan bahawa dalam praktiknya, proses "pembelajaran" tidak perlu diatur. Mekanisme asas untuk mengenali aksara yang hilang ditetapkan dalam kebanyakan program PC moden. Iaitu, sebahagian besar fail yang kami berurusan dengan setiap hari entah bagaimana "disulitkan" oleh algoritma ini.

Sudah tentu, terdapat juga sistem pengekodan maklumat "hibrid" yang membolehkan pemampatan data pada masa yang sama menggunakan kedua-dua pendekatan yang diterangkan di atas. Dan mereka, kemungkinan besar, akan lebih efektif dari sudut pandangan ekonomi ruang disk, daripada semua orang secara berasingan.

Sudah tentu, dengan perkataan "halo", kita telah menggariskan hanya prinsip asas operasi mekanisme mampatan data. Pada hakikatnya mereka lebih rumit. Sistem pengekodan maklumat yang berbeza boleh menawarkan mekanisme yang sangat kompleks untuk "mampatan" fail. Walau bagaimanapun, kita melihat, disebabkan oleh apa yang mungkin untuk mencapai ekonomi ruang cakera, praktikal tanpa menggunakan kemerosotan kualiti maklumat di PC. Terutama penting ialah peranan pemampatan data apabila menggunakan gambar, audio dan video - jenis data ini lebih mencabar pada sumber cakera berbanding yang lain.

Apa lagi "kod" yang ada?

Seperti yang kita katakan pada mulanya, pengkodan adalah fenomena kompaun. Setelah berurusan dengan prinsip asas pengekodan data digital berdasarkan bait, kita boleh menjejaskan kawasan lain. Ia dikaitkan dengan penggunaan kod komputer dalam beberapa makna lain. Di sini, dengan "kod" kita tidak bermaksud turutan sifar dan yang lain, tetapi koleksi huruf dan simbol yang berlainan (yang, seperti yang telah kita ketahui, sudah dibuat dari 0 dan 1), yang mempunyai kepentingan praktikal untuk kehidupan manusia moden.

Kod perisian

Di tengah-tengah program komputer - kod. Ia ditulis dalam bahasa yang difahami ke komputer. PC, mentafsir kod melaksanakan arahan tertentu. Satu ciri yang tersendiri daripada program komputer dari satu lagi jenis data digital yang terkandung dalam kod ia mampu untuk "menyahsulit" itu sendiri (pengguna hanya perlu memulakan proses).

Satu lagi ciri program ini - dalam fleksibiliti relatif kod yang digunakan. Iaitu, memberi komputer kerja yang sama seorang lelaki boleh, dengan menggunakan set besar "frasa", dan jika perlu - dan dalam bahasa lain.

dokumen markup

Satu lagi kepentingan praktikal skop kod huruf - penciptaan dan format dokumen. Sebagai peraturan, paparan mudah untuk watak-watak pada skrin tidak mencukupi dari sudut pandangan kepentingan praktikal PC. Dalam kebanyakan kes, teks hendaklah dibina menggunakan fon bersaiz tertentu dan warna, disertai dengan unsur-unsur tambahan (seperti, misalnya, jadual). Semua parameter ini ditetapkan, serta dalam hal program bahasa tertentu difahami oleh komputer. PC, mengiktiraf "pasukan", memaparkan dokumen itu betul-betul seperti keinginan pengguna. Di samping itu, teks yang boleh diformat dengan cara yang sama, hanya kerana ia berlaku dengan program, menggunakan set yang berbeza daripada "frasa" dan juga dalam pelbagai bahasa.

Walau bagaimanapun, terdapat perbezaan asas antara kod untuk dokumen dan program komputer. Ia terdiri dalam fakta bahawa bekas tidak dapat menyahsulit diri mereka sendiri. Untuk membuka fail dengan teks berformat sentiasa diperlukan perisian pihak ketiga.

penyulitan data

Satu lagi tafsiran "kod" istilah yang digunakan untuk komputer - adalah penyulitan. Di atas, kami telah menggunakan perkataan ini sebagai sinonim untuk istilah "pengekodan", dan ia adalah dibenarkan. Di sini, penyulitan kita maksudkan pelbagai jenis fenomena. Iaitu pengekodan data digital untuk melarang akses kepada mereka oleh orang lain. Perlindungan fail komputer - aktiviti yang paling penting dalam IT-sfera. Ini sebenarnya disiplin saintifik yang berasingan ia juga termasuk komputer sekolah. Pengekodan fail dengan tujuan untuk menghalang capaian yang tidak dibenarkan - adalah tugas, kepentingan yang diberikan kepada rakyat negara moden di zaman kanak-kanak.

Bagaimanakah mekanisme oleh mana penyulitan data? Prinsip ini adalah sebagai mudah dan jelas kerana semua lepas, kita telah dipertimbangkan. Encoding - satu proses yang mudah dijelaskan dari segi prinsip-prinsip asas logik.

Katakan kita perlu menyampaikan mesej, "Ivanov, Petrov pergi ke" supaya tiada siapa dapat membacanya. Kami percaya komputer untuk menyulitkan mesej dan melihat hasilnya: "10-3-1-15-16-3-10-5-7-20-11-17-6-20-18-3-21". kod ini adalah, sudah tentu, adalah agak mudah: setiap nombor sepadan dengan bilangan huruf dalam abjad frasa kami. "I" berdiri di tempat ke-10, "B" - 3, "A" - pada 1, dan lain-lain Tetapi sistem pengekodan komputer moden boleh menyulitkan data supaya ia akan mengambil ke kekunci yang sangat keras ...

Komputer, Keselamatan

Sistem ini ... tanda - Encoding: pengekodan maklumat

Zeros dan Unit

Teks pengekodan

Mengekod grafik

Mengekodkan data bunyi

Mengekod video

Mampatan Data

Apa lagi "kod" yang ada?

Kod perisian

dokumen markup

penyulitan data

Similar articles

Komputer

Komputer

Komputer

Komputer

Komputer

Komputer

Trending Now

Kesihatan

Perkembangan intelek

Kesederhanaan

Komputer

Sukan dan Kecergasan

Seni dan Hiburan

Newest

Fesyen

Kesederhanaan

Seni dan Hiburan

Makanan dan minuman

Makanan dan minuman

Berita dan Masyarakat