logi sisse meist KKK

Mis oleks head ja eristuvad tõlked sõnadele charset ja encoding? Tundub, et mõlema kohta kasutatakse kodeering, mis on veidi ebatäpne.

Encoding võiks minu arusaama kohaselt olla andmete kui baitide kodeering, näiteks bait <0xF5> (ehk Latin-1 "õ") on base64 kodeeringus 9Q==, urlencoding koderingus %F5, quoted-printable kodeeringus =F5 jne.

Charset oleks teksti kui sümbolite kodeerimine (ühte baiti ei mahu kõik sümbolid ära, seega tuleb neid baite kas taaskasutada või kombineerida), näiteks sümbol "õ" on Latin-1 kodeeringus <0xF5>, aga UTF-8 kodeeringus <0xC3><0xB5>.

Üldiselt võiks arvata, et charset on encoding kitsam erivorm, aga igatahes kasutatakse neid termineid reeglina eraldi.

küsitud Jun 09 '14 at 11:34

Andris's gravatar image

Andris
2553310


IT terministandardi järgi on "character set" vaste "märgistik", praktikas kasutatakse sageli ka "kooditabel". Sama allika järgi on "encoding" vaste "kodeerimine", aga kasutatakse ka "kodeering".

Sisuliselt on kooditabel vastavus märkide ja nende numbriliste koodide vahel, kodeering aga nende koodide mingis kindlas vormingus esitamise viis.

Andrise toodud UTF-8 näites on kooditabel (mis määrab märkidele vastavad koodid) tegelikult UNICODE. UTF-8 on kodeering, mis määrab UNICODE koodide 8-bitiste baitide jadana esitamise (UCS-2, UTF-16, UTF-7 j.n.e. on teised võimalikud kodeeringud, mis kasutava ka UNICODE kooditabelit).

link

vastatud Jun 09 '14 at 13:57

Ahto%20Truu's gravatar image

Ahto Truu ♦♦
6596711

märgistik ja kodeering sobivad väga hästi (Y). tõepoolest on kooditabel unicode mitte utf-8, aga pidasin rohkem silmas seda, et näiteks html või mime päises tähistab kõiki neid märgistike väärtusi parameeter charset, mille väärtuseks võib olla siis iso-8859-1, utf-8, utf7, shift_jis vms.

(Jun 09 '14 at 14:11) Andris

Sellistes kohtades on paraku tihtipeale täpne terminoloogia kompaktsusele ja kõnekeelsusele ohvriks toodud. Aga õnneks ei pea päiseid tõlkima. :)

(Jun 10 '14 at 09:55) Mart Oruaas
Sinu vastus
lülita eelvaade

Jälgi seda küsimust

By Email:

Pärast sisselogimist saad tellida muudatuse teavitusi siit

By RSS:

Answers

Answers and Comments

Markdown Basics

  • *kaldkiri* või __kaldkiri__
  • **paks kiri** või __paks kiri__
  • link:[tekst](http://url.com/ "pealkiri")
  • pilt?![alt tekst](/path/img.jpg "pealkiri")
  • nummerdatud nimekiri: 1. Foo 2. Bar
  • to add a line break simply add two spaces to where you would like the new line to be.
  • põhilised HTML märgendid on samuti toetatud

Pinu tööpakkumised

kõik pakkumised »

Küsimuse sildid:

×1
×1

küsitud: Jun 09 '14 at 11:34

nähtud: 2,650 korda

viimati uuendatud: Jun 10 '14 at 09:55

Sarnased küsimused

Litsents: Creative Commons Attribution License | Kontakt: info@pinu.ee