ISO/IEC 8859 - ISO/IEC 8859

ISO 8859 kodlama ailesi
Standart ISO/IEC 8859
sınıflandırma 8 bit genişletilmiş ASCII , ISO 4873 seviye 1
uzatır ABD-ASCII
Öncesinde ISO 646
tarafından başarıldı ISO/IEC 10646 ( Unicode )
Diğer ilgili kodlama(lar) ISO/IEC 10367 , Windows-125x

ISO/IEC 8859 , 8 bitlik karakter kodlamaları için ortak bir ISO ve IEC standart serisidir . Standartlar serisi, ISO/IEC 8859-1 , ISO/IEC 8859-2 vb. gibi numaralı parçalardan oluşur. Terk edilmiş ISO/IEC 8859-12 hariç 15 parça vardır . Bu standartlar serisini sürdüren ISO çalışma grubu dağıtıldı.

ISO/IEC 8859 bölüm 1, 2, 3 ve 4 orijinal olarak Ecma International standardı ECMA-94 idi .

Tanıtım

95 yazdırılabilir ASCII karakterinin bit desenleri, modern İngilizce'de bilgi alışverişi için yeterli olsa da , Latin alfabelerini kullanan diğer dillerin çoğu , ASCII tarafından kapsanmayan ek sembollere ihtiyaç duyar. ISO/IEC 8859 , başka bir 96 yazdırılabilir karakter için konumlara izin vermek için 8 bitlik bir baytta sekizinci biti kullanarak bu sorunu çözmeye çalıştı . Erken kodlamalar, bazı veri iletim protokollerinin kısıtlamaları nedeniyle ve kısmen tarihsel nedenlerden dolayı 7 bit ile sınırlıydı. Bununla birlikte, tek bir 8 bitlik karakter kodlamasına sığabilecek karakterden daha fazla karaktere ihtiyaç vardı, bu nedenle çeşitli Latin alfabelerine uygun en az on tanesi dahil olmak üzere birkaç eşleme geliştirildi.

ISO/IEC 8859 standart parçaları, 0x00–1F ve 0x7F–9F bayt aralıklarını "grafik karakterlerini temsil etmeyen kombinasyonlar" (yani kontrol karakterleri olarak kullanılmak üzere ayrılmış ) olarak açıkça ayırsalar da, yalnızca yazdırılabilir karakterleri tanımlar. ile ISO / IEC 4873 ; ISO 6429 veya ISO 6630 gibi bu baytlarla ilişkili kontrol işlevlerini tanımlayan ayrı bir standartla birlikte kullanılmak üzere tasarlanmıştır . Bu amaçla kayıtlı kodlamaların bir dizi IANA'da eklemek C0 den (31 bayt 0 eşlenmiş kontrol karakterleri) kontrol grubu ISO 646 ve C1- sonuçlanan ISO 6429 (bayt 128 159 eşlenmiş kontrol karakterleri) kontrol grubu tamamı olmasa da çoğu bayt atanmış tam 8 bitlik karakter eşlemeleri. Bu takımlar ISO-8859- sahip n tercih ettikleri olarak MIME bir tercih MIME adı belirtilmedi durumlarda, kendi kanonik adına isim veya. Birçok kişi ISO/IEC 8859- n ve ISO-8859- n terimlerini birbirinin yerine kullanır. ISO/IEC 8859-11 , muhtemelen TIS 620 ile neredeyse aynı olduğu için böyle bir karakter kümesi atanmadı .

karakterler

ISO/IEC 8859 standardı, tipografi için değil, güvenilir bilgi alışverişi için tasarlanmıştır ; standart, isteğe bağlı bitişik harfler, kıvrık tırnak işaretleri, tireler vb. gibi yüksek kaliteli tipografi için gereken simgeleri atlar. Sonuç olarak, yüksek kaliteli dizgi sistemleri genellikle ASCII ve ISO/IEC 8859 standartlarının üzerinde özel veya özel uzantılar kullanır. veya bunun yerine Unicode kullanın.

Pratik deneyime dayanan kesin olmayan bir kural, bir karakter veya sembol, halihazırda yaygın olarak kullanılan bir veri işleme karakter kümesinin parçası değilse ve ayrıca genellikle ulusal bir dil için daktilo klavyelerinde sağlanmadıysa, içeri giremeyeceğini belirtir. bazı Avrupa dilleri için kullanılan « ve » çift ​​tırnak işaretleri dahil edildi, ancak İngilizce ve diğer bazı diller için kullanılan yönlü çift tırnak işaretleri ve dahil edilmedi .

Fransızca œ ve Œ bitişik harflerini alamadı çünkü 'oe' olarak yazılabilirler. Aynı şekilde, tamamı büyük harfli metin için gerekli olan Ÿ da kaldırıldı. Farklı kod noktaları altında da olsa, bu üç karakter daha sonra 1999'da ISO/IEC 8859-15 ile yeniden tanıtıldı ve bu da yeni euro işareti karakterini de tanıttı . Aynı şekilde Felemenkçe ij ve IJ harflerini alamadı , çünkü Hollandaca konuşanlar bunları iki harf olarak yazmaya alışmıştı .

Rumen başlangıçta alamadım onun Ş / ş ve Ţ / ţ ( virgül ile harfler), bu mektuplar başlangıçta ile birleşik çünkü Ş / ş ve Ţ / ţ ( çengelli tarafından) Unicode Consortium , olmaya altında virgülle şekiller dikkate cedilla ile şekillerin glif varyantları . Ancak, aşağıda açık virgül bulunan harfler daha sonra Unicode standardına eklenmiştir ve ayrıca ISO/IEC 8859-16'dadır .

ISO/IEC 8859 kodlamalarının çoğu, Latin alfabesini kullanan çeşitli Avrupa dilleri için gerekli olan aksan işaretleri sağlar. Diğerleri Latin olmayan alfabe sağlar: Yunanca , Kiril , İbranice , Arapça ve Tayca . Tayca, İbranice ve Arapça kodlamalar da birleştirme karakterleri içermesine rağmen , kodlamaların çoğu yalnızca boşluk karakterlerini içerir .

Standart, ideografik yazı sistemleri binlerce kod noktası gerektirdiğinden , Doğu Asya dillerinin ( CJK ) komut dosyaları için herhangi bir hüküm sunmaz . Latin tabanlı karakterler kullanmasına rağmen, Vietnamca da ( Windows-1258'deki gibi aksanları birleştirmeden) 96 konuma sığmaz . Her Japon hece alfabesi (hiragana veya katakana, bkz. Kana ) JIS X 0201'de olduğu gibi uygundur, ancak dünyanın diğer birçok alfabesi gibi, bunlar ISO/IEC 8859 sisteminde kodlanmamıştır.

ISO/IEC 8859'un parçaları

ISO/IEC 8859 aşağıdaki bölümlere ayrılmıştır:

Bölüm İsim Revizyonlar Diğer standartlar Açıklama
Bölüm 1 Latin-1
Batı Avrupa
1987 , 1998 ECMA-94 ( 1985 , 1986) Çoğu Batı Avrupa dilini kapsayan ISO/IEC 8859'un belki de en yaygın kullanılan kısmı: Danca (kısmi), Felemenkçe (kısmi), İngilizce , Faeroece , Fince (kısmi), Fransızca (kısmi), Almanca , İzlandaca , İrlandaca , İtalyanca , Norveççe , Portekizce , Rhaeto-Romanic , İskoç Galcesi , İspanyolca , Katalanca ve İsveççe . Doğu Avrupa Arnavutçası , Güneydoğu Asya Endonezyacası ve Afrika dilleri Afrikaanca ve Svahili dili de dahil olmak üzere dünyanın diğer bölgelerinden gelen diller de kapsanmaktadır .

DEC MCS'nin bir modifikasyonu ; ECMA düzeyindeki ilk (1985) standart versiyon , bir sonraki yıl eklenen zaman işareti ve bölme obelusundan yoksundu . Eksik euro işareti ve sermaye Ÿ , revize edilmiş ISO/IEC 8859-15 versiyonundadır (aşağıya bakınız). Karşılık gelen IANA karakter seti ISO-8859-1'dir.

Bölüm 2 Latince-2
Orta Avrupa
1987 , 1999 ECMA-94 (1986) Boşnakça , Lehçe , Hırvatça , Çekçe , Slovakça , Slovence , Sırpça ve Macarca dahil olmak üzere Latin alfabesini kullanan Orta ve Doğu Avrupa dillerini destekler . Eksik euro işareti ISO/IEC 8859-16 sürümünde bulunabilir.
3. Bölüm Latin-3
Güney Avrupa
1988 , 1999 Türkçe , Maltaca ve Esperantoca . Türkçe için büyük ölçüde yerini ISO/IEC 8859-9 almıştır .
4. Bölüm Latin-4
Kuzey Avrupa
1988 , 1998 Estonca , Letonca , Litvanca , Grönlandca ve Sami dili .
Bölüm 5 Latince/Kiril 1988 , 1999 ECMA-113 (1988, 1999) Belarusça , Bulgarca , Makedonca , Rusça , Sırpça ve Ukraynaca (kısmi) dahil olmak üzere çoğunlukla Kiril alfabesi kullanan Slav dillerini kapsar .
6. Bölüm Latince/Arapça 1987 , 1999 ASMO 708 (1986) / ECMA-114 (1986, 2000) En yaygın Arapça dil karakterlerini kapsar. Arap alfabesini kullanan diğer dilleri desteklemez . İhtiyaç olması BiDi ve bitişik eğik birleşmeden ekran için işlenmiş.
7. Bölüm Latince/Yunanca 1987 , 2003 ELOT 928 (1986) / ECMA-118 (1986) Modern Yunan dilini kapsar ( tekdüze imla ). Aksansız veya monotonik imla ile yazılmış Antik Yunanca için de kullanılabilir , ancak politonik imla için aksanlardan yoksundur . Bunlar Unicode ile tanıtıldı. Euro işareti , drahmi işareti ve boşluk ypogegrammeni eklemek için 2003 güncellendi .
Bölüm 8 Latince/İbranice 1988 , 1999 ECMA-121 (1987, 2000) / SI 1311 ( 2002 ) İsrail'de kullanılan modern İbrani alfabesini kapsar . Pratikte iki farklı kodlama vardır, mantıksal sıra ( görüntüleme için BiDi'nin işlenmesi gerekir ) ve görsel (soldan sağa) sıra (aslında, bidi işleme ve satır kesmeden sonra). LRM ve RLM eklemek için 1999 güncellendi . Euro ve şekel işaretleri ve daha çift yönlü format efektörleri eklemek için 2002'de ulusal standart düzeyinde güncellendi; 2002 eklemeleri hiçbir zaman ISO standart versiyonuna dahil edilmedi.
9. Bölüm Latince-5
Türkçe
1989 , 1999 ECMA-128 (1988, 1999) Büyük ölçüde ISO/IEC 8859-1 ile aynıdır ve nadiren kullanılan İzlanda harflerini Türkçe harflerle değiştirir.
Bölüm 10 Latince-6
İskandinav
1992 , 1998 ECMA-144 (1990, 1992, 2000) Latin-4'ün yeniden düzenlenmesi. İskandinav dilleri için daha yararlı olduğu düşünülür. Baltık dilleri Latin-4'ü daha fazla kullanır.
11. Bölüm Latince/Tayca 2001 TIS-620 (1986, 1990) Tay dili için gerekli karakterleri içerir . İlk revizyon 1986 yılında ulusal standart düzeyinde TIS 620 olarak kurulmuştur . 2001'de ISO 8859'un bir parçası olarak ISO standart statüsüne, kesintisiz bir boşluk eklenmesiyle yükseltilmiştir .
12. Bölüm Latince/Devanagari Yok - Devanagari için 8859'un bir parçası yapma çalışması 1997'de resmen terk edildi. ISCII ve Unicode/ISO/IEC 10646 Devanagari'yi kapsıyor.
13. Bölüm Latin-7
Baltık Kıyısı
1998 - Latin-4 ve Latin-6'da eksik olan Baltık dilleri için bazı karakterler eklendi. Daha önce yayınlanan Windows-1257 ile ilgili .
14. Bölüm Latin-8
Kelt
1998 - Galce ve Bretonca gibi Kelt dillerini kapsar . Gal harfleri daha önceki (1994) ISO-IR-182'ye karşılık gelir .
15. Bölüm Latince-9 1999 - 8859-1'in az kullanılan bazı sembolleri kaldıran, yerine euro işareti ve Š , š , Ž , ž , Œ , œ ve Ÿ harfleriyle değiştirilerek Fransızca , Fince ve Estonca kapsamını tamamlayan bir revizyonu .
16. Bölüm Latin-10
Güneydoğu Avrupa
2001 SR 14111 (1998) İçin Amaçlanan Arnavutça , Hırvatça , Macarca , İtalyanca , Lehçe , Romence ve Sloven , aynı zamanda Fince, Fransızca, Almanca ve İrlanda Gal (yeni yazım). Odak, sembollerden çok harfler üzerindedir. Para işareti ile değiştirilir Euro işareti .

ISO/IEC 8859'un her bölümü, genellikle birbirinden ödünç alınan dilleri desteklemek üzere tasarlanmıştır, bu nedenle her dilin ihtiyaç duyduğu karakterler genellikle tek bir bölüm tarafından barındırılır. Ancak, bazı karakterler ve dil kombinasyonları vardır, bunlar transkripsiyonlar olmadan kabul edilemez. Dönüşümleri olabildiğince sorunsuz hale getirmek için çaba gösterildi. Örneğin, Almanca'nın yedi özel karakterinin tümü, tüm Latin varyantlarında (1-4, 9, 10, 13-16) aynı konumlarda bulunur ve birçok konumda karakterler yalnızca kümeler arasındaki aksanlarda farklılık gösterir. Özellikle, 1-4 arası varyantlar ortaklaşa tasarlanmıştır ve her kodlanmış karakterin belirli bir konumda görünmesi veya hiç görünmemesi özelliğine sahiptir.

Tablo

ISO/IEC 8859'un çeşitli bölümlerinin (1-16) karşılaştırılması
İkili Ekim Aralık altıgen 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
1010 0000 240 160 A0 Bölünemez alan (NBSP)
1010 0001 241 161 A1 ¡ A H A Ё   '   ¡ A B ¡ A
1010 0010 242 162 A2 ¢ ˘ ĸ Ђ   ' ¢ ¢ Ē ¢ B ¢ a
1010 0011 243 163 A3 £ Ł £ R Ѓ   £ G £ Ł
1010 0100 244 164 A4 ¤ Є ¤ ¤ BEN ¤ C
1010 0101 245 165 A5 ¥ Ľ   BEN Ѕ   ¥ BEN C ¥
1010 0110 246 166 A6 ¦ S H Ļ І   ¦ Ķ ¦ NS S
1010 0111 247 167 A7 § Ї   § §
1010 1000 250 168 A8 ¨ Ј   ¨ Ļ Ö s
1010 1001 251 169 A9 © S BEN S Љ   © Đ ©
1010 1010 252 170 AA ª S Ē Њ   ͺ × ª S R ª S
1010 1011 253 171 AB « T G G Ћ   « T « NS «
1010 1100 254 172 AC ¬ Ź J T Ќ ، ¬ Ž ¬ ¬ Ź
1010 1101 255 173 AD Yumuşak tire (SHY) UTANGAÇ
1010 1110 256 174 AE ® Ž   Ž Ў     ® Ū ® ź
1010 1111 257 175 AF ¯ Ż ¯ Џ   - ¯ N Æ Ÿ ¯ Ż
1011 0000 260 176 B0 ° bir   ° ° F °
1011 0001 261 177 B1 ± a H a Б   ± a ± F ±
1011 0010 262 178 B2 ² ˛ ² ˛ В   ² ē ² G ² C
1011 0011 263 179 B3 ³ ł ³ r Г   ³ G ³ G ³ ł
1011 0100 264 180 B4 ' Ä   ΄ ' ben M Ž
1011 0101 265 181 B5 µ ľ µ ben Е   ΅ µ ben µ m µ
1011 0110 266 182 B6 s H ļ Ж   Ά ķ
1011 0111 267 183 B7 · ˇ · ˇ З   · · P ·
1011 1000 270 184 B8 ¸ И   Έ ¸ ļ Ö ž
1011 1001 271 185 B9 ¹ s ben s Й   Ή ¹ đ ¹ P ¹ C
1011 1010 272 186 BA º s ē К   Ί ÷ º s r º s
1011 1011 273 187 BB » T G G Л ؛ » T » S »
1011 1100 274 188 M.Ö ¼ ź J T М   Ό ¼ ž ¼ Œ
1011 1101 275 189 BD ½ ˝ ½ N Н   ½ - ½ œ
1011 1110 276 190 OLMAK ¾ ž   ž o   Ύ ¾ ü ¾ Ÿ
1011 1111 277 191 en iyi kadın ¿ ż n П ؟ Ώ   ¿ n æ s ¿ ż
1100 0000 300 192 C0 A R A A Р   ΐ   A A A A
1100 0001 301 193 C1 A С ء Α   A BEN A
1100 0010 302 194 C2 A Т آ Β   A A A
1100 0011 303 195 C3 A A   A У أ Γ   A C A A
1100 0100 304 196 C4 A Ф ؤ Δ   A A
1100 0101 305 197 C5 A Ĺ C A Х إ Ε   A A C
1100 0110 306 198 C6 Æ C C Æ Ц ئ Ζ   Æ Ę Æ
1100 0111 307 199 C7 C BEN Ч ا Η   C BEN Ē C
1100 1000 310 200 C8 È C È C Ш ب Θ   È C C È
1100 1001 311 201 C9 ben Щ e Ι   ben ben
1100 1010 312 202 CA Ê Ę Ê Ę Ъ ت Κ   Ê Ę Ź Ê
1100 1011 313 203 CB Ë Ы ث Λ   Ë Ė Ë
1100 1100 314 204 CC BEN Ě BEN Ė Ь ج Μ   BEN Ė G BEN
1100 1101 315 205 CD BEN Э ح Ν   BEN er Ķ BEN
1100 1110 316 206 CE BEN Ю خ Ξ   BEN BEN BEN
1100 1111 317 207 CF BEN NS BEN BEN Я د Ο   BEN Ļ BEN
İkili Ekim Aralık altıgen 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
1101 0000 320 208 D0 NS Đ   Đ а ذ Π   G NS S Ŵ NS
1101 0001 321 209 D1 N N N N б ر Ρ   N N N N N
1101 0010 322 210 D2 Ö N Ö Ö в ز     Ö Ö N Ö
1101 0011 323 211 D3 Ö Ķ г س Σ   Ö Ö
1101 0100 324 212 D4 Ö д ش Τ   Ö Ö Ö
1101 0101 325 213 D5 Ö Ö G Ö е ص Υ   Ö Ö
1101 0110 326 214 D6 Ö ж ض Φ   Ö Ö
1101 0111 327 215 D7 × ç ط Χ   × Ũ × T × S
1101 1000 330 216 D8 Ö R G Ö и ظ Ψ   Ö Ų Ö Ű
1101 1001 331 217 D9 Ù Ů Ù Ų é ع Ω   Ù Ų Ł Ù
1101 1010 332 218 DA Ú к غ Ϊ   Ú S Ú
1101 1011 333 219 DB Û Ű Û л   Ϋ   Û   Ū Û
1101 1100 334 220 DC Ü м   ά   Ü   Ü
1101 1101 335 221 DD i Ŭ Ũ н   έ   BEN i   Ż i Ę
1101 1110 336 222 DE NS T S Ū о   ή   S NS   Ž Ŷ NS T
1101 1111 337 223 DF ß п   ί ß ฿ ß
1110 0000 340 224 E0 a r a a р ـ ΰ א a a a a
1110 0001 341 225 E1 a с ف α ב a ben a
1110 0010 342 226 E2 a т ق β ג a a a
1110 0011 343 227 E3 a a   a u ك y ד a C a a
1110 0100 344 228 E 4 a ф ل δ ה a a
1110 0101 345 229 E5 a ĺ C a х م ε ו a a C
1110 0110 346 230 E6 æ C C æ ö ن ζ ז æ ę æ
1110 0111 347 231 E7 C ben ч å η ח C ben ē C
1110 1000 350 232 E8 è C è C ш و θ ט è C C è
1110 1001 351 233 E9 é щ ى ι i é é
1110 1010 352 234 EA ê ę ê ę ъ ي κ ך ê ę ź ê
1110 1011 353 235 EB ë ы ً λ כ ë ė ë
1110 1100 354 236 AT ben ě ben ė ü ٌ μ ל ben ė G ben
1110 1101 355 237 ED ben e ٍ ν ם ben ķ ben
1110 1110 356 238 EE ben ş َ ξ מ ben ben ben
1110 1111 357 239 EF ben NS ben ben я ُ ο ן ben ļ ben
1111 0000 360 240 F0 NS đ   đ ِ π נ G NS s ŵ NS đ
1111 0001 361 241 F1 n n n n ё ّ ρ ס n n n n n
1111 0010 362 242 F2 Ö n Ö Ö ђ e ς ע Ö Ö n Ö
1111 0011 363 243 F3 Ö ķ ѓ   σ ף Ö Ö
1111 0100 364 244 F4 Ö є   τ פ Ö Ö Ö
1111 0101 365 245 F5 Ö Ö G Ö ѕ   u ץ Ö Ö
1111 0110 366 246 F6 Ö і   φ צ Ö Ö
1111 0111 367 247 F7 ÷ ї   χ ק ÷ ũ ÷ T ÷ s
1111 1000 370 248 F8 Ö r G Ö ј   ψ ר Ö ų Ö ű
1111 1001 371 249 F9 ü ů ü ų љ   ω ש ü ų ł ü
1111 1010 372 250 FA ü њ   ϊ ת ü s ü
1111 1011 373 251 Facebook u ű u ћ   ϋ   u ü u
1111 1100 374 252 FC ü ќ   ό   ü   ü
1111 1101 375 253 FD ı ŭ ũ §   ύ LRM ben ı   ż ı ę
1111 1110 376 254 FE NS T s ü ў   ώ RLM s NS   ž ŷ NS T
1111 1111 377 255 FF ÿ ˙ џ       ÿ ĸ   ' ÿ
İkili Ekim Aralık altıgen 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16

0xA0 konumunda her zaman bölünmeyen boşluk vardır ve 0xAD çoğunlukla yalnızca satır sonlarında gösterilen yumuşak kısa çizgidir . Diğer boş alanlar ya  atanmamış veya kullanılan sistem bunları görüntüleyemiyor.

Var   ISO/IEC 8859-7: 2003 ve ISO/IEC 8859-8:1999 sürümleri olarak yeni eklemeler . LRM soldan sağa işareti (U+200E) ve RLM sağdan sola işareti (U+200F) anlamına gelir.

Unicode ve UCS ile İlişki

1991'den beri, Unicode Konsorsiyumu, Unicode Standardı ve ISO/IEC 10646: Evrensel Karakter Kümesi'ni (UCS) birlikte geliştirmek için ISO ve IEC ile birlikte çalışmaktadır . ISO/IEC 8859'un daha yeni sürümleri, karakterleri Unicode/UCS adları ve U+nnnn notasyonu açısından ifade eder ve ISO/IEC 8859'un her bir bölümünün, UCS'den tek 8 bit bayta. Unicode ve UCS'deki ilk 256 karakter, ISO/IEC-8859-1 ( Latin-1 ) ile aynıdır .

ISO/IEC 8859'un parçalarını ve bunların türevlerini içeren tek baytlık karakter kümeleri, iyi kurulmuş ve yazılımda daha kolay uygulanmış olma avantajlarına sahip olarak 1990'lar boyunca tercih edildi: bir baytın bir karaktere denklemi basit ve yeterlidir çoğu tek dilli uygulama için ve birleştirici karakterler veya değişken formlar yoktur. Unicode özellikli işletim sistemleri daha yaygın hale geldikçe, ISO/IEC 8859 ve diğer eski kodlamalar daha az popüler hale geldi. ISO 8859 ve tek baytlık karakter modellerinin kalıntıları birçok işletim sisteminde, programlama dilinde, veri depolama sisteminde, ağ uygulamalarında, ekran donanımında ve son kullanıcı uygulama yazılımında yerleşik olarak kalırken, çoğu modern bilgi işlem uygulaması dahili olarak Unicode kullanır ve dönüştürmeye dayanır. gerektiğinde diğer kodlamalarla eşlenecek ve bunlardan eşlenecek tablolar.

Şu anki durum

ISO/IEC 8859 standardı, ISO/IEC Ortak Teknik Komitesi 1, Alt Komite 2, Çalışma Grubu 3 (ISO/IEC JTC 1/SC 2/WG 3) tarafından sürdürülmüştür. Haziran 2004'te WG 3 dağıldı ve bakım görevleri SC 2'ye devredildi . Alt Komite'nin kalan tek çalışma grubu olan WG 2, Unicode'un Evrensel Kodlu Karakter Setinin geliştirilmesine odaklandığından, standart şu anda güncellenmemektedir .

WHATWG karakter kodlamaları izin belirten Kodlama Standardı, HTML5 uyumlu tarayıcılar desteklemesi gerekir ki, yerine olarak yorumlanır parça 1, 9 ve 11 için hariç, ISO / IEC 8859 çoğunu parçalarını içeren , Windows-1252 , Windows'un-1254 ve Windows-874 sırasıyla. Yeni sayfaların yazarlarına ve yeni protokol tasarımcılarına bunun yerine UTF-8 kullanma talimatı verilir .

Ayrıca bakınız

Notlar

Referanslar

  • ISO/IEC 8859'un her bir bölümünün yayınlanmış sürümleri, ISO katalog sitesinden ve IEC Web Mağazasından ücret karşılığında edinilebilir .
  • ISO/IEC JTC 1/SC 2/WG 3'e incelenmek ve yayınlanmak üzere sunulan ISO/IEC 8859'un bazı bölümlerinin nihai taslaklarının PDF versiyonları WG 3 web sitesinde mevcuttur :
    • ISO/IEC 8859-1:1998 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 1: Latin alfabesi No. 1 (12 Şubat 1998 tarihli taslak, 15 Nisan 1998'de yayınlandı)
    • ISO/IEC 8859-4:1998 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 4: Latin alfabesi No. 4 (12 Şubat 1998 tarihli taslak, 1 Temmuz 1998'de yayınlandı)
    • ISO/IEC 8859-7:1999 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 7: Latin/Yunan alfabesi (10 Haziran 1999 tarihli taslak; ISO/IEC 8859-7:2003, 10 Ekim'de yayınlanmıştır, 2003)
    • ISO/IEC 8859-10:1998 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 10: Latin alfabesi No. 6 (12 Şubat 1998 tarihli taslak, 15 Temmuz 1998'de yayınlandı)
    • ISO/IEC 8859-11:1999 - 8 bitlik tek bayt kodlu grafik karakter setleri, Bölüm 11: Latin/Tay karakter seti (22 Haziran 1999 tarihli taslak; ISO/IEC 8859-11:2001, 15 Aralık'ta yayınlandı 2001)
    • ISO/IEC 8859-13:1998 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 13: Latin alfabesi No. 7 (15 Nisan 1998 tarihli taslak, 15 Ekim 1998'de yayınlandı)
    • ISO/IEC 8859-15:1998 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 15: Latin alfabesi No. 9 (1 Ağustos 1997 tarihli taslak; yerini ISO/IEC 8859-15:1999, 15 Mart'ta yayınladı , 1999)
    • ISO/IEC 8859-16:2000 - 8 bitlik tek bayt kodlu grafik karakter kümeleri, Bölüm 16: Latin alfabesi No. 10 (15 Kasım 1999 tarihli taslak; 15 Temmuz'da yayınlanan ISO/IEC 8859-16:2001, yerini almıştır) , 2001)
  • ISO/IEC 8859 karakter seti standartlarına tam olarak karşılık gelen ECMA standartları şu adreste bulunabilir:
    • Standart ECMA-94 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin Alfabeleri No. 1 - No. 4 2. baskı (Haziran 1986)
    • Standart ECMA-113 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin/Kiril Alfabesi 3. baskı (Aralık 1999)
    • Standart ECMA-114 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin/Arap Alfabesi 2. baskı (Aralık 2000)
    • Standart ECMA-118 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin/Yunan Alfabesi (Aralık 1986)
    • Standart ECMA-121 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin/İbranice Alfabesi 2. baskı (Aralık 2000)
    • Standart ECMA-128 : 8-Bit Tek Bayt Kodlu Grafik Karakter Setleri - Latin Alfabesi No. 5 2. baskı (Aralık 1999)
    • Standart ECMA-144 : 8-Bit Tek Bayt Kodlu Karakter Kümeleri - Latin Alfabesi No. 6 3. baskı (Aralık 2000)
  • ISO/IEC 8859-1 - Unicode eşleme tabloları düz metin dosyaları olarak Unicode FTP sitesindedir.
  • Çoğu ISO/IEC 8859 standardı için resmi olmayan açıklamalar ve kod çizelgeleri, ISO/IEC 8859 Alfabe Çorbası'nda (Ayna) mevcuttur.