ISO/IEC 646 - ISO/IEC 646

ISO 646 kodlama ailesi
ISO-646-infobox.svg
ISO 646 Değişmez. Red Bowen düğümleri (⌘) ulusal kod noktalarını belirtir. Diğer kırmızı karakterler, dikkate değer küçük değişikliklerle değiştirilir.
Standart ISO/IEC 646, ITU T.50
sınıflandırma 7-bit Temel Latin kodlaması
Öncesinde ABD-ASCII
tarafından başarıldı ISO 8859 , ISO 10646
Diğer ilgili kodlama(lar) DEC NRCS , World System Teletext
Diğer alfabelere uyarlamalar :
ELOT 927 , Symbol , KOI-7 , SRPSCII ve MAKSCII , ASMO 449 , SI 960

ISO/IEC 646 , Bilgi teknolojisi — bilgi alışverişi için ISO 7-bit kodlu karakter seti olarak tanımlanan ve en az 1964'ten beri ASCII ile işbirliği içinde geliştirilen bir dizi ISO standardının adıdır. 1967'deki ilk baskısından bu yana, Birkaç ulusal standardın türetildiği 7 bitlik karakter kodu.

ISO/IEC 646, ECMA tarafından ECMA-6 olarak da onaylanmıştır . ECMA-6'nın ilk versiyonu, ECMA'nın TC1 Teknik Komitesinin Aralık 1960'tan beri yürüttüğü çalışmalara dayanarak 1965'te yayınlandı.

ISO/IEC 646 Temel Karakter Kümesi'ndeki karakterler değişmez karakterlerdir . ISO/IEC 646'nın bu kısmı, yani tüm ülkeler tarafından paylaşılan değişmez karakter seti olduğundan , yalnızca ISO temel Latin alfabesinde kullanılan harfleri belirttiğinden , ek harfler kullanan ülkeler, ISO 646'nın ulusal varyantlarını oluşturmak için gerekliydi. yerel komut dosyaları. 8 bitlik kodların iletimi ve depolanması o sırada standart olmadığı için, ulusal karakterlerin 7 bitlik kısıtlamalara uyması gerekiyordu, yani ASCII'de görünen bazı karakterler ISO 646'nın diğer ulusal türevlerinde görünmüyordu. .

Tarih

Erken ASCII ( ASA X3.4 :1963)

ISO/IEC 646 ve öncülü ASCII ( ASA X3.4 ), telekomünikasyon endüstrisinde karakter kodlamalarına ilişkin mevcut uygulamaları büyük ölçüde onayladı .

US-ASCII veya ISO 646:US

ASCII, İngilizce dışındaki diller için gereken sayıda karakter sağlamadığından, daha az kullanılan bazı karakterleri gerekli olanlarla değiştiren bir dizi ulusal varyant yapıldı. Çeşitli ulusal varyantların uyumsuzluğu nedeniyle, değiştirilen seti en azından tüm varyantlarda aynı karakterlerle sınırlamak amacıyla ISO/IEC 646'nın Uluslararası Referans Versiyonu (IRV) tanıtıldı. Orijinal sürüm (ISO 646 IRV) ASCII'den yalnızca 0x24 kod noktasında farklıydı, ASCII'nin dolar işareti ($) uluslararası para birimi simgesi (¤) ile değiştirildi. ISO 646:1991 kodunun son 1991 versiyonu aynı zamanda ITU T.50 , Uluslararası Referans Alfabesi veya IRA, eski adıyla Uluslararası Alfabe No. 5 (IA5) olarak da bilinir . Bu standart, kullanıcıların 12 değişken karakteri (yani iki alternatif grafik karakteri ve 10 ulusal tanımlı karakter) kullanmasına izin verir. Bu alıştırmalar arasında ISO 646:1991 IRV (Uluslararası Referans Sürümü) açıkça tanımlanmıştır ve ASCII ile aynıdır .

ISO 8859 8 bitlik karakter kodlamalarını düzenleyen standartların serisi ilave bir bitle 96 ek karakterler sağlayan ve böylece ASCII kodları herhangi ikame kaçınarak ISO 646 uluslararası standart ve ulusal varyantları, yerini alır. ISO 10646 doğrudan ilişkili standart, Unicode , daha büyük 21 bitlik değeri kullanarak karakter kodlamaları biri birleşik set ile ISO 646 ve ISO 8859 setleri hepsi yerine geçmektedir.

ISO 646:JP

Birçok Doğu Asya yerel ayarında dosya adlarında kullanılan ters eğik çizgi karakterinin ¥ veya gibi diğer karakterler olarak işlendiği Windows'ta ISO/IEC 646'nın bir mirası görülmektedir . Orijinal IBM PC'nin kod sayfası 437'de bile ¥ için farklı bir kodun mevcut olmasına ve Shift JIS'de ¥ için ayrı bir çift baytlık kodun mevcut olmasına rağmen (bu genellikle alternatif eşleme kullanıyor olsa da ), ile çok fazla metin oluşturuldu. ¥ için kullanılan ters eğik çizgi kodu (Microsoft bunu ASCII olarak eşlemesine rağmen Shift_JIS resmi olarak ISO 646:JP'ye dayandığından), modern Windows yazı tiplerinin bile kodu bu şekilde oluşturmayı gerekli bulduğunu. ₩ ve EUC-KR için de benzer bir durum söz konusudur . Başka mirası varlığıdır üç karakterli içinde C programlama dili .

Yayınlanmış standartlar

  • ISO/R646-1967
  • ISO 646: 1972
  • ISO 646:1983
  • ISO/IEC 646:1991
  • ECMA-6 (1965-04-30), ilk baskı
  • ECMA-6 (1967-06), ikinci baskı
  • ECMA-6 (1970-07), üçüncü baskı
  • ECMA-6 (1973-08), dördüncü baskı
  • ECMA-6 (1984-12, 1985-03), beşinci baskı
  • ECMA-6 (1991-12, 1997-08), altıncı baskı

Kod sayfası düzeni

Aşağıdaki tablo ISO/IEC 646 Değişmez karakter setini göstermektedir. Her karakter, Unicode eşdeğerinin onaltılı koduyla gösterilir . Ulusal kod noktaları, değiştirilen ASCII karakteriyle gri renktedir. Ağır bir kutu, bazı bölgelerde, glif seçimini etkileyebilecek olan , geri al karakteri kullanılarak aksan olarak önceki bir karakterle birleştirilebilen bir karakteri belirtir .

Değişmez küme kısıtlamalarına ek olarak, 0x23, ISO 646:1991'e eşdeğer ECMA-6:1991'de # veya £ ile sınırlandırılmıştır ve 0x24, $ veya ¤ ile sınırlandırılmıştır . Ancak, bu kısıtlamalara tüm ulusal varyantlar uymamaktadır.

ISO/IEC 646(-INV)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _NS _E _F
0_
0
SIFIR
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
CAN
0018
EM
0019
ALT
001A
ESC
001B
FS
001C
GS
001D
RS
001E
ABD
001F
2_
32
SP
0020
!
0021
"
0022
#
 
$
 
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
 
bir
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
ben
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q,
0051
R,
0052
S
0053
T
0054
U
0055
V
0056
B
0057
X
0058
Y
0059
Z
005A
[
 
\
 
]
 
^
 
_
005F
6_
96
`
 
bir
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
saat
0068
ben
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
ağırlık
0077
x
0078
y
0079
z
007A
{
 
|
 
}
 
~
 
DEL
007F

  Mektup  Sayı  Noktalama  Sembol  Başka  Tanımsız

İlgili kodlama aileleri

Ulusal Değiştirme Karakter Seti

Milli Değiştirme Karakter Kümesi ( NRCS ) tarafından 1983 yılında tanıtılan 7 bit kodlamaların ailesidir DEC ile VT200 bilgisayar terminallerinin dizi. ASCII'nin benzer bir değişmez alt kümesine dayanan, değişmez $olarak tutmada farklılık gösteren, ancak değil _(çoğu NRCS varyantı 'yi muhafaza etse _ve dolayısıyla ISO 646 değişmez kümesine uysa da) ISO 646 ile yakından ilişkilidir . Çoğu NRCS varyantı, Hollanda varyantı dışında, bulundukları yerde ilgili ulusal ISO 646 varyantlarıyla yakından ilişkilidir .

Dünya Sistemi Teletekst

Avrupa telekomünikasyon standardı ETS 300 706, "Geliştirilmiş Teletekst şartname", Latin ve Kiril hem çeşitli ulusal varyantları ile Latin, Yunan, Kiril, Arapça ve İbranice kod setlerini tanımlar. Latin varyantlarında NRCS ve ISO 646 gibi, G0 kümesi olarak bilinen kodlama ailesi, ASCII'nin benzer bir değişmez alt kümesine dayanır, ancak $ne _değişmez ne de değişmez. NRCS'den farklı olarak, varyantlar genellikle ilgili ulusal ISO 646 varyantlarından önemli ölçüde farklıdır.

Varyant kodları ve açıklamaları

ISO 646 ulusal varyantları

ISO 646'nın bazı ulusal varyantları aşağıdaki gibidir:

kod ISO-IR ISO ESC Onaylandı Ulusal Standart Açıklama
CA 121 ESC 2/8 7/7 ISO 646 CSA Z243.4-1985-1 Kanada ( 1 numaralı alternatif, "î" ile)
( Fransızca , klasik) ( Kod sayfası 1020 )
CA2 122 ESC 2/8 7/8 ISO 646 CSA Z243.4-1985-2 Kanada (No. 2 alternatifi, "É" ile)
( Fransızca , yenilenmiş imla)
CN 57 ESC 2/8 5/4 ? GB/T 1988-80 Çin Halk Cumhuriyeti (Temel Latince)
151 ESC 2/8 2/1 4/1 ISO 646 NC 99-10:81 / NC NC00-10:81 Küba ( İspanyolca )
DANO 9-1 ESC 2/8 4/5 ÖBS ? NATS-DANO Norveç ve Danimarka (gazetecilik metinleri). Değişmeyen kod noktası 0x22, olarak görüntülenir «( IRV'de karşılaştırın "). Ancak yine de çift tırnak işareti olarak kabul edilir. SEFI'ye (NATS-SEFI) eşlik eder.
DE 21 ESC 2/8 4/11 ISO 646 DIN 66003 Almanya ( Almanca ) ( Kod sayfası 1011 , 20106 )
tamam - ? DS 2089 Danimarka ( Danca ) ( Kod sayfası 1017 )
ES 17 ESC 2/8 5/10 ECMA Olivetti İspanyolca (uluslararası) ( Kod sayfası 1023 )
ES2 85 ESC 2/8 6/8 ECMA IBM İspanya ( Bask , Kastilya , Katalanca , Galiçyaca ) ( Kod sayfası 1014 )
FI 10 ISO 646 SFS4017 Finlandiya (temel sürüm) ( Kod sayfası 1018 )
FR 69 ESC 2/8 6/6 ISO 646 AFNOR NF Z 62010-1982 Fransa ( Fransızca ) ( Kod sayfası 1010 )
FR1 25 ESC 2/8 5/2 ISO 646 AFNOR NF Z 62010-1973 Fransa (Nisan 1985'ten beri kullanılmamaktadır) ( Kod sayfası 1104 )
GB 4 ESC 2/8 4/1 ISO 646 BS 4730 Birleşik Krallık ( İngilizce ) ( Kod sayfası 1013 )
86 ESC 2/8 6/9 ISO 646 MSZ 7795/3 Macaristan ( Macarca )
IE 207 ? NSAI 433:1996 İrlanda ( İrlanda )
INV 170 ESC 2/8 2/1 4/2 ISO 646 ISO 646:1983 değişmez alt küme
(IRV) 2 ESC 2/8 4/0 ISO 646 ISO 646: 1973 Uluslararası Referans Versiyonu. 0x7E üst çizgi olarak (ISO-IR-002).
? ? ISO 646 ISO 646:1983 Uluslararası Referans Versiyonu. 0x7E yaklaşık işareti olarak ( Kod sayfası 1009 , 20105 ).
ISO 646:1991 Uluslararası Referans Sürümü, ABD varyantıyla eşleşir (aşağıya bakın).
NS ? ? ? İzlanda ( İzlanda )
O 15 ESC 2/8 5/9 ECMA UNI 0204-70 / Olivetti ? İtalyanca ( Kod sayfası 1012 )
JP 14 ESC 2/8 4/10 ISO 646 JIS C 6220:1969-ro Japonya ( Romaji ) ( Kod sayfası 895 ). İlgili Katakana ek seti ile 8 bitlik bir kod olarak da kullanılır .
JP-OCR-B 92 ESC 2/8 6/14 ISO 646 JIS C 6229-1984-b Japonya ( OCR -B)
KR - ? KS C 5636-1989 Güney Kore
MT - ? ? Malta ( Malta , İngilizce )
NL - ECMA IBM Hollanda ( Felemenkçe ) ( Kod sayfası 1019 )
NUMARA 60 ESC 2/8 6/0 ISO 646 NS 4551 sürüm 1 Norveç ( Kod sayfası 1016 )
NO2 61 ESC 2/8 6/1 ISO 646 NS 4551 sürüm 2 Norveç (Haziran 1987'den beri kullanılmamaktadır) ( Kod sayfası 20108 )
lütfen - BN-74/3101-01 Polonya (Lehçe, aksan işaretli 18 harfe sahiptir, ancak kod alanı nedenlerinden dolayı yalnızca 9 küçük harf normalleştirilmiştir.
PT 16 ESC 2/8 4/12 ECMA Olivetti Portekizce (uluslararası)
PT2 84 ESC 2/8 6/7 ECMA IBM Portekiz ( Portekizce , İspanyolca ) ( Kod sayfası 1015
GD 10 ESC 2/8 4/7 ISO 646 SEN 850200 Ek B, SIS 63 61 27 İsveç (temel İsveççe ) ( Kod sayfası 1018 , D47)
SE2 11 ESC 2/8 4/8 ISO 646 SEN 850200 Ek C, SIS 63 61 27 İsveç ( isimler için İsveççe genişletilmiş ) ( Kod sayfası 20107 , E47)
SEFI 8-1 ESC 2/8 4/3 ÖBS NATS-SEFI İsveç ve Finlandiya (gazetecilik metinleri). DANO'ya (NATS-DANO) eşlik eder.
T.61-7bit 102 ESC 2/8 7/5 ? İTÜ / CCITT T.61 Tavsiyesi Uluslararası ( Teleteks ). Ayrıca 8 bitlik bir kod olarak karşılık gelen ek setle birlikte kullanılır .
TW - ? CNS 5205-1996 Çin Cumhuriyeti ( Tayvan )
ABD / (IRV) 6 ESC 2/8 4/2 ISO 646 ANSI X3.4-1968 ve ISO 646:1983 (ayrıca ISO/IEC 646:1991'de IRV) Amerika Birleşik Devletleri ( ASCII , Kod sayfası 367 , 20127 )
YU 141 ESC 2/8 7/10 ISO 646 JUS I.B1.002 ( YUSCII ) eski Yugoslavya ( Hırvatça , Slovence , Sırpça , Boşnakça )
INIS 49 ESC 2/8 5/7 IAEA INIS ISO 646 IRV alt kümesi

Ulusal türevler

ISO 646'ya dayanan ancak değişmez setini kesin olarak takip etmeyen bazı ulusal karakter setleri de mevcuttur (ayrıca bkz. § Diğer alfabeler için Türevler ):

Karakter seti ISO-IR ISO ESC Onaylandı Ulusal Standart Açıklama
BS_viewdata 47 ESC 2/8 5/6 İngiliz Postanesi Görüntüleme verileri ve Teletekst . Hedef donanımda görüntülenemeyen, normalde değişmeyen alt çizgi (_) yerine kullanılan görüntüleme verisi karesi (⌗). Bu aslında Microsoft'un WST_Engl kodlamasıdır.
GR / yunan7 88 ESC 2/8 6/10 ? HOS ELOT 927 Yunanistan (Kasım 1986'da çekildi). Roma harfleri yerine Yunan harflerini kullanır ve bu nedenle kesinlikle bir ISO 646 varyantı değildir.
yunan7-yaşlı 18 ESC 2/8 5/11 ECMA ? Yunan grafik seti. Konsept olarak yunan7'ye benzer , ancak farklı bir harf eşlemesi kullanır. Ayrıca, büyük harf küçük harften sonra gelir.
Latince-Yunanca 19 ESC 2/8 5/12 ECMA ? Latin-Yunanca birleşik grafikler (yalnızca büyük harfler). Şöyledir greek7 eski ama Latin küçük harf üzerinde değişiklik yapılmadan Latin başkentlerini ve Yunan başkentlerini içerir.
Latin-Yunanca-1 27 ESC 2/8 5/5 ECMA Honeywell-Bull Latin-Yunanca karışık grafikler (yalnızca Yunan başkentleri). Yunan başkentlerini mümkün olduğunda Latin başkentleriyle görsel olarak birleştirir ve kalan Yunan başkentlerini ekler. Diğer Yunanca sürümlerin aksine, tüm Temel Latin harfleri bozulmadan kalır. Bununla birlikte, ulusal karakterlerin yanı sıra değişmez noktalama işaretlerini de değiştirir ve bu nedenle hala tam olarak bir ISO 646 varyantı değildir.
İsviçre - ECMA Olivetti İsviçre ( Fransızca , Almanca ) ( Kod sayfa 1021 ) Değişmez kod noktası 0x5F değiştirilir _için è. Bir mı Aralık NRCS yakından ISO 646 ile ilgili varyant, ancak tam ISO 646 uyumlu eşdeğer yoksundur.

Kontrol karakterleri

Yukarıda listelenen tüm varyantlar yalnızca grafik karakter kümeleridir ve aşağıdaki tabloda listelendiği gibi bir C0 kontrol karakter kümesiyle kullanılmalıdır :

ISO-IR ISO ESC Onaylandı Açıklama
1 ESC 2/1 4/0 ISO 646 ISO 646 kontrolleri ("ASCII kontrolleri")
7 ESC 2/1 4/1 ISO 646 İskandinav gazetesi (NATS) kontrolleri
26 ESC 2/1 4/3 ISO 646 IPTC kontrolleri

İlişkili ek karakter kümeleri

Aşağıdaki tablo, belirli ISO 646 türevleriyle aynı standart tarafından tanımlanan tamamlayıcı grafik karakter kümelerini listeler. Bunlar, kaydırma veya NATS süper kaydırma (single shift) gibi bir mekanizma kullanılarak veya sekizinci bitin mevcut olduğu ortamlarda ayarlanmasıyla seçilir :

ISO-IR ISO ESC Ulusal Standart Açıklama
8-2 ESC 2/8 4/4 NATS-SEFI-EKLE NATS-SEFI ile kullanılan ek kod.
9-2 ESC 2/8 4/6 NATS-DANO-EKLE NATS-DANO ile kullanılan ek kod.
13 ESC 2/8 4/9 JIS C 6220:1969-jp Katakana , ISO-646-JP ile ek kod olarak kullanılır.
103 ESC 2/8 7/6 ITU / CCITT T.61 Tavsiyesi, Ek Set T.61 ile kullanılan ek kod.

Varyant karşılaştırma tablosu

Bu varyantlardan bazıları için değişikliklerin özellikleri aşağıdaki tabloda verilmiştir. Listelenen tüm varyantlarda (yani ASCII ile aynı kalan) değişmeyen karakter atamaları gösterilmez.

Karşılaştırma kolaylığı için ayrıntılı varyantlar, ISO 646'nın ulusal varyantlarını , DEC'nin VT200 terminallerinde kullanılan yakından ilişkili Ulusal Değiştirme Karakter Seti (NRCS) serisini , ETS 300 706'da tanımlanan ilgili Avrupa Dünya Sistemi Teletekst kodlama serisini ve yakından ilişkili birkaç diğerini içerir. ISO 646'ya dayalı kodlamalar. Bireysel kod çizelgeleri, ikinci sütundan bağlantılıdır. Beyaz olmayan arka plana sahip hücreler, US-ASCII'den (ayrıca ISO/IEC 10646 ve Unicode'un Temel Latince alt kümesi) farklılıkları vurgular .

Bir geri silme C0 kontrolü ile önce veya takip edildiğinde, birkaç karakter karakterleri birleştirmek için kullanılabilir . Bu, IRV, GB, FR1, CA ve CA2 kod çizelgelerinde tasdik edilmiştir; bu şemalarda, öncesinde veya sonrasında çift taraflı , akut aksan , cedilla ve inceltme ( tırnak işaretleri , virgül ve yukarı ok başı yerine) gibi davranacağını not eder. bir backspace tarafından. Yaklaşık işareti (~) benzer şekilde bir aksan (˜) olarak tanıtıldı . Bu kodlama yöntemi, daktilo / kökenli Tele- geri alma kullanımı glif overstamp olur ve kabul edilebilir zaman dönemi kaldırıldı . "',^

Daha sonra, daha geniş karakter kümeleri daha fazla kabul gördüğünde , ISO 8859 , satıcıya özel karakter kümeleri ve nihayetinde Unicode , bu varyantların çoğunu kodlamak için tercih edilen yöntemler haline geldi.

Varyant Kodu Kod Tablosu Her ISO 646 / NRCS uyumlu veya türetilmiş karakter kümesi için karakterler
ABD / IRV (1991) ISO-IR-006 ! " # $ & : ? @ [ \ ] ^ _ ` { | } ~
Eski Uluslararası Referans Sürümleri
IRV (1973) ISO-IR-002 ! " # ¤ & : ? @ [ \ ] ^ _ ` { | }
IRV (1983) CP01009 ! " # ¤ & : ? @ [ \ ] ^ _ ` { | } ~
Değişmez ve diğer IRV alt kümeleri
INV ISO-IR-170 ! "     & : ?           _          
INV ( NRCS ) --- ! "   $ & : ?                      
INV ( Teletekst ) ETS WST ! "     & : ?                      
INIS Alt Kümesi ISO-IR-049 $ : [ ] |
T.61 ISO-IR-102 ! " # ¤ & : ? @ [   ]   _     |    
Doğu Asya
JP ISO-IR-014 ! " # $ & : ? @ [ ¥ ] ^ _ ` { | }
JP-OCR-B ISO-IR-092 ! " # $ & : ? @ [ ¥ ] ^ _   { | }  
KR (KS X 1003) ! " # $ & : ? @ [ ] ^ _ ` { | }
CN ISO-IR-057 ! " # ¥ & : ? @ [ \ ] ^ _ ` { | }
TW (CNS 5205) ! " # $ & : ? @ [ \ ] ^ _ ` { | }
İngiliz ve İrlandalı
GB ISO-IR-004 ! " £ $ & : ? @ [ \ ] ^ _ ` { | }
GB ( NRCS ) CP01101 ! " £ $ & : ? @ [ \ ] ^ _ ` { | } ~
Veriyi gör ISO-IR-047 ! " £ $ & : ? @ ½ - ¼ ¾ ÷
IE ISO-IR-207 ! " £ $ & : ? Ö ben BEN Ú A _ Ö é ben ü a
Italofon veya Frankofon
O ISO-IR-015 ! " £ $ & : ? § ° C é ^ _ ü a Ö è ben
BT ( Teletekst ) ETS WST ! " £ $ & : ? é ° C ü a Ö è ben
FR (1983) ISO-IR-069 ! " £ $ & : ? a ° C § ^ _ µ é ü è ¨
FR (1973) ISO-IR-025 ! " £ $ & : ? a ° C § ^ _ ` é ü è ¨
FR Teletekst ETS WST ! " é ben & : ? a ë ê ü ben è a Ö u C
CA ISO-IR-121 ! " # $ & : ? a a C ê ben _ Ö é ü è u
CA2 ISO-IR-122 ! " # $ & : ? a a C ê ben _ Ö é ü è u
Frankofon-Almanca
swi ( NRCS ) CP01021 ! " ü $ & : ? a é C ê ben è Ö a Ö ü u
almancafon
DE ISO-IR-021 ! " # $ & : ? § A Ö Ü ^ _ ` a Ö ü ß
İskandinav (Doğu) ve Baltık
FI / GD ISO-IR-010 ! " # ¤ & : ? @ A Ö A ^ _ ` a Ö a
SE2 ISO-IR-011 ! " # ¤ & : ? ben A Ö A Ü _ é a Ö a ü
SE ( NRCS ) CP01106 ! " # $ & : ? ben A Ö A Ü _ é a Ö a ü
FI ( NRCS ) CP01103 ! " # $ & : ? @ A Ö A Ü _ é a Ö a ü
SEFI (NATS) ISO-IR-008-1 ! " # $ & : ?   A Ö A _ a Ö a -
EE ( Teletekst ) ETS WST ! " # Ö & : ? S A Ö Ž Ü Ö s a Ö ž ü
AG / LT ( Teletekst ) ETS WST ! " # $ & : ? S ė ę Ž C ü s a ų ž ben
İskandinav (Batı)
tamam CP01017 ! " # ¤ & : ? @ Æ Ö A Ü _ ` æ Ö a ü
DK/HAYIR ( NRCS ) CP01105 ! " # $ & : ? A Æ Ö A Ü _ a æ Ö a ü
DK/NO-alt ( NRCS ) CP01107 ! " # $ & : ? @ Æ Ö A ^ _ ` æ Ö a ~
NUMARA ISO-IR-060 ! " # $ & : ? @ Æ Ö A ^ _ ` æ Ö a
NO2 ISO-IR-061 ! " § $ & : ? @ Æ Ö A ^ _ ` æ Ö a |
DANO (NATS) ISO-IR-009-1 ! « » $ & : ?   Æ Ö A _ æ Ö a -
NS ! " # ¤ & : ? NS NS \ Æ Ö _ NS NS | æ Ö
Hispanofon
ES ISO-IR-017 ! " £ $ & : ? § ¡ N ¿ ^ _ ` ° n C ~
ES2 ISO-IR-085 ! " # $ & : ? · ¡ N C ¿ _ ` ' n C ¨
ISO-IR-151 ! " # ¤ & : ? @ ¡ N ] ¿ _ ` ' n [ ¨
Hispanofon-Lusofon
ES/PT Teletekst ETS WST ! " C $ & : ? ¡ a é ben Ö ü ¿ ü n è a
lusofon
PT ISO-IR-016 ! " # $ & : ? § A C Ö ^ _ ` a C Ö °
PT2 ISO-IR-084 ! " # $ & : ? ' A C Ö ^ _ ` a C Ö ~
PT ( NRCS ) --- ! " # $ & : ? @ A C Ö ^ _ ` a C Ö ~
Yunan
Latin-GR karışık ISO-IR-027 Ξ " Γ ¤ & Ψ Π Δ Ω Θ Φ Λ Σ ` { | }
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 ve ISO-IR-019, Roma harflerini Yunan harfleriyle değiştirir ve ayrı bir tabloda detaylandırılmıştır .
Slav (Latin alfabesi)
YU ISO-IR-141 ! " # $ & : ? Ž S Đ C C _ ž s đ C C
YU Teletekst ETS WST ! " # Ë & : ? C C Ž Đ S ë C C ž đ s
YU-alt Teletekst ETS WST ! " # $ & : ? C C Ž Đ S ë C C ž đ s
CS/CZ/SK ( Teletekst ) ETS WST ! " # ů & : ? C T ž ı ben r é a ě ü s
PL BN-74/3101-01 ! " # & : ? ę ź \ n s _ a Ö ł ż C
PL Teletekst ETS WST ! " # n & : ? a Ƶ S Ł C Ö ę ż s ł ź
Kiril alfabesi için uyarlamalar, Roma harflerinin yerini alır ve ayrı bir çizelgede detaylandırılır.
Başka
NL CP01019 ! " # $ & : ? @ [ \ ] ^ _ ` { | }
NL NRCS CP01102 ! " £ $ & : ? ¾ ij ½ | ^ _ ` ¨ ƒ ¼ '
ISO-IR-086 ! " # ¤ & : ? A ben Ö Ü ^ _ a é Ö ü ˝
MT ! " # $ & : ? @ G ż H ^ _ C G Ż H C
RO ( Teletekst ) ETS WST ! " # ¤ & : ? T A S A BEN ben T a s a ben
TR ( Teletekst ) ETS WST ! " TL G & : ? BEN S Ö C Ü G ben s Ö C ü

Diğer alfabeler için türevler

Latin alfabesi dışındaki alfabeler için bazı 7 bitlik karakter kümeleri, ISO 646 standardından türetilmiştir: bunlar, değişmez kod noktalarını takip etmemeleri nedeniyle (genellikle en az bir durumun harflerini değiştirir), farklı desteği desteklemeleri nedeniyle ISO 646'yı oluşturmazlar. ulusal kod noktaları kümesinin yetersiz kodlama alanı sağladığı alfabeler. Örnekler şunları içerir:

  • 7-bit Türkmen (ISO-IR-230).
  • 7 bit Yunanca.
    • In elot 927 (ISO-IR-088), Yunan alfabesi Latin küçük harf üstüne, pozisyonları 0x61-0x71 ve 0x73-0x79 için (nihai-sigma hariç) alfabetik sıraya göre eşleştirilir.
    • ISO-IR-018, Yunan alfabesini farklı bir şema kullanarak (alfabetik sırayla değil, ancak mümkün olduğunda Yunan harflerini bir anlamda Roma harfleriyle eşleştirmeye çalışarak) her iki harf durumu üzerinde eşler ve ISO-IR-019, Yunan alfabesini eşler. ISO-IR-018 ile aynı şemayı kullanarak Latin küçük harflerinin üzerine büyük harfli alfabe.
    • Symbol yazı tipi karakter kodlamasının alt yarısı, her iki durumdaki Yunan harflerini ASCII Roman harfleri üzerinde eşleştirmek için kendi şemasını kullanır, ayrıca Yunan harflerini bir anlamda karşılık gelen Roman harfleri üzerinde eşleştirmeye çalışır, ancak bu konuda farklı kararlar verir (bkz. Aşağıdaki grafik). Ayrıca, 0x22 ve 0x27 değişmez kod noktalarını ve beş ulusal kod noktasını matematiksel sembollerle değiştirir. Yunan düzyazısının dizgisinde kullanılması amaçlanmamasına rağmen, bazen bu amaç için kullanılır.
    • ISO-IR-027 (aşağıda değil, yukarıdaki tabloda ayrıntılı olarak verilmiştir) Latin alfabesini değiştirmeden içerir, ancak Latin alfabesi homoglifleriyle temsil edilemeyen bazı Yunan büyük harflerini ekler ; açıkça ISO 646'ya dayalı olsa da, bunlardan bazıları ISO 646'da (0x21, 0x3A ve 0x3F) değişmez olan kod noktalarına eşlenir ve bu nedenle gerçek bir ISO 646 varyantı değildir.
    • Dünya Sistemi Teletekst Yunan kullanımlar için kodlama henüz özellikle aksan ile birkaç harf içeren, her iki durumda ASCII harfler üzerinde alfabetik Yunan harfleri haritalama başka şeması.
  • 7-bit Kiril
    • Rusça için kullanılan KOI-7 veya Kısa KOI . Kiril karakterleri, Latin küçük harflerinin üstünde 0x60–0x7E konumlarına eşlenir ve mümkün olduğunda homolog harflerle eşleşir (burada в, w ile eşlenir, v ile eşlenmez). Yerini KOI-8 varyantları.
    • SRPSCII ve MAKSCII , sırasıyla Sırp ve Makedonca için kullanılan YUSCII'nin Kiril varyantları (Latin varyantı yukarıdaki tabloda YU/ISO-IR-141'dir) . Büyük ölçüde YUSCII (Sırp aşağıdaki Latin varyant homolog digraphia kuralları hariç), hakkı © (lj), Њ (nj), Џ (DZ) ile ѕ (z), içinde digraphs için tekabül Latince-komut yazım ve eşleştirilir Sırpça veya Makedonca kullanılmayan harfler üzerinde (q, w, x, y).
    • İçin G0 setleri Dünya Sistemi Teletekst bazı değişikliklerle KOI-7'ye benzer Rusça / Bulgar ve Ukraynalı kullanım G0 setleri için kodlamalardan. Sırp Kiril alfabesi için karşılık gelen G0 seti , önemli ölçüde farklı YUSCII'nin aksine, Latin alfabesi Sırp-Hırvatça ve Slovence için Teletekst kodlamasına dayalı bir şema kullanır .
  • 7 bit İbranice, SI 960 . İbrani alfabesi küçük Latin harfleri (ve Aleph için aksan) üstüne, 0x60-0x7A pozisyonlara eşleştirilir. 7 bit İbranice her zaman görsel sırada saklandı. Yüksek bit setiyle, yani 0xE0–0xFA'daki İbranice harflerle bu eşleme, ISO 8859-8'dir . İbranice için Dünya Sistemi Teletekst kodlaması aynı harf eşlemelerini kullanır, ancak temel kodlaması olarak BS_Viewdata'yı kullanır (oysa SI 960 US-ASCII kullanır) ve 0x7B'de bir şekel işareti içerir .
  • 7 bit Arapça, ASMO 449 (ISO-IR-089). Arap alfabesi hem büyük harf üstüne, pozisyonları 0x41-0x5A ve 0x60-0x6A eşleştirilmiş ve Latin harfleri küçük harfe edilir.

Bu kodlamaların bazılarının bir karşılaştırması aşağıdadır. Vakaların farklı harflerle eşlendiği durumlar dışında yalnızca bir vaka gösterilir. Bu gibi durumlarda, en küçük kodlu eşleme ilk önce gösterilir. Bazı harfler için olası transkripsiyonlar verilmiştir; bu atlandığında, harfin, haritalandığı Roma harfine tekabül ettiği düşünülebilir.

İngilizce
( ASCII )
Kiril alfabeleri Yunan alfabesi İbranice
yarı-transliteratif Doğal olarak sıralandı
Rusça
( KOI-7 )
Rusça,
Bulgarca
( WST
RU/BG
)
Ukraynaca
( WST UKR )
Sırpça
( SRPSCII )
Makedonca
( MAKSCII )
Sırpça,
Makedonca
( WST SRP )
Yunanca
( Sembol )
Yunanca
(IR-18)
Yunanca
( ELOT 927 )
Yunanca
( WST EL )
İbranice
( SI 960 )
@
`
Ю (ju/yu) Ю (ju/yu) Ю (ju/yu) Ж (z) Ж (z) Ч (ç)
'
'
@
`
ΐ
ΰ
א (ʾ/ʔ)
A bir А (a/á) bir bir bir bir Α Α Α Α ב (b)
B Б Б Б Б Б Б Β Β Β Β ג (g)
C Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Ц (c/ts) Χ (ch/kh) Ψ (ps) Γ (g) Γ (g) ד (d)
NS Ä Ä Ä Ä Ä Ä Δ Δ Δ Δ ה (h)
E Е Е Е (e) Е (e) Е (e) Е (e) Ε Ε Ε Ε ו (w)
F Ф Ф Ф Ф Ф Ф Φ (ph/f) Φ (ph/f) Ζ (z) Ζ (z) ז (z)
G Г Г Г Г Г Γ Γ Γ Η (ē) Η (ē) ח (ch/kh)
H Х (saat/saat/saat) Х (saat/saat/saat) Х (saat/saat/saat) Х (saat/saat/saat) Х (saat/saat/saat) Х (saat/saat/saat) Η (ē) Η (ē) Θ (th) Θ (th) ט (tt)
ben И И И (y) И И И Ι Ι Ι Ι י (j/y)
J Й (j/y) Й (j/y) Й (j/y) Ј (j/y) Ј (j/y) Ј (j/y) ϑ (th)
ϕ (ph/f)
Ξ (x/ks)   Κ (k) ך (k final)
K К К К К К К Κ Κ Κ Λ (l) כ
L Л Л Л Л Л Л Λ Λ Λ Μ (m) ל
m М М М М М М Μ Μ Μ Ν (n) ם (m son)
n Н Н Н Н Н Н Ν Ν Ν Ξ (x/ks) מ (m)
Ö o o o o o o Ο Ο Ξ (x/ks) Ο ן (n son)
P П П П П П П Π Π Ο (o) Π נ (n)
Q ß (ya/ya) ß (ya/ya) ß (ya/ya) Љ (lj/ly) Љ (lj/ly) Ќ (Ḱ/kj) Θ (th) ͺ ( ben ) Π (p) Ρ (r) ס (ler)
r Р Р Р Р Р Р Ρ Ρ Ρ ʹ
ς (s son)
ע (ʽ/ŋ)
S С С С С С С Σ Σ Σ Σ ף (p son)
T Т Т Т Т Т Т Τ Τ Τ Τ פ (p)
sen У У У У У У Υ Θ (th) Υ Υ ץ (ṣ/ts final)
V Ж (z) Ж (z) Ж (z) В В В ς (s son)
ϖ (p)
Ω (o) Φ (s/s) Φ (s/s) צ (ṣ/ts)
W В (v) В (v) В (v) Њ (nj/ny/ñ) Њ (nj/ny/ñ) Ѓ (ǵ/gj) Ω (o) ς (s son) ς (s son) Χ (ch/kh) ק (q)
x Ь (') Ь (') Ь (') Џ (dz) Џ (dz) Љ (lj/ly) Ξ Χ (ch/kh) Χ (ch/kh) Ψ (ps) ר (r)
Y Ы (y/ı) Ъ (″/ǎ/ŭ) І (i) Ѕ (dz) Ѕ (dz) Њ (nj/ny/ñ) Ψ (ps) Υ (u) Ψ (ps) Ω (o) ש (š/sh)
Z З З З З З З Ζ Ζ Ω (o) Ϊ ת (t)
[
{
Ш (š/sh) Ш (š/sh) Ш (š/sh) Ш (š/sh) Ш (š/sh) Ћ (ć) [
{
᾿̃
῾̃
[
{
Ϋ [
{
\
|
Э (e) Э (e) Є Ђ (đ/dj) Ѓ (ǵ/gj) Ж (z)
|

(H)
\
|
a'ya ordan da
ό
\
|
]
}
Щ (šč) Щ (šč) Щ (šč) Ћ (ć) Ќ (Ḱ/kj) Ђ (đ/dj) ]
}
᾿'
῾'
]
}
έ
ύ
]
}
^
~
Ч (ç) Ч (ç) Ч (ç) Ч (ç) Ч (ç) Ш (š/sh)
~
~
¨
^
r |
Ê değerinde
^
_ Ъ (″) Ы (y/ı) Ї (ji/yi) _ _ Џ (dz) _ _ _ ί _

Ayrıca bakınız

Dipnotlar

Referanslar

daha fazla okuma

Dış bağlantılar