VISCII - VISCII

VISCII
MIME / IANA VISCII
Diller) Vietnamca , İngilizce
Tarafından yaratıldı Viet-Std Grubu
Tanımlar RFC  1456
sınıflandırma 8 bit SBCS
Dayalı ASCII

VISCII bir gayri resmi olarak tanımlanmış modifiye olan ASCII kodlama karakter için bilgisayarlarla Vietnam dili kullanarak . Benzer şekilde adlandırılan resmi olarak kayıtlı VSCII kodlaması ile karıştırılmamalıdır . VISCII, ASCII'nin 95 yazdırılabilir karakterini değiştirilmeden tutar, ancak 33 kontrol karakterinden 6'sını yazdırılabilir karakterlerle değiştirir. 128 önceden oluşturulmuş karakter ekler . Unicode ve Windows-1258 kod sayfası artık neredeyse tüm Vietnam bilgisayar verileri için kullanılmaktadır, ancak eski VSCII ve VISCII dosyalarının dönüştürülmesi gerekebilir.

Tarih ve adlandırma

VISCII, Christopher Cuong T. Nguyen, Cuong M. Bui ve Hoc D. Ngo liderliğindeki Vietnam Standardizasyon Çalışma Grubu (Viet-Std Grubu) tarafından 1992 yılında Silikon Vadisi , Kaliforniya'da Unicode konsorsiyumu ile çalışırken tasarlanmıştır. Unicode standardında önceden oluşturulmuş Vietnamca karakterleri içerir. VISCII ile birlikte VIQR , Eylül 1992'de ilk iki dilli bir raporda yayımlandı, hangi o "Bilgi Değişimi İçin Vietnam Standart Kodu" olarak adlandırılan edildi. Rapor, Vietnam'da bilgisayar kullanımında bir çoğalmaya ve yurtdışındaki Vietnamlılar arasında artan bilgisayar tabanlı iletişim hacmine, mevcut uygulamaların birbirleriyle birlikte çalışamayan satıcıya özel kodlamalar kullandığına ve bu nedenle satıcılar arasında standardizasyonun gerekli olduğuna dikkat çekti . Birleştirilmiş ve önceden oluşturulmuş Vietnamca'nın Unicode 1.0'a başarılı bir şekilde dahil edilmesi, 8-bit VISCII ve 7-bit VIQR'nin geliştirilmesinden öğrenilen derslerin sonucuydu.

Ertesi yıl, 1993'te Vietnam , bilgi teknolojisi alanındaki ilk ulusal standardı olan TCVN 5712'yi benimsedi . Bu tanımlanmış bir karakter adında kodlayan VSCII tarafından geliştirilmiş olan, TCVN Bilgi Teknolojisi Teknik Komitesi (TCVN / TC1) ve "Bilgi Değişimi İçin Vietnam Standart Code" için ayakta onun adıyla. VSCII, daha önce yayınlanmış VISCII ile uyumlu değildir ve başka bir şekilde ilgisizdir. VISCII'den farklı olarak VSCII, ulusal bir standart anlamında bir "Vietnam Standardı"dır .

VISCII ve VIQR bilgilendirme statülü olarak kabul edildi RFC  1456 Viet-Std grubuyla ilişkilendirilen ve Mayıs 1993 tarihli itibariyle IETF RFC, RFC olduğu onları üzerinde denizaşırı Vietnam konuşmacılar tarafından kullanılan "sözleşmeler" olarak 1456 notları Usenet , ve "hiçbir standart düzeyi belirtmez". Buna rağmen, VISCII'ye "Vietnamca Bilgi Değişimi Standart Kodu" (VSCII tarafından alınan aynı ad) demeye devam ediyor. Etiketler VISCIIve csVISCIIkayıtlı IANA'da RFC 1456. atfen, VISCII için (Öte yandan, Tcvn 5712 / VSCII için hiçbir resmi IANA etiket yok olsa edilir x-viet-tcvn5712önceden tarafından desteklenmiştir Mozilla Firefox .)

Tasarım

Geleneksel bir genişletilmiş ASCII karakter seti, ASCII setinden ve en fazla 128 karakterden oluşur. Vietnamca, altı fazla olan 134 ek harf-aksan kombinasyonu gerektirir. Bu sorunu çözmenin temel olarak dört farklı yolu vardır (büyük harfler için VSCII-3'te olduğu gibi düşük ton işareti desteği vardır ):

  1. Değişken genişlikli kodlamayı kullanın ( UTF-8 'de olduğu gibi )
  2. Dahil ayırıcı işaretler birleştirerek sesi işaretleri (aynı do VSCII-2 ve Windows 1258 ) veya genel aksan işaretleri için (aynı do ANSEL ve VNI )
  3. Bazı ASCII noktalama işaretlerini, tercihen ISO 646'da değişmez olmayan noktalama işaretlerini değiştirin ( DOS için VNI'de olduğu gibi )
  4. Temel ASCII kontrol karakterlerinden en az altısını değiştirin ( VPS ve VSCII-1 gibi )

VISCII, en az sorunlu altısını (örneğin, bir uygulama tarafından tanınma ve özel olarak harekete geçme olasılığı en düşük olan) C0 kontrol kodlarından (STX, ENQ, ACK, DC4, EM ve RS) altısını değiştirerek son seçeneğe gitti . en az kullanılan büyük harf-aksan kombinasyonları. Bu seçenek, VISCII metnini işlerken bu kontrol kodlarını kullanan programların arızalanmasına neden olsa da, diğer iki seçeneğe göre daha az karmaşıklık yaratır (tasarımcılar, 8 bitlik olmayan temiz iletimin pratikte diğer iki seçeneğe göre daha zor olduğunun tespit edildiğini belirtiyorlar) . kontrol karakteri yeniden kullanımı). Bununla birlikte, kullanılan her iki C0 veya C1 kontrol karakterlerinin yerleri ve kodları olmayan kıran uzay içinde ISO-8859-1 , Mac OS Roma ve OEM ABD kasten küçük codepoints yararlanarak niyetiyle, büyük harflere ayrıldı bu kodlar için grafik karakterler görüntülenemiyorsa, tamamı büyük bir yazı tipiyle kullanışlı bir geçici çözüm.

Bununla birlikte, aksanlı harfler için tüm genişletilmiş kod noktalarını kullanmak, diğer çoğu genişletilmiş ASCII karakter kümesi gibi, yararlı semboller, üst simgeli sayılar, eğri tırnaklar, uygun tireler vb. eklemek için yer bırakmadı.

Karakterlerin konumu , iki kod sayfası arasında ortak karakterlerin bulunduğu (büyük harf Õ istisna olarak belirtilmiştir) ISO-8859-1'e göredir ve kullanıcı dostu olma endişeleriyle motive edilir.

Destek

VISCII, MS-DOS ve Windows, Unix ve Macintosh için çeşitli VISCII uyumlu yazılım paketleri, kitaplıklar ve yazı tipleri yayınlayan Kaliforniya'daki TriChlor Yazılım Grubu tarafından kısmen desteklenmektedir . VISCII uyumlu yazılım birçok FTP sitesinde mevcuttur .

VISCII, geçmişte Mozilla Thunderbird tarafından giden e-posta için bir kodlama olarak sunuldu . Ayrıca, Christopher Cuong T. Nguyen tarafından oluşturulan ve daha sonra Hoc D. Ngo ve diğerleri tarafından çeşitli Windows sürümleri aracılığıyla yükseltilen Windows Vietnamca klavye yazılımı WinVNKey tarafından desteklendi.

VISCII çoğunlukla denizaşırı Vietnamca konuşanlar tarafından kullanıldı, VSCII (TCVN) kuzey Vietnam'da daha popüler ve VNI güney Vietnam'da daha popüler.

Karakter seti

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _NS _E _F
0_
0
SIFIR
0000
SOH
0001

1EB2
ETX
0003
EOT
0004
A
1EB4

1EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013

1EF6
NAK
0015
SYN
0016
ETB
0017
CAN
0018

1EF8
ALT
001A
ESC
001B
FS
001C
GS
001D

1EF4
ABD
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
0024 $
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
bir
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
ben
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q,
0051
R,
0052
S
0053
T
0054
U
0055
V
0056
B
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
bir
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
saat
0068
ben
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
ağırlık
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1EBC

1EB8

1EBE

1EC0

1EC2

1EC4

1EC6

1ED0
9_
144

1ED2

1ED4

1ED6

1ED8

1EE2

1EDA

1EDC

1EDE

1ECA

1ECE

1ECC

1EC8

1EE6
Ũ
0168

1EE4

1EF2
A_
160
o
00D5

1EAF

1EB1

1EB7

1EA5

1EA7

1EA9
ậ 1
ADET

1EBD

1EB9
ế
1EBF

1EC1

1EC3

1EC5

1EC7

1ED1
B_
176

1ED3

1ED5

1ED7

1EE0
Ç
01A0

1ED9

1EDD
Ç
1EDF

1ECB

1EF0

1EE8

1AEA

1EEC
ơ
01A1

1EDB
Ư
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3

1EA2
ü
0102

1EB3

1EB5
È
00C8
É
00C9
Ê
00CA

1EBA
Ì
00CC
Í
00CD
Ĩ
0128

1EF3
D_
208
©
0110

1EE9
Ò
00D2
Ó
00D3
Ô
00D4

1EA1

1EF7

1EEB

1EED
Ù
00D9
Ú
00DA

1EF9

1EF5
İ
00DD
Ç
1EE1
ư
01B0
E_
224
à
00E0
ve
00E1
â
00E2
ã
00E3

1EA3
ă
0103

1EEF
A
1EAB
è
00E8
é
00E9
ê
00EA

1EBB
ì
00EC
ve
00ED
ĩ
0129

1EC9
F_
240
đ
0111

1EF1
o
00F2
o
00F3
ô
00F4
õ
00F5

1ECF

1ECD

1EE5
ù
00F9
ú
00FA
ũ
0169

1EE7
ı
00FD

1EE3

1EEE

  Mektup  Sayı  Noktalama  Sembol  Başka  Tanımsız

ISO-8859-1'den farklılıklar gölgeli olarak gösterilmiştir.

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar