ASCII - ASCII


Vikipedi, özgür ansiklopedi

ASCII
ASCII infobox.svg
ASCII (1967 veya sonrası)
MIME / IANA us-ascii
Alias ​​(es) ASCII
Duujjil) ingilizce
sınıflandırma ISO 646 serisi
Uzantıları
Öncesinde ITA 2 , FIELDATA
tarafından başarıldı ISO 8859 , Unicode
Diğer ilgili kodlama (lar) PETSCII

ASCII ( / æ s k i /  ( dinlemek ) Bu ses hakkında ASS -kee dan kısaltılır), Bilgi Değişimi İçin Amerikan Standart Kodu , bir olan karakter kodlaması elektronik iletişim için standart. ASCII kodları bilgisayarlar metni temsil telekomünikasyon ekipmanı ve diğer cihazları. Onlar pek çok ek karakterleri desteklemeyen rağmen çoğu modern bir karakter kodlama şemaları, ASCII dayanmaktadır.

ASCII kodlama sistemi için geleneksel adıdır; Internet Assigned Numbers Authority (IANA) güncellendi adı tercih ABD-ASCII bu sistem var kullanımda ağırlıklı yazım semboller üzerinde ABD'de geliştirilen ve dayandığını açıklık getirmektedir.

ASCII biridir IEEE kilometre taşları .

bir daha erken 1972 yazıcı kılavuzu ASCII tablosu (b1 en önemsiz bit).

genel bakış

ASCII den geliştirilmiştir telgraf kodu . İlk ticari kullanımı yedi gibiydi biraz teleprinter Bell veri hizmetleri tarafından teşvik kod. ASCII standardına Çalışma ilk toplantısı ile, 6 Ekim 1960 tarihinde başlayan Amerikan Standartlar Birliği 'nin (ASA) (şimdi Amerikan Ulusal Standartlar Enstitüsü veya ANSI) X3.2 alt komite. Standardın ilk baskısı 1963 yılında yayımlandı, 1967 döneminde ciddi bir revizyon yapıldı ve daha önce telgraf kodları ile karşılaştırıldığında 1986 sırasında en son güncellemeyi deneyimli, önerilen Bell kodu ve ASCII hem daha uygun sıralamaya (yani alphabetization için emredildi ) listeleri ve tele yazıcılar dışındaki cihazlar için eklenen özelliklerin.

Başlangıçta dayanan İngiliz alfabesi , ASCII 128 Belirtilen kodlar karakterleri yukarıda ASCII grafikte gösterildiği gibi yedi bitlik tamsayılar içine. Doksan beş kodlanmış karakter yazdırılabilir: Bu rakam içerir 0 ile 9 , küçük harf bir için z , büyük harfler A için Z ve noktalama sembolleri . Buna ek olarak, orijinal ASCII spesifikasyonu 33 basılamayan dahil kontrol kodları ile kökenli Teletype makineleri ; Birkaç hala yaygın gibi kullanılmasına rağmen bunların çoğu, şimdi kullanılmıyor satırbaşı , satır besleme ve sekme kodları.

Örneğin, küçük i ASCII kodlamasında temsil edilen ikili 1101001 = onaltılı 69 ( i dokuzuncu harf olduğu) = ondalık 105.

Tarihçe

ASCII (1963). Kontrol resimler eşdeğer kontrollerin bulunduğu yerde gösterilen veya gri bir nokta aksi edilir.

Bilgi Değişimi İçin Amerikan Standart Kodu (ASCII) bir komitenin gözetiminde geliştirilen Amerikan Standartlar Birliği kendi X3.2 (daha sonra X3L2) alt komitesi ve daha sonra o alt komitesinin X3 tarafından, X3 komite denilen (ASA),. 2.4 çalışma grubu (şu anda INCITS ). ASA oldu Amerika Standartları Enstitüsü ABD'yi (USASI) ve sonuçta Amerikan Ulusal Standartlar Enstitüsü (ANSI).

Özel karakterler ve doldurulan denetim kodları diğer sayesinde, ASCII gelecek standardizasyon için ayrılmış herhangi atanan anlamsız 28 kod konumlarını, ve bir atanmamış kontrol kodunu bırakarak ASA X3.4-1963 olarak yayınlandı. Daha kontrol karakterleri ziyade küçük harf alfabesi olması gerekip gerekmediğini anda bazı tartışmalar vardı. Yeni Telgraf Alfabesi ile ilgili CCITT Çalışma Grubu küçük harf karakterleri atamak için önerilen Mayıs 1963'te sırasında: kararsızlık uzun sürmedi sopalarla 6 ve 7 ve Standardizasyon International Organization for 97 SC 2 Ekim sırasında oy TC onun taslak standardına içine değişikliğini dahil etmek . X3.2.4 görev grubu da May 1963 toplantısında ASCII Değişikliğin onayını oy kullandı. İçinde küçük harfler bulma çubukları karakterleri 6 ve 7 neden olmuştur basitleştirilmiş bir tek bit tarafından harflere biraz desende farklı olmasına harf duyarsız karakter eşleme ve klavyeler ve yazıcılar yapımını.

X3 komitesi diğer yeni karakterin (dahil olmak üzere diğer değişiklikler yapılmış mesnet ve dikey çubuk (RU uzaklaştırılmış) ve hareketli ya da diğer kaldırma (som başlığının (sol) başlangıç olmuştur) bir kontrol karakterleri adlandırma, karakter). ASCII sonradan nihayet USAŞ X3.4-1967 ardından USAŞ X3.4-1968, ANSI X3.4-1977 ve ANSI X3.4-1986 olarak güncellendi.

ASCII standardının Düzenlemeler:

  • ASA X3.4-1963
  • ASA X3.4-1965 (onaylanmış, ancak tarafından yine kullanılan yayınlanmadı IBM 2260 & 2265 Ekran İstasyonları ve IBM 2848 Ekran Kontrol)
  • USAŞ X3.4-1967
  • USAŞ X3.4-1968
  • ANSI X3.4-1977
  • ANSI X3.4-1986
  • ANSI X3.4-1986 (R1992)
  • ANSI X3.4-1986 (R1997)
  • ANSI INCITS 4-1986 (R2002)
  • ANSI INCITS 4-1986 (R2007)
  • ANSI INCITS 4-1986 (R2012)

X3.15 standardında, X3 komitesi ASCII (iletilecek nasıl ele en az önemli bit önce) ve delikli banda kaydedilmelidir nasıl. Onlar önerdi 9-track manyetik bant için standart ve bazı başa teşebbüs delikli kart formatları.

Tasarım özellikleri

Bit genişliği

X3.2 alt komite önceki dayalı ASCII tasarlanmış teleprinter kodlama sistemleri. Diğer gibi karakter kodlamaları , ASCII dijital bit desenleri ve arasında bir ilişkiyi belirten karakter sembolleri (yani grafemler ve kontrol karakterleri ). Bu izin verir dijital cihazlar tür yazılı dil olarak karakter odaklı bilgi birbirleri ile iletişim kurmak ve mağaza tamamlanması ve iletişim kurarlar. ASCII geliştirildi önce kullanımda kodlamalar 26 dahil alfabetik karakterler, 10 sayısal basamak ve 11-25 özel grafik sembolleri. Uyumlu tüm bu ve kontrol karakterleri dahil etmek Comité Consultatif Uluslararası telephonique et Télégraphique (CCITT) Uluslararası Telgraf Alfabe No: 2 (ITA2) 1924 standardı, FIELDATA (1956), ve erken EBCDIC (1963), 64'ten fazla kodlar vardı ASCII için gerekli.

ITA2 5 bitlik telgraf koduna göre sırayla vardı Émile Baudot 1870 yılında icat ve 1874 yılında patentini aldı.

Komitesi olasılığını tartışılan değiştirme (gibi işlev ITA2 fazla 64 kodları ile temsil izin verecek), altı-bitlik kod . Bir kaydırılmış kodunda, bazı karakter kodları aşağıdaki karakter kodları için seçenekler arasında seçimler belirler. Kompakt kodlama izin verir, fakat daha az güvenilirdir veri iletimi kaydırma kodunu iletmek bir hata genellikle okunamaz iletim uzun bir parçası yapar. Standartları komitesi kayması karşı karar ve böylece ASCII en az yedi bitlik kod gerektirdi.

Komite sekiz bit (çünkü sekiz bitlik bir kod olarak sekizli iki dört bitlik desenler ile etkin bir şekilde iki basamak kodlayan olanak sağlayacak) ikili-kodlanmış ondalık . Ancak, yedi yeterli ne zaman sekiz bit göndermek için tüm veri iletimini gerektirecektir. Komite veri iletimi ile ilişkili maliyetleri en aza indirmek için yedi bitlik kodu kullanmak oy kullandı. Zamanda delikli bant bir pozisyonda sekiz bit kayıt olabilir beri, aynı zamanda bir izin eşlik biti için hata kontrolü istenirse. Sekiz bitlik parite kullanmak vermedi (yerel veri türü olarak oktet) ile makineler, genellikle bir yazıcı 0'a sekizinci bitini ayarlamak denetimi, yüksek bit etkinleştirmek için kullanılmıştır Eğik baskı.

İç organizasyon

Kod kendini en kontrol kodları birlikteyken böylece desenli ve grafik kodlar tanımlama kolaylığı için, bir araya edildi. İlk iki sözde ASCII çubukları (32 pozisyonları) kontrol karakterleri için rezerve edilmiştir. "Boşluk" karakteri yapmak için grafik önce gelmek zorunda sıralama kolay, bu nedenle pozisyon 20 oldu altıgen ; Aynı nedenden dolayı, yaygın ayırıcı olarak kullanılan birçok özel işaretler rakamdan önce yerleştirildi. Komitesi desteklemek için önemli olduğuna karar verdi büyük 64 karakterlik alfabe ve içinde yapıldığı gibi o, grafik kodlar kullanılabilir bir 64 karakterlik kümesine kolayca düşürülebilir böylece desen ASCII seçti Aralık Sixbit kodu (1963). Küçük harf harf nedenle büyük harfle ıle aralanan değildi. Küçük harfler ve diğer grafikler için kullanılabilir seçenekleri tutmak için, özel ve sayısal kodlar harflerle önce düzenlenmiş edildi ve mektup A pozisyonu 41 yerleştirildi onaltılık gelen İngiliz standardı taslağını eşleşecek. Basamak 0-9 011 öneki, ancak geri kalan 4 bit olan dönüşüm yapmak, ikili olarak ilgili değerlere karşılık gelen ikili kodlanmış ondalık basit.

Alfanümerik olmayan karakterden çoğu daktilo üzerine kaydırılmış konuma karşılık gelmesi konumlandırılmış; önemli bir incelik bu dayandığını olmasıdır mekanik daktilolar, değil elektrikli daktilolar. Mekanik daktilo Remington No. 2 (1878), bir kaydırma anahtarı ile ilk daktilo tarafından belirlenen standart ve kaydırılmış değerleri takip 23456789-edildi "#$%_&'() - ihmal erken daktilo 0 ve 1 kullanılarak O (büyük harf O ) ve l (küçük harf L ) kullanılarak, ama 1!ve 0)0 ve 1 ortak olmuştur kez çifti standart olmuştur. Bu nedenle, ASCII !"#$%ikinci çubuk yerleştirilmiştir, bitişik çubuk basamak 1-5'e karşılık gelen, 1-5 konumlandırır. Parantez karşılık olamazdı 9'a ve 0 tekabül yer çünkü, ancak, 0 boşluk karakteriyle tarafından çekildi. Bu kaldırarak barındırılabilir _dan (alt çizgi) , 6 ile parantez yerleştirilmiş birçok Avrupa daktilo karşılık geri kalan karakterler, değişen 8 ve 9 . Yol açtı daktilolardan Bu tutarsızlık bit eşleştirilmiş klavyeler , özellikle Teletype Modeli 33 değil geleneksel mekanik daktilolar için, ASCII karşılık gelen sol kaymıştır düzen kullanılır. Elektrikli daktilo, özellikle IBM Selectric aşağıdaki - (1961), bilgisayarlarda standart hale gelmiştir biraz daha farklı bir düzen kullanılır IBM PC (1981), özellikle Modeli M (1984) - ve böylece karşılık gelmeyen Modern klavyelerde semboller için değerleri vardiya yakından ASCII tablosuna önceki klavyeler yaptığı gibi. /?Çifti de 2 Nolu kadar uzanmaktadır ve ,< .>çiftleri (shift vermedi 2 Nolu dahil olmak üzere diğer bazı klavyelerde kullanılmıştır ,(virgül) veya .(nokta) bu yüzden unshifting olmadan büyük harfle kullanılabilir). Bununla birlikte, ASCII bölme ;:(genellikle, çeşitli sözleşmeler, ve yeniden düzenlenmiş (orneğin No.2 kadar uzanan) çifti -* =+kadar) :* ;+ -=.

Bazı yaygın karakterler özellikle, dahil edilmedi ½¼¢ise, ^`~uluslararası kullanım için aksan olarak ve alındı <>birlikte basit çizgi karakterlerle, matematiksel kullanım için \|(ortak ek olarak /). @ Sembolü kıta Avrupa'da kullanılan ve komite bir aksanlı yerini olacağını beklenmiyordu À Fransız varyasyon, böylece @ pozisyonu 40 yerleştirildi onaltılık sağ A harfinin önce

Denetim kodları veri iletimi için gerekli mesajın başlangıcı (SOM), adresin sonu (EOA), olduğunu düşünmüş sonu mesajı (EOM), iletim sonu (EOT), "are you?" (WRU), "are you?" (RU), bir ayrılmış kontrol cihazı (dc0), eşzamanlama (senk), ve kabul (ACK). Bu en üst düzeye çıkarmak için konumlandırılmış Hamming mesafe kendi bit modelleri arasında.

Karakter sırası

ASCII kod sırası da denir ASCIIbetical sırası. Harmanlama veri bazen bu sırada yerine "standart", alfabetik sıraya göre (yapılır harmanlama dizisi ). ASCII sırayla ana sapmalar şunlardır:

  • Tüm büyük küçük harflerden önce gelir; örneğin, "Z", "a" önce gelen
  • Rakamlar ve birçok noktalama işaretleri harflerden önce gelir

Bir ara emri ASCII değerlerini karşılaştırarak önce küçük harfe büyük harf dönüştürür.

Karakter grupları

Kontrol karakterleri

ASCII için ilk 32 kodlarını (sayılar 0-31 ondalık) tutar kontrol karakterleri : Kodlar aslen yazdırılabilir bilgileri temsil etmek değil, (örneğin cihazları kontrol etmek değil amaçlanan yazıcılar ASCII faydalanmak) veya temin etmek meta bilgileri veri hakkında bu tür manyetik teybe gibi akışları.

Örneğin, karakter 10 (kağıt ilerletmek için bir yazıcı neden olur) "hat besleme" fonksiyonunu temsil eder, ve karakter 8 "geri al" temsil eder. RFC  2822 satır, satır besleme veya kapsamamaktadır karakterleri kontrol belirtir boşluk boşluk olmayan kontrol karakterleri olarak. Temel hat odaklı biçimlendirme reçete kontrol karakterleri hariç olmak üzere, ASCII bir belge içinde yapısını ya da metnin görünümünü tanımlayan herhangi bir mekanizma tanımlamaz. Gibi diğer şemalar, biçimlendirme dilleri , adres sayfa ve belge düzeni ve biçimlendirme.

Orijinal ASCII standardı her bir kontrol karakteri için sadece kısa açıklayıcı ifadeler kullandı. Bu durumun neden belirsizlik bir karakter üzerinde daha bir terminal bağlantısını biraz farklı kullanılacak örneğin, bazen kasıtlı veri akışı "delete" anlamı ile örneğin, bazen kazara.

Muhtemelen bu karakterlerin yorumlanması üzerinde en etkili tek bir cihaz olarak Teletype modeli 33 , bir mevcut olan bir baskı terminali olan ASR, kağıt şerit okuyucu / delici seçeneği. Kağıt bant daha az maliyetli 1980 yılına kadar ve manyetik bant daha az kırılgan bazı açılardan uzun vadeli programın depolanması için çok popüler bir orta oldu. Özellikle, kodları 17 (aynı zamanda XOFF olarak bilinen Control S DC3,) (Xaçık olarak bilinen kontrol-Q, DC1), 19, ve 127 teleks Modeli 33 makine atamaları ( Sil ) fiili standartları olmuştur. Model 33 ayrıca ünite bir BEL karakter alınan zaman çalar gerçek bir çan içerdiği gibi, (kod 7, BEL ile ilgili uyarı duyulabilir anlamına gelir) Kontrol-G açıklama alarak tam anlamıyla için dikkat çekicidir. O anahtarı için tuşun da (yerine bu karakter vardı ASCII 1963, bir sol ok sembolü gösterdi Çünkü çizgi olarak yorumlanır kod 15'in uyumlu olmayan kullanımını (Denetim-O, İçeri Kaydırma)) "Önceki karakteri sil" Ayrıca birçok erken zaman paylaşım sistemleri tarafından kabul edildi ama sonunda ihmal oldu.

Bir Teletype 33 ASR otomatik kağıt şerit okuyucu ile bir kontrol-S (X Kapalı iletim için kapalı bir kısaltma) alınan donatılmış, durdurmak için bant okuyucu neden; sürdürmek için şerit okuyucu ( "iletmek", XON) Kontrol-Q neden oldu alınması. Bu teknik dolayı taşma yaklaşan iletimini durdurmak için bir gönderici bir uyarı "tokalaşma" sinyali olarak çeşitli erken bilgisayar işletim sistemleri tarafından benimsenen oldu; Bir manuel çıkış kontrol tekniği olarak birçok sistemlerde bu güne kadar devam eder. Bazı sistemlerde Control S anlamını korur, ancak Kontrol Q çıkışına devam etmek için, ikinci bir kontrol-S ile değiştirilir. 33 ASR Control-R (DC2) ve Kontrol-T (DC4) başlangıç ve bant zımba durdurmak için kullanılması için konfigüre edilebilir; Bu fonksiyon ile donatılmış bir birimleri, mektup üzerinde tuş başlığının karşılık gelen kontrol karakteri yazı BANT oldu ve BANT sırasıyla.

Bir BS (backspace) göndermek için klavyedeki bir tuşa koymadı bu yüzden Teletype, geriye kafasını hareket edemedi. Bunun yerine kod 127 (DEL) gönderilen bir anahtar işaretli "rubout" oldu. Bu anahtar amacı elle yazılan kağıt bant hataları silmek oldu: operatör sonra tüm delikleri delinmiş ve bir karakterle hata yerini rubout, yazın yedeklemek için teyp zımba üzerine bir düğmeye basmak zorunda göz ardı için tasarlanmıştı. Teletypes yaygın dan daha az pahalı bilgisayarlar için kullanıldı Digital Equipment Corporation , bu nedenle bu sistemler önceki karakteri silmek için kullanılabilir anahtar ve böylece DEL kodunu kullanmak zorunda kaldı. Anahtar "Sil" işaretli bir kaçış dizisi gönderilen ederken diğer birçok terminalleri Geri tuşunun BS gönderilen ederken anahtar, "Backspace" işaretli için Bu nedenle, (varsayılan olarak) Aralık görüntülü terminaller DEL kodu gönderdi. Unix terminali sürücüsü yalnızca yedeklemek için bir kodu kullanabilirsiniz, bu BS ayarlı olabilir veya (bunu kullanmakta ne terminali bağlı düzeltmek zorunda sıkıntı çok uzun bir süre içinde, modern kabukları sonuçlanan, DEL, ancak ikisini kullanarak readline ) her iki kodlarını anlıyoruz. Hiçbir anahtar BS gönderilen varsayım Control + H Emacs bir "yardım" komutu gibi diğer amaçlar için kullanılmak üzere neden oldu.

Daha fazla kontrol kodlarının birçoğu orijinal olanlardan anlamları oldukça farklı verilmiştir. "Kaçış" karakteri (ESC, kod 27), örneğin, hazır bilgi olarak diğer kontrol karakterleri gönderme yerine anlamlarını yürütmesini sağlamak için düşünülmüştü. Bu URL kodlamaları, karşılaşılan "kaçış" aynı anlamı C dili belirli karakterleri ayrılmış bir anlama gelmektedir dizeleri ve diğer sistemler. Zamanla bu anlam eş seçti olmuştur ve sonunda değiştirilmiştir. Modern kullanımda, terminaline gönderilen bir ESC genellikle genellikle sözde "şeklinde bir komut dizisinin başlangıcını belirten ANSI çıkış kodu (veya, daha uygun bir" " Kontrol Sekans sokucu ") ECMA-48 ( bir "[" (sol kelepçe) karakter ve ardından ESC ile başlayan 1972) ve ardılları. Terminali tarafından gönderilen bir ESC çoğu zaman bir şekilde kullanılan üzerinden bant gibi bir işlem sonlandırmak için kullanılan bir karakter TECO ve vi metin düzenleyiciler . Olarak , grafik kullanıcı arabirimi (GUI) ve pencereleme sistemleri ESC genel olarak geçerli işlemi iptal etmek için ya da bir uygulama neden olur çıkış tamamen (sonlandırmak).

Sistemler arasında "düz metin" dosyaları aktarırken kendi tarihsel kullanımı ile kombine birçok kontrol karakterlerinin doğasında belirsizlik, sorunları yarattı. Bunun en iyi örneği , yeni satır çeşitli üzerinde sorun işletim sistemleri . Teletype makineleri metin satırı (satır başına kafasını taşır) "Satır Sonu" ve (kafasını hareket ettirmeden kağıt bir satır ilerler) "Çizgi Feed" hem sonlandırılacak gerektiriyordu. Adı "Satır Başı" manuel üzerinde olmasından kaynaklanır daktilo typebars kurdeleyi vurdu pozisyon sabit kalırken kağıdı tutan taşıyıcı taşındı. Tüm taşıyıcı sonraki hat için kağıdın sol kenar boşluğunu yerleştirmek için sağa itilmiş (döndürülen) gerekiyordu.

Aralık işletim sistemleri ( OS / 8 , RT-11 , RSX-11 , RSTS , TOPS-10 konsol cihazı (aslen böylece, vs.) bir satırın sonunu işaretlemek için her iki karakter kullanılan teleks makineleri ) çalışacak. "Cam uçbirim" olarak adlandırılan zaman (daha sonra adı verilen CRT veya terminaller) gelip, kongre çok iyi geriye dönük uyumluluk kuralını devam gerektirdiği tespit edilmiştir. Tüm Gary Kildall oluşturulan CP / M o kullanılan bazı komut hat ara-yüz sözleşmeler esinlenerek Aralık sitesindeki RT-11 . Tanıtımıyla kadar PC DOS 1981 yılında, IBM, kendi 1970'ler ASCII yerine EBCDIC kullanılan işletim sistemleri, çünkü bu hiçbir el vardı ve onlar satırbaşı kavramı anlamsız olduğu üzerinde delikli kart girişi ve hat yazıcı çıktısı yönelmiştir. IBM'in PC DOS (ayrıca olarak pazarlanan MS-DOS Microsoft tarafından) gevşek dayalı olmasından dolayı kongre miras CP / M ve , Windows , MS-DOS dan miras kaldı.

Ne yazık ki, bir satırın sonunu işaretlemek için iki karakter gerektiren gereksiz karmaşıklığı ve tek başına karşılaştı zaman her bir karakteri nasıl yorumlanacağı konusunda sorular tanıtır. Kolaylık olması açısından düz metin dosyaları da dahil olmak üzere veri akışları, Multics bir satır sonlandırıcı olarak tek başına satır besleme (LF) kullanılır. Unix ve Unix benzeri sistemler ve Amiga sistemleri, Multics bu kuralını kabul etmiştir. Orijinal Macintosh OS , Apple DOS ve ProDOS , diğer taraftan, bir satır sonlandırıcı olarak yalnız sürgü dönüşü (SD) kullanılır; Elma Unix tabanlı ile bu işletim sistemlerini yerini beri ancak, MacOS işletim sistemi, artık satır beslemesi (SB) ve kullanırlar. Radyo Shack TRS-80 aynı zamanda, halatlar sonlandırmak için yalnız bir CR kullanılır.

Bağlı bilgisayarlar ARPANET'ten örneğin 10 üstleri gibi işletim sistemleri çalışan makineler dahil Tenex gibi Multics LF hat uçlarının kullanılarak ve aynı işletim sistemi çalıştıran CR-LF satır bitimlerini kullanılarak makineleri gibi işletim sistemi çalıştıran makineleri OS / 360 olarak çizgilerle temsil edilen hattın karakterler ve o kullanılan takiben karakter sayısı EBCDIC ASCII yerine. Telnet protokolü bir ASCII "tanımlı Ağ Sanal Terminali farklı satır sonlandırma sözleşme ve karakter setleri ile ana arasındaki bağlantılar ağ üzerinden standart bir metin biçimi iletilmesi ile desteklenmelidir böylece," (NVT). Telnet CR-LF satır sonları ile birlikte ASCII kullanılır ve diğer kuralları kullanarak yazılım yerel sözleşmeler ve NVT arasında çeviri olacaktır. Dosya Aktarım Protokolü komutları ileten ve varsayılan ASCII modunda veri aktarımı sırasında kullanılmak üzere ağ sanal Terminal kullanımını içeren Telnet protokolü onayladı. Bu nvt en CR-LF satır sonu kuralını kullanarak değil sistemlerde, bu protokollerin uygulamalarına ve bu tür e-posta ve World Wide Web için kullanılanlar gibi diğer ağ protokolleri, karışıklık yaratabilir.

PDP-6 monitörü ve PDP-10 ardıl TOPS-10, bir terminalden girişi için bir uç dosyasonu göstergesi olarak kontrol-Z (ALT) kullanılmıştır. Böyle CP / M gibi bazı işletim sistemleri sadece disk bloklarının birimlerinde dosya uzunluğu izlenir ve dosyadaki fiili metnin sonunu işaretlemek için Ctrl-Z kullandı. Bu nedenlerden dolayı, EOF veya -sonu dosyası , bir olarak konuşulduğu ve geleneksel kullanıldı üç harfli kısaltması Kontrol-Z yerine Yedek için. Sonu metni kodu ( ETX olarak da bilinir), Control-C , bir dosyayı bitirmek için kontrol kodu olarak Z'yi kullanırken alfabe biten buna benzer ve bir çok uygun olarak hizmet veren, çeşitli nedenlerle için uygunsuz oldu hatırlatıcı yardım . Bir tarihsel olarak yaygın ve halen yaygın kongre kesmek ve genellikle bir klavyeden, bir giriş verisi akımından üzerinden bir program durdurmak için ETX kod kongre kullanır.

C kütüphanesi ile de UNIX sözleşmeler, boş karakter metin sonlandırmak için kullanılır dizeleri ; Böyle boş sonlandırılmış şeritler Z "sıfır" anlamına gelir Burada ASCIZ veya ASCIIZ olarak kısaltma bilinebilir.

İkili Ekim Aralık büyü Kısaltma İsim (1967)
1963 1965 1967
000 0000 000 0 00 BOŞ NUL ^@ \0 Boş
000 0001 001 1 01 SOM SOH ^A Başlık Başlangıcı
000 0010 002 2 02 EOA'nın STX ^B Metin Başlangıcı
000 0011 003 3 03 EOM ETX ^C Metin Sonu
000 0100 004 4 04 EOT ^D İletim Sonu
000 0101 005 5 05 WRU ENQ ^E Soruşturma
000 0110 006 6 06 RU ACK ^F alındı
000 0111 007 7 07 BELL BEL ^G \a çan
000 1000 010 8 08 FE0 BS ^H \b geri tuşu
000 1001 011 9 09 HT / SK HT ^I \t Yatay sekme
000 1010 012 10 0A LF ^J \n Satır besleme
000 1011 013 11 0B VTAB VT ^K \v Dikey Tab
000 1100 014 12 0C FF ^L \f Form besleme
000 1101 015 13 0D CR ^M \r Satırbaşı
000 1110 016 14 0E YANİ ^N dışarı Kaydırma
000 1111 017 15 0F ^O Vardiya
001 0000 020 16 10 dc0 DLE ^P Veri Bağlantı Kaçış
001 0001 021 17 11 DC1 ^Q Cihaz Kontrol 1 (genellikle XAÇIK )
001 0010 022 18 12 DC2 ^R Cihaz Kontrolü 2
001 0011 023 19 13 DC3 ^S Cihaz Kontrolü 3 (genellikle XKAPALI )
001 0100 024 20 14 DC4 ^T Cihaz Kontrolü 4
001 0101 025 21 15 ERR NAK ^U Negatif Alındı
001 0110 026 22 16 SYNC SYN ^V senkron Boşta
001 0111 027 23 17 LEM ETB ^W İletim Sonu Bloğu
001 1000 030 24 18 S0 CAN ^X İptal etmek
001 1001 031 25 19 S1 EM ^Y Ortam Sonu
001 1010 032 26 1 A S2 SS ALT ^Z Vekil
001 1011 033 27 1B S3 ESC ^[ \e Kaçış
001 1100 034 28 1C S4 FS ^\ Dosya Ayırıcı
001 1101 035 29 1D S5 GS ^] Grup Ayırıcı
001 1110 036 30 1E S6 RS ^^ Kayıt Ayırıcı
001 1111 037 31 1F S7 BİZE ^_ Birim Ayırıcı
111 1111 177 127 7F DEL ^? silmek

Diğer temsiller örnek için, uzman ekipmanlar tarafından kullanılabilecek ISO 2047 grafik veya onaltılık sayılar.

Yazdırılabilir karakterler

Kodlar 20 altıgen 7E için onaltılık yazdırılabilir karakterler olarak bilinen, harfleri, rakamları, temsil noktalama işaretleri ve birkaç çeşitli semboller. 95 adet yazdırılabilir karakterler var.

Kod 20 altıgen , "boşluk" karakteri bir klavyenin boşluk çubuğuna tarafından üretilen gibi, kelimeler arasındaki boşluk gösterir. Boşluk karakteri görünmez bir grafik (yerine bir kontrol karakteri) olarak kabul edilir çünkü aşağıdaki tabloda yerine önceki bölümde listelenmiştir.

Kod 7F heks "sil" basılamayan (DEL) kontrol karaktere karşılık gelen ve bu nedenle bu grafikten atlanmıştır; önceki bölümün grafikte kaplıdır. ASCII önceki sürümleri kadar yerine ok kullanılan şapka (5E onaltılık ) ve yerine sol ok çizgi (5F onaltılık ).

İkili Ekim Aralık büyü kabartma
1963 1965 1967
010 0000 040 32 20  uzay
010 0001 041 33 21 !
010 0010 042 34 22 "
010 0011 043 35 23 #
010 0100 044 36 24 $
010 0101 045 37 25 %
010 0110 046 38 26 &
010 0111 047 39 27 '
010 1000 050 40 28 (
010 1001 051 41 29 )
010 1010 052 42 2A *
010 1011 053 43 2B +
010 1100 054 44 2C ,
010 1101 055 45 2D -
010 1110 056 46 2E .
010 1111 057 47 2F /
011 0000 060 48 30 0
011 0001 061 49 31 1
011 0010 062 50 32 2
011 0011 063 51 33 3
011 0100 064 52 34 4
011 0101 065 53 35 5
011 0110 066 54 36 6
011 0111 067 55 37 7
011 1000 070 56 38 8
011 1001 071 57 39 9
011 1010 072 58 3 A :
011 1011 073 59 3B ;
011 1100 074 60 3C <
011 1101 075 61 3 boyutlu =
011 1110 076 62 3E >
011 1111 077 63 3F ?
100 0000 100 64 40 @ ' @
100 0001 101 65 41 bir
100 0010 102 66 42 B
100 0011 103 67 43 C
100 0100 104 68 44 D
100 0101 105 69 45 E
100 0110 106 70 46 F
100 0111 107 71 47 G,
100 1000 110 72 48 'H
100 1001 111 73 49 ben
100 1010 112 74 4A J
100 1011 113 75 4B K
100 1100 114 76 4C L
100 1101 115 77 4D M
100 1110 116 78 4E N-
100 1111 117 79 4F O
101 0000 120 80 50 P
101 0001 121 81 51 S
101 0010 122 82 52 R,
101 0011 123 83 53 S
101 0100 124 84 54 T
101 0101 125 85 55 U
101 0110 126 86 56 V
101 0111 127 87 57 W
101 1000 130 88 58 X
101 1001 131 89 59 Y
101 1010 132 90 5A Z
101 1011 133 91 Şekil 5B, [
101 1100 134 92 5C \ ~ \
101 1101 135 93 5D ]
101 1110 136 94 5E ^
101 1111 137 95 5F _
110 0000 140 96 60 @ '
110 0001 141 97 61 bir
110 0010 142 98 62 b
110 0011 143 99 63 c
110 0100 144 100 64 d
110 0101 145 101 65 e
110 0110 146 102 66 f
110 0111 147 103 67 g
110 1000 150 104 68 h
110 1001 151 105 69 ben
110 1010 152 106 6A j
110 1011 153 107 6B k
110 1100 154 108 6C l
110 1101 155 109 6D m
110 1110 156 110 6E n
110 1111 157 111 6F O
111 0000 160 112 70 p
111 0001 161 113 71 q
111 0010 162 114 72 r
111 0011 163 115 73 s
111 0100 164 116 74 t
111 0101 165 117 75 u
111 0110 166 118 76 v
111 0111 167 119 77 w
111 1000 170 120 78 x
111 1001 171 121 79 y
111 1010 172 122 7A z
111 1011 173 123 7B {
111 1100 174 124 7C ACK ¬ |
111 1101 175 125 7D }
111 1110 176 126 7E ESC | ~

Karakter seti

ASCII (1977/1986)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000 Mr
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
CAN
0018
EM
0019
ALT
001A
ESC
001B
FS
001C
GS
001D
RS
001E
ABD
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
bir
0041
B
0042
C
0043
D
0044
D
0045
F
0046
G
0047
H
0048
Ben
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q,
0051
R,
0052
S
0053
T
0054
U
0055
V
0056
B
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
'
0060
bir
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
i
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q,
0071
r,
0072
s
0073
t
0074
u
0075
v
0076
ağırlık
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F

  Harf    Numarası    Noktalama    Sembol  Diğer  undefined  1963 sürümünden değiştirildi      

kullanım

ASCII ilk için yedi bitlik teleprinter kodu olarak 1963 sırasında ticari kullanıldı Amerikan Telefon ve Telgraf 'ın TWX (teletypewriter Santral) ağına. TWX aslen önceki beş bitlik kullanılan ITA2 da rakip tarafından kullanılan, Teleks teleprinter sistemine. Bob Bemer gibi özellikleri tanıttı çıkış sırası . Onun İngiliz meslektaşı Hugh McGregor Ross , Bemer göre "O kadar ki ASCII ilk denirdi olacak olan kod - bu işi sevdirmek için yardımcı Bemer-Ross Kod Avrupa'da". Çünkü ASCII üzerine yaptığı kapsamlı çalışmanın, Bemer "ASCII babası" olarak anılmıştır.

11 Mart 1968 tarihinde, ABD Başkanı Lyndon B. Johnson Amerika Birleşik Devletleri Federal hükümet desteği ASCII tarafından satın alınan tüm bilgisayarların belirterek hükmediyordu:

Ben de tavsiyelerini onayladı Ticaret Sekreteri onlar bilgisayar işlemlerinde kullanılan manyetik bantların ve kağıt bantlarla Bilgi Değişimi İçin Standart Kodunu kaydetmek için standartlarla ilgili. Getirilen tüm bilgisayarlar ve ilgili ekipman konfigürasyonları Federal Hükümet , 1 Temmuz 1969 tarihinde ve sonrasında envanter, Bilgi Değişimi İçin Standart Kodu ve bu medya kullanıldığında manyetik teyp ve kağıt bant standartlarına göre reçete biçimlerini kullanmayı yeteneğine sahip olmalıdır.

ASCII en yaygın karakter kodlamasını oldu World Wide Web Aralık 2007 tarihine kadar, ne zaman UTF-8 kodlama bunu aştı; UTF-8 ASCII ile geriye uyumludur.

Varyantlar ve türevleri

Bilgisayar teknolojisi dünya çapında yayıldı gibi, farklı standartlar organları ve şirketler Roma merkezli alfabe kullanılan İngilizce dışındaki diller ifadesini kolaylaştırmak için ASCII birçok varyasyonu geliştirdi. Bir "olarak sınıf Bu varyasyonların bazıları olabilir ASCII uzantıları ," her ne kadar terim 7 bit aralığında ASCII karakter-harita korumak olmayanları dahil tüm varyantlarını temsil etmek bazı yanlış. Ayrıca, ASCII uzantıları da ASCII olarak mislabelled edilmiştir.

7 bit kodları

gelişiminin erken itibaren ASCII uluslararası karakter kodu standardının çeşitli ulusal varyantların sadece biri olduğu düşünülmüştü.

Diğer uluslararası standartlar kurumlarının gibi karakter kodlamalarını onaylayan ISO 646 İngilizce dışında karakterler için uzantıları ile, aynı veya ASCII ile neredeyse aynı olan (1967) alfabesinin böyle İngiltere'nin için sembol olarak ABD dışında kullanılan ve semboller, Sterlin (£). ASCII yalnızca ABD ve birkaç diğer ülkelerin ihtiyaçlarına uygun beri hemen her ülke, ASCII bir uyarlanmış versiyonunu gerekli. Örneğin, Kanada Fransızca karakterleri desteklenen kendi versiyonunu vardı.

Birçok başka ülke (örneğin İngilizce olmayan harfleri de ASCII varyantlarını geliştirilen é , ñ , ß , £ ), para birimi sembolleri (örneğin £ , ¥ ) vb Ayrıca bkz YUSCII (Yugoslavya).

Bu ortak çoğu karakteri paylaşmak, ancak birkaç diğer yerel olarak yararlı karakterleri atamak istiyorum kod noktaları "ulusal kullanım" için ayrılmış. Ancak, ASCII 1963 yayın ve 1967 sırasında uluslararası bir öneri ISO'nun ilk kabul arasında geçen dört yıl başka ülkelerde kez karışıklık ve uyumsuzluk neden dünya için fiili standartlar gibi görünüyor ulusal kullanım karakterler için ASCII seçimlerini neden bu kod noktalarına kendi atamalarını yapmak başladı.

ISO / IEC 646, ASCII gibi, 7 bitlik bir karakter kümesidir. Bu herhangi bir ek kodlar mevcut yapmaz, bu yüzden aynı kod noktaları farklı ülkelerde farklı karakterleri kodlanmış. Escape kodları metin parçası uygulanan ulusal hangi varyant belirtmek için tanımlanmış, fakat bunlar nadiren kullanıldı, yüzden sık sık bir kod temsil hangi karakter nedenle çalışmak ne varyant tanımak ve imkansız ve genel, kısa mesaj uygulamanız oldu işlem sistemleri zaten tek varyant baş edebileceğinden.

ASCII braket ve bağ karakterleri ISO ulusal varyantını kullanarak ISO / IEC 646, bir, vb Almanca, Fransızca veya İsveççe programcının diğer ulusal varyantları aksanlı harfler kullanıldı üzere "ulusal kullanımı" kod noktaları ayrıldı Çünkü / IEC 646, gibi, böyle şeyler yazmak ve böylece okumuştuk yerine ASCII

ä aÄiÜ = 'Ön'; ü

yerine

{ a[i] = '\n'; }

C üç karakterli için bu sorunu çözmek için oluşturulan ANSI C derleyici onların geç giriş ve tutarsız uygulanması kullanımlarını sınırlı olmasına rağmen,. Birçok programcı İsveççe, US-ASCII bu kadar düz metin bilgisayarlarını tuttu, vb Almanca (örneğin, e-posta veya içinde Usenet ) içerdiği "}, {" ve kelimelerin ortasında benzer varyantları, bir şey o programcılar var alışığım. Örneğin, öğle yemeği için gitmeli soran başka programcı posta İsveçli programcı, alabilir | "anlamına gelen "Nä jag har smörgåsar" olmalıdır cevap olarak "N {jag har sm rg} sar" Hayır bende sandviç".

8-bitlik bir kod

Sonunda, 8- olarak 16- ve 32-bit (ve daha sonra 64 bit ) bilgisayarlar yerini almaya başladı 12-, , 18- ve 36-bit norm olarak bilgisayarlar, her depolamak için bir 8-bitlik bayt kullanıldığı yaygın hale ASCII genişletilmiş, 8-bitlik yakınları için bir fırsat sağlayan bellekte karakter. Çoğu durumda bu bozulmamış orijinal karakter eşleme bırakarak, ancak ilk 128 (yani 7 bit) karakterden sonra ek karakter tanımları ekleyerek, ASCII de doğrudur uzantıları geliştirdi.

Kodlamalar dahil ISCII (Hindistan), VISCII (Vietnam). Bu kodlamalar bazen ASCII olarak anılır olsa da, gerçek ASCII sadece ANSI standardında kesinlikle tanımlanır.

En erken ev bilgisayar sistemleri hat çekme ve oyun glifleri içeren kendi 8-bit karakter setleri geliştirdi ve genellikle daha fazla grafiklerle 0 ile 31 arasında kontrol karakterleri bir kısmını veya tamamını doldurdu. Kaypro CP / M bilgisayarlar Yunan alfabesi için "üst" 128 karakteri kullanılır.

PETSCII kodu Commodore Uluslararası onların için kullanılan 8 bitlik sistemlerde bulunan gibi, bunun yerine daha yaygın ASCII 1967, ASCII-1963 dayalı olması sonrası 1970 kodları arasında muhtemelen benzersizdir ZX Spectrum bilgisayara. Atari 8-bit bilgisayarlar ve Galaksija bilgisayarları da ASCII varyantları kullandı.

IBM PC tanımlanan kod sayfa 437 gibi grafik sembolleri ile kontrol karakterleri yerini gülen yüzleri ve üst 128 konumlarına ilave grafik karakterler çizilmiştir. Gibi işletim sistemleri DOS bu kod sayfalarını desteklenen ve üreticileri , IBM PC'lerde donanım onları destekledi. Digital Equipment Corporation, geliştirilen çok uluslu karakter kümesi popüler kullanılmak üzere (Aralık-MCS) VT220 terminali daha blok grafikler için daha uluslararası diller için tasarlanmış ilk uzantıları biri olarak. Macintosh tanımlanan Mac OS Roman ve Postscript ayrıca, bu alan uluslararası harflerle hem de daha modern karakter kümeleri gibi yerine grafik tipografik noktalama işaretleri, her iki seti tanımlanır.

ISO / IEC 8859 (DEC-MCS türetilmiş) standart son olarak (ancak birçok değişikliği ile, bunlar ASCII kopyalanan olarak en az doğru) çok sistem kopyalanan bir standart olarak sağlanır. Microsoft tarafından tasarlanmış bir popüler fazla uzatma, Windows-1252 (genellikle yanlış etiketlenmiş ISO-8859-1 ), geleneksel metin baskısı için gerekli tipografik noktalama işaretleri eklendi. Zaman ISO-8859-1, Windows 1252 ve orijinal 7 bitlik ASCII 2008'e kadar en yaygın karakter kodlamalarını vardı UTF-8 daha yaygın hale geldi.

ISO / IEC 4873 80-9F tanımlanan 32 ek kontrol kodları kişiye onaltılı bir 8-bit bir sistem haline 7-bitlik ASCII kodlama uzanan bir parçası olarak, aralık.

Unicode

Unicode ve ISO / IEC 10646 Evrensel Karakter Kümesi (UCS) karakterlerin çok daha geniş bir dizi var ve onların çeşitli kodlama biçimleri birçok ortamlarda hızla ISO / IEC 8859 ve ASCII yerini başladılar. ASCII 128 karakterle sınırlıdır iken, Unicode ve UCS (kullanarak benzersiz kimlik kavramlarını ayırarak daha fazla karakter destekleyen doğal sayılar denir kod noktaları (8-, 16- veya 32-bit ikili biçimlerde, denir ve kodlama) UTF-8 , UTF-16 ve UTF-32 ).

ASCII, Unicode içine ilk 128 semboller olarak ayarlayın (1991) karakterini dahil oldu, bu yüzden 7 bit ASCII karakterleri her iki takımdaki aynı sayısal kodlara sahip. Bu sayede UTF-8 olduğu geriye doğru uyumlu yalnızca ASCII karakter içeren UTF-8 dosya aynı karakter dizisini içeren ASCII dosyası ile aynıdır olarak, 7-bitlik ASCII ile. Daha da önemlisi, ileriye dönük uyumluluğu özel olarak sadece 7 bitlik ASCII karakterleri tanır ve (genellikle ISO-8859-1 olarak 8 bitlik ASCII uzantıları desteklemek için yapıldığı gibi) en yüksek bit kümesiyle bayt değiştirmez yazılım olarak sağlanır UTF-8 verileri değişmeden koruyacaktır.

Ayrıca bakınız

notlar

Referanslar

daha fazla okuma

Dış bağlantılar