Temel Latince (Unicode bloğu) - Basic Latin (Unicode block)
C0 kontrolleri ve Temel Latince | |
---|---|
Menzil | U+0000..U+007F (128 kod noktası) |
Uçak | BMP |
Kodlar |
Latince (52 karakter) Ortak (76 karakter) |
Başlıca alfabeler |
İngilizce Fransızca Almanca İspanyolca Vietnamca |
Sembol kümeleri |
Arap rakamları Noktalama işaretleri |
Atandı | 128 kod noktası 33 Kontrol veya Format |
kullanılmamış | 0 ayrılmış kod noktası |
Kaynak standartları | ISO/IEC 8859 , ISO 646 |
Unicode sürüm geçmişi | |
1.0.0 (1991) | 128 (+128) |
Not : |
Temel Latin veya C0 Kontroller ve Temel Latin Unicode bloğu ilk bloktur Unicode standardı ve bir bayt olarak kodlanan, sadece blok UTF-8 . Blok , ASCII kodlamasının tüm harflerini ve kontrol kodlarını içerir. Bu 128 karakter içeriyor, U + 0000 U + 007F arasında değişmektedir ve şunları içerir C0 kontrolleri , ASCII noktalama ve semboller , ASCII basamak , hem büyük harf ve küçük harf arasında İngiliz alfabesi ve kontrol karakteri .
Temel Latin bloğu, karakter repertuarının eklenmesi veya değiştirilmesi olmaksızın Unicode Standardının 1.0.0 sürümünden itibaren mevcut biçimine dahil edilmiştir. Unicode 1.0'daki blok adı ASCII idi .
karakter tablosu
- A U+005C (\) harfi Japonca/Korece yazı tiplerinde Yen(¥) veya Won(₩) işareti olarak görünebilir ve Unicode'u (özellikleUTF-8) ters eğik çizgiyi bu işaretlerle değiştiren eski bir karakter seti olarak görebilir.
Alt başlıklar
C0 Kontrolleri ve Temel Latin bloğu altı alt başlık içerir.
C0 kontrolleri
C0 Kontroller sürüm 1.0 C0 ASCII kontrol kodları olarak adlandırılan, ASCII ve 7 bitlik ve 8-bit şifreleme şemaları devralınır. C0 kontrollerinin diğer adları, ISO/IEC 6429:1992 standardından alınmıştır.
ASCII noktalama işaretleri ve semboller
Bu alt pozisyon, standart noktalama karakterlerine, basit matematiksel operatörlere ve dolar işareti, yüzde, ve işareti, alt çizgi ve çizgi gibi sembollere atıfta bulunur .
ASCII rakamları
ASCII Rakamları alt başlığı, standart Avrupa sayı karakterlerini 1-9 ve 0 içerir.
Büyük harf Latin alfabesi
Büyük Latin alfabesi alt başlık standart 26 harfli aksansız Latin alfabesini içeren majuscule .
Küçük harf Latin alfabesi
Küçük Harfli Latin Alfabesi alt başlığı, minuscule'de standart 26 harfli aksansız Latin alfabesini içerir .
Kontrol karakteri
Kontrol Karakteri alt başlığı "Sil" karakterini içerir.
Sembollerin, harflerin ve kontrol kodlarının sayısı
Aşağıdaki tablo , C0 Kontrolleri ve Temel Latin bloğundaki alt başlıkların her birindeki harf , sembol ve kontrol kodlarının sayısını göstermektedir .
Alt başlık türü | Sembol sayısı | Karakter aralığı |
---|---|---|
C0 kontrolleri | 32 kontrol kodu | U+0000'den U+001F'ye |
ASCII noktalama işaretleri ve semboller | 33 noktalama işareti ve sembol | U+0020 ila U+002F, U+003A ila U+0040, U+005B ila U+0060 ve U+007B ila U+007E |
ASCII rakamları | 10 basamak | U+0030 ila U+0039 |
Büyük Latin Alfabesi | Majuscule'de 26 aksansız Latin harfi. | U+0041'den U+005A'ya |
Küçük Latin Alfabesi | Ufacıkta 26 aksansız Latin harfi. | U+0061'den U+007A'ya |
Kontrol karakteri | "Sil" karakterini içeren 1 kontrol kodu. | U+007F |
Engellemek
C0 Kontrolleri ve Temel Latin Resmi Unicode Konsorsiyumu kod şeması (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | NS | E | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | BU YÜZDEN | Sİ |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | YAPABİLMEK | EM | ALT | ESC | FS | GS | RS | Biz |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | NS | E | F | G | H | ben | J | K | L | m | n | Ö |
U+005x | P | Q | r | S | T | sen | V | W | x | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | B | C | NS | e | F | G | H | ben | J | k | ben | m | n | Ö |
U+007x | P | Q | r | s | T | sen | v | w | x | y | z | { | | | } | ~ | DEL |
Notlar
|
Varyantlar
Birkaç karakter, ardından değişken göstergeleri geliyorsa standartlaştırılmış bir değişken olarak işlenecek şekilde tanımlanır .
Kısa çapraz stroklu sıfır için bir değişken tanımlanmıştır: U+0030 DIGIT ZERO, U+FE00 VS1 (0︀).
Emoji türevleri oluşturmak için on iki karakteri (#, * ve rakamlar) U+FE0E VS15 veya U+FE0F VS16 takip edebilir . Bunlar temel tuş karakterleridir, örneğin #️⃣ (U+0023 NUMARASI İŞARETİ U+FE0F VS16 U+20E3 KAPATAN TUŞ CAPINI BİRLEŞTİRİR). VS15 sürümü "metin sunumu" iken VS16 sürümü "emoji tarzı"dır.
+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
temel | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
baz+VS15+klavye | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
baz+VS16+klavye | #️⃣ | *️️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Tarih
Aşağıdaki Unicode ile ilgili belgeler, Temel Latin bloğunda belirli karakterleri tanımlamanın amacını ve sürecini kaydeder:
Sürüm | Son kod noktaları | Saymak | UTC Kimliği | L2 kimliği | WG2 kimliği | Belge |
---|---|---|---|---|---|---|
1.0.0 | U+0000.007F | 128 | (belirlenecek) | |||
UTC/1999-013 | Karlsson, Kent (1999-05-27), Tildes ve mikro işaret ayrıştırmaları | |||||
L2/99-176R | Moore, Lisa (1999-11-04), "Micro Sign Case Mappings", Seattle'daki ortak UTC/L2 toplantısından dakikalar, 8-10 Haziran 1999 | |||||
L2/04-145 | Starner, David (2004-04-30), BAE raporu 1884'ten (Dorsey) çizgili karakter örnekleriyle C | |||||
L2/04-202 | Anderson, Deborah (2004-06-07), Kesilmiş C Geri Bildirimi | |||||
N3046 | Suignard, Michel (2006-02-22), Kontrol karakterleri için resmi tanımın iyileştirilmesi | |||||
N3103 (pdf , belge ) | Umamaheswaran, VS (2006-08-25), "M48.33", WG 2 toplantısının onaylanmamış tutanakları 48, Mountain View, CA, ABD; 2006-04-24/27 | |||||
L2/11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Üst ve indisli harfler için belirli özellik atamalarındaki hataları ve tutarsızlıkları düzeltme önerisi | |||||
L2/11-160 | PRI #181 On İki Karakterin Genel Kategorisini Değiştirme , 2011-05-02 | |||||
L2/11-261R2 |
Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes , Ken Whistler'ın L2/11-281'deki kontrol karakterleri için takma adlar ve BEL kısaltmaları ile ilgili tavsiyelerini kabul edin ve NUL. |
|||||
L2/11-438 | N4182 | Edberg, Peter (2011-12-22), Emoji Varyasyon Dizileri (L2/11-429 Revizyonu) | ||||
L2/15-107 |
Moore, Lisa (2015-05-12), "Consensus 143-C5", UTC #143 Dakika , emoji-data.txt içindeki 12 tuş dizisini Unicode 8.0'da geçici adlandırılmış diziler olarak ekleyin. |
|||||
L2/15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Boş Kümenin Kesilmiş Sıfır Varyantını Temsil Etme Önerisi | |||||
L2/15-301 | Pournader, Roozbeh (2015-11-01), emoji için 278 standartlaştırılmış varyasyon dizisi önerisi | |||||
L2/15-254 | Moore, Lisa (2015-11-16), "B.12.1.2 Boş Kümenin Kesilmiş Sıfır Varyantını Temsil Etme Önerisi", UTC #145 Dakika | |||||
L2/17-294 | N4914 | Lunde, Ken (2017-08-14), U+FF10 FULLWIDTH DIGIT ZERO için standartlaştırılmış varyasyon dizisi ekleme önerisi | ||||
Ayrıca bakınız
Referanslar
- ^ "Unicode karakter veritabanı" . Unicode Standardı . 2016-07-09 alındı .
- ^ "Unicode Standardının Numaralandırılmış Sürümleri" . Unicode Standardı . 2016-07-09 alındı .
- ^ Unicode Standart Sürüm 1.0, Cilt 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ "3.8: Blok Blok Grafikler" (PDF) . Unicode Standardı . sürüm 1.0. Unicode Konsorsiyumu .
- ^ Hepsini Sıralama : Ters eğik çizgi ne zaman ters eğik çizgi değildir?
- ^ a b c d e f g "Unicode 6.2 kod çizelgeleri" (PDF) . Unicode Standardı . 1 Nisan 2013 alındı .
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30). "L2/15-268: Boş Kümenin Kesikli Sıfır Varyantını Temsil Etme Önerisi" (PDF) .
- ^ a b "UTS #51 Emoji Varyasyon Dizileri" . Unicode Konsorsiyumu.
- ^ Edberg, Peter (2011-12-22). "L2/11-438: Emoji Varyasyon Dizileri (L2/11-429'un Revizyonu)" (PDF) .
- ^ Pournader, Roozbeh (2015-11-01). "L2/15-301: Emoji için 278 standartlaştırılmış varyasyon dizisi için bir teklif" (PDF) .
- ^ "UTR #51: Unicode Emoji" . Unicode Konsorsiyumu. 2020-02-11.
- ^ "UCD: UTR #51 için Emoji Verileri" . Unicode Konsorsiyumu. 2021-08-26.