Boşluk karakteri - Whitespace character
Gelen bilgisayar programlama , boşluk herhangi bir karakter veya yatay veya dikey temsil karakter dizisi alanını içinde tipografi . İşlendiğinde, boşluk karakteri görünür bir işarete karşılık gelmez, ancak genellikle sayfada bir alanı kaplar. Örneğin, ortak boşluk sembolü U+0020 SPACE (ayrıca ASCII 32) , Batı alfabelerinde sözcük ayırıcı olarak kullanılan metinde bir boşluk noktalama karakterini temsil eder .
genel bakış
Birçok klavye düzeninde, bir boşluk karakteri kullanılarak bir boşluk karakteri girilebilir spacebar. Boşluğun Tab ↹uzunluğu değişebilse de, tuşun kullanımıyla birçok klavyede yatay boşluk da girilebilir . Dikey boşluk, nasıl kodlandığına göre biraz daha çeşitlidir, ancak yazmada en belirgin olanı, ↵ Enteruygulama programlarında bir 'yeni satır' kod dizisi oluşturan sonuçtur. Daha eski klavyeler, bunun yerine Return, sol durağa elektromekanik bir dönüş (ASCII- hex &0D;'de CR kodu ) ve bir satır besleme veya sonraki satıra hareket (ASCII'de LF kodu) oluşturan daktilo klavyesini kısaltarak 'Satır-Dönüş' anlamına gelebilir . -hex &0A;); bazı uygulamalarda bunlar bağımsız olarak monitörlerde metin hücresi tabanlı ekranlar çizmek veya traktör kılavuzlu yazıcılarda yazdırmak için kullanıldı; bu, metin tabanlı çıktı cihazlarının daha karmaşık çıktılar elde etmesine izin veren ters hareketler/konumlandırma kod dizileri de içerebilir. Birçok eski bilgisayar oyunu bu tür kodları bir ekran çizmek için kullandı (örneğin Kroz Krallığı ) ve kelime işlemci yazılımı bunu kalın, altı çizili ve üstü çizili gibi basılı efektler üretmek için kullanırdı.
"Boşluk" terimi, sıradan kağıt üzerinde elde edilen görünüme dayanmaktadır . Ancak, bir uygulama içinde kodlanırlar, boşluk diğer herhangi bir karakter koduyla aynı şekilde işlenebilir ve programlar, oluştukları bağlam için tanımlandığı gibi uygun eylemi yapabilir.
Tanım ve belirsizlik
En yaygın boşluk karakterleri boşluk çubuğu veya sekme tuşu aracılığıyla yazılabilir . Bağlama bağlı olarak, return veya enter tuşu tarafından oluşturulan bir satır sonu da boşluk olarak kabul edilebilir.
tek kod
Aşağıdaki tablo, Unicode Karakter Veritabanında boşluk ("WSpace=Y", "WS") karakterleri olarak tanımlanan yirmi beş karakteri listeler . On yedi, çift yönlü yazma ("İki Yönlü Karakter Türü=WS") algoritmasıyla tutarlı bir boşluk tanımı kullanır ve "Bidi-WS" karakterleri olarak bilinir. Kalan karakterler de kullanılabilir, ancak bu "Bidi" türünde değildir.
Not: Aşağıdaki tabloyu görüntülemek için kullanılan tarayıcıya ve yazı tiplerine bağlı olarak, tüm boşluklar düzgün görüntülenmeyebilir.
İsim | kod noktası | Genişlik kutusu | kırılabilir mi? | In IDN ? |
Senaryo | Engellemek | Genel kategori |
Notlar | |
---|---|---|---|---|---|---|---|---|---|
karakter tablosu | U+0009 | 9 | Evet | Numara | Yaygın | Temel Latince | Diğer, kontrol |
HT, Yatay Sekme . HTML/XML adlı varlık : 	 , LaTeX : '\tab'
|
|
satır besleme | U+000A | 10 | satır sonu mu | Yaygın | Temel Latince | Diğer, kontrol |
LF, Satır besleme . HTML/XML adlı varlık:

|
||
satır tablosu | U+000B | 11 | satır sonu mu | Yaygın | Temel Latince | Diğer, kontrol |
VT, Dikey Sekme | ||
form besleme | U+000C | 12 | satır sonu mu | Yaygın | Temel Latince | Diğer, kontrol |
FF, Form beslemesi | ||
satırbaşı | U+000D | 13 | satır sonu mu | Yaygın | Temel Latince | Diğer, kontrol |
CR, Satır başı | ||
Uzay | U+0020 | 32 | Evet | Numara | Yaygın | Temel Latince | Ayırıcı, boşluk |
En yaygın (normal ASCII alanı) | |
Sonraki satır | U+0085 | 133 | satır sonu mu | Yaygın | Latin-1 Eki |
Diğer, kontrol |
NEL, Sonraki satır | ||
kesintisiz alan | U+00A0 | 160 | Numara | Numara | Yaygın | Latin-1 Eki |
Ayırıcı, boşluk |
Bölünemez boşluk : U+0020 ile aynıdır, ancak bir çizginin kesilebileceği bir nokta değildir. HTML/XML adlı varlık: , LaTeX: '\'
|
|
ogham boşluk işareti | U+1680 | 5760 | Evet | Numara | Ogham | Ogham | Ayırıcı, boşluk |
Kullanılan interword ayrılık içinde Ogham metni. Normalde dikey metinde dikey bir satır veya yatay metinde yatay bir satır, ancak "stemless" yazı tiplerinde boşluk da olabilir. Bir Ogham yazı tipi gerektirir. | |
dörtlü | U+2000 | 8192 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Birinin genişliği tr . U+2002, bu karaktere kanonik olarak eşdeğerdir; U+2002 tercih edilir. | |
dörtlü | U+2001 | 8193 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Ayrıca "koyun eti dörtlü" olarak da bilinir. Bir em genişliği . U+2003, bu karaktere kurallı olarak eşdeğerdir; U+2003 tercih edilir. | |
uzayda | U+2002 | 8194 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
"Fındık" olarak da bilinir. Birinin genişliği tr . U+2000 En Quad, bu karaktere kanonik olarak eşdeğerdir; U+2002 tercih edilir. HTML/XML adlı varlık:   , LaTeX: '\enspace'
|
|
boşluk | U+2003 | 8195 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Ayrıca "koyun" olarak da bilinir. Bir em genişliği . U+2001 Em Quad, kanonik olarak bu karaktere eşdeğerdir; U+2003 tercih edilir. HTML/XML adlı varlık:   , LaTeX: '\quad'
|
|
em başına üç boşluk | U+2004 | 8196 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
"Kalın boşluk" olarak da bilinir. Em genişliğinde üçte biri. HTML/XML adlı varlık: 
|
|
em başına dört boşluk | U+2005 | 8197 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
"Orta boşluk" olarak da bilinir. Em genişliğinin dörtte biri. HTML/XML adlı varlık: 
|
|
em başına altı boşluk | U+2006 | 8198 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Em genişliğinin altıda biri. Bilgisayar tipografisinde, bazen U+2009'a eşittir. | |
şekil uzayı | U+2007 | 8199 | Numara | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Şekil alanı . Tek aralıklı basamaklı yazı tiplerinde, bir basamağın genişliğine eşit. HTML/XML adlı varlık: 
|
|
noktalama alanı | U+2008 | 8200 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Bir yazı tipindeki dar noktalama işaretleri kadar geniş, yani nokta veya virgülün ilerleme genişliği. HTML/XML adlı varlık: 
|
|
ince boşluk | U+2009 | 8201 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
İnce boşluk ; em genişliğinin beşte biri (bazen altıda biri). SI birimleri ile yapılan ölçümlerde binlik ayırıcı olarak kullanılması önerilir . U+2002'den U+2008'e kadar olanlardan farklı olarak, genişliği dizgide ayarlanabilir. HTML/XML adlı varlık: ; LaTeX: '\,'
  |
|
saç alanı | U+200A | 8202 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
İnce bir boşluktan daha ince. HTML/XML adlı varlık:   ( tüm tarayıcılarda çalışmaz )
|
|
satır ayırıcı | U+2028 | 8232 | satır sonu mu | Yaygın | Genel Noktalama |
Ayırıcı, çizgi |
|||
paragraf ayırıcı | U+2029 | 8233 | satır sonu mu | Yaygın | Genel Noktalama |
Ayırıcı, paragraf |
|||
dar kırılmaz alan | U+202F | 8239 | Numara | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
Dar, kırılmaz alan . U+00A0 Kesintisiz Alan işlevine benzer. Moğolca ile kullanıldığında genişliği genellikle normal boşluğun üçte biri kadardır; diğer bağlamda, genişliği bazen İnce Uzay'ın genişliğine benzer (U+2009). | |
orta matematiksel uzay | U+205F | 8287 | Evet | Numara | Yaygın | Genel Noktalama |
Ayırıcı, boşluk |
MMSP. Matematiksel formüllerde kullanılır. Bir em'in on sekizde dördü. Matematiksel tipografide, boşlukların genişlikleri genellikle bir em'nin on sekizde birinin tam katları olarak verilir ve 4/18 em birkaç durumda kullanılabilir, örneğin, a ile + arasında ve + ile b arasında. a + b ifadesi . HTML/XML adlı varlık: 
|
|
ideografik alan | U+3000 | 12288 | Evet | Numara | Yaygın | CJK Sembolleri ve Noktalama İşaretleri |
Ayırıcı, boşluk |
Bir CJK karakter hücresi kadar geniş (tam genişlik ). Örneğin, tai tou'da kullanılır . |
İsim | kod noktası | Genişlik kutusu | kırılabilir mi? | In IDN ? |
Senaryo | Engellemek | Genel kategori |
Notlar | |
---|---|---|---|---|---|---|---|---|---|
moğolca ünlü ayırıcı | U+180E | 6158 | | Evet | Numara | Moğolca | Moğolca | Diğer, Biçim |
MVS. Moğolca'da bir kelimenin son iki karakterinin farklı şekiller almasına neden olmak için kullanılan dar boşluk karakteri. Standardın önceki sürümlerinde olmasına rağmen, Unicode 6.3.0'da artık boşluk karakteri (yani Zs kategorisinde) olarak sınıflandırılmamaktadır. |
sıfır genişlikli boşluk | U+200B | 8203 | | Evet | Numara | ? | Genel Noktalama |
Diğer, Biçim |
ZWSP, sıfır genişlikli uzay . Açık boşluk kullanmayan komut dosyaları kullanılırken metin işleme sistemlerine sözcük sınırlarını belirtmek için kullanılır. Yumuşak kısa çizgiye benzer , ancak sonuncusu hece sınırlarını belirtmek için kullanılır ve satır kesildiğinde görünür bir kısa çizgi göstermelidir. HTML/XML adlı varlık :​
|
sıfır genişlikli marangoz olmayan | U+200C | 8204 | | Evet | bağlama bağlı | ? | Genel Noktalama |
Diğer, Biçim |
ZWNJ, sıfır genişlikli marangoz olmayan . Aksi takdirde bağlanacak iki karakter arasına yerleştirildiğinde, bir ZWNJ bunların sırasıyla son ve ilk biçimlerinde yazdırılmasına neden olur. HTML/XML adlı varlık:‌
|
sıfır genişlik marangoz | U+200D | 8205 | | Evet | bağlama bağlı | ? | Genel Noktalama |
Diğer, Biçim |
ZWJ, sıfır genişlikli marangoz . Aksi takdirde bağlanmayacak iki karakter arasına yerleştirildiğinde, bir ZWJ bunların bağlı formlarında yazdırılmasına neden olur. Birleştirme formlarını ayrı ayrı görüntülemek için de kullanılabilir. Varsayılan olarak bir bitişik harf veya bağlaç beklenip beklenmemesine bağlı olarak, tek bir glif ile ikameyi tetikleyebilir ( emoji ve Sinhala'da olduğu gibi ) veya bastırabilir ( Devanagari'de olduğu gibi ), yine de bireysel birleştirme formlarının kullanımına izin verirken (ZWNJ'den farklı olarak). HTML/XML adlı varlık:‍
|
kelime birleştirici | U+2060 | 8288 | | Numara | Numara | ? | Genel Noktalama |
Diğer, Biçim |
WJ, kelime birleştirici . U+200B'ye benzer, ancak bir çizginin kesilebileceği bir nokta değil. HTML/XML adlı varlık:⁠
|
sıfır genişlikte bölünmeyen boşluk | U+FEFF | 65279 | | Numara | Numara | ? | Arapça Sunum Formları-B |
Diğer, Biçim |
Sıfır genişlikte kırılmaz boşluk . Öncelikle Bayt Sırası İşareti olarak kullanılır . Bozulmama göstergesi olarak kullanım, Unicode 3.2'den itibaren kullanımdan kaldırılmıştır; bunun yerine U+2060'a bakın. |
yedek resimler
Unicode ayrıca, görünür bir sembolün görüntülenmesi gereken bağlamlarda çeşitli boşluk karakterlerini temsil etmek için kullanılabilecek bazı görünür karakterler sağlar:
kod | Ondalık | İsim | Engellemek | Görüntülemek | Açıklama |
---|---|---|---|---|---|
U+00B7 | 183 | orta nokta | Latin-1 Eki | · |
Interpunct Adlandırılmış varlık: ·
|
U+21A1 | 8609 | Aşağı doğru iki başlı ok | Oklar | ↡ | Form beslemesi için ECMA-17 / ISO 2047 sembolü (sayfa sonu) |
U+2261 | 8810 | özdeş | Matematiksel Operatörler |
≡ | Diğer kullanımların yanı sıra satır besleme için ECMA-17 / ISO 2047 sembolüdür |
U+237D | 9085 | Omuzlu açık kutu | Çeşitli Teknik | ⍽ | Bir NBSP belirtmek için kullanılır |
U+23CE | 9166 | Dönüş sembolü | Çeşitli Teknik | ⏎ | Satır sonu giren bir dönüş anahtarı sembolü |
U+2409 | 9225 | Yatay tablolama için sembol | Kontrol Resimleri | ␉ | Sekme karakterinin yedekleri |
U+240A | 9226 | Satır besleme için sembol | Kontrol Resimleri | ␊ | Satır besleme için yedekler |
U+240B | 9227 | Dikey tablolama için sembol | Kontrol Resimleri | ␋ | Dikey sekmenin yedekleri (çizgi sekmesi) |
U+240C | 9228 | Form beslemesi için sembol | Kontrol Resimleri | ␌ | Form beslemesi için yedekler (sayfa sonu) |
U+240D | 9229 | Satır başı için sembol | Kontrol Resimleri | ␍ | Bir satır başı için yedekler |
U+2420 | 9248 | Uzay için sembol | Kontrol Resimleri | ␠ | Bir ASCII alanı için yedekler |
U+2422 | 9250 | Boş sembol | Kontrol Resimleri | ␢ | BCDIC , EBCDIC , ASCII-1963 vb.'de sözcük ayırıcı için bir sembol olarak kullanılan "boş ikame" olarak da bilinir |
U+2423 | 9251 | Açık kutu | Kontrol Resimleri | ␣ | En azından 1980'lerden beri, boşluk karakterlerinin sayısını açıkça belirtmek gerektiğinde (örneğin kalem ve kağıt ile programlama yaparken ) blok harf el yazısında kullanılır . Bir ders kitabında (1982, 1984, 1985, 1988 Springer-Verlag tarafından yayınlanmıştır) boşluk kodlarının açık bir gösterge gerektirdiği bir programlama dili olan Modula-2'de kullanılır . Ayrıca tuş takımı kullanılan Texas Instruments' TI-8 x serisi içinde grafiğini hesap makineleri . Adlandırılmış varlık: ␣
|
U+2424 | 9252 | Yeni satır için sembol | Kontrol Resimleri |  | Satır sonu için yedekler |
U+25B3 | 9651 | Beyaz yukarı dönük üçgen | Geometrik şekiller | △ | Diğer kullanımların yanı sıra, ASCII alanı için ECMA-17 / ISO 2047 sembolüdür. |
U+2A5B | 10843 | Mantıksal Veya orta saplı | Tamamlayıcı Matematiksel Operatörler |
⩛ | Diğer kullanımların yanı sıra, dikey sekme (çizgi sekmesi) için ECMA-17 / ISO 2047 sembolüdür. |
U+2AAA | 10922 | Daha küçük | Tamamlayıcı Matematiksel Operatörler |
⪪ | Diğer kullanımların yanı sıra, satır başı için ECMA-17 / ISO 2047 sembolüdür |
U+2AAB | 10923 | Daha geniş | Tamamlayıcı Matematiksel Operatörler |
⪫ | Diğer kullanımların yanı sıra sekme karakteri için ECMA-17 / ISO 2047 sembolüdür. |
U+3037 | 12343 | İdeografik Telgraf Satır Besleme Ayırıcı Sembolü |
CJK Sembolleri ve Noktalama İşaretleri |
〷 | Çin telgraf kodunda 9999 kodu için kullanılan ve bir hat beslemesini temsil eden grafik |
- ^ Sıfır "0" veya negatif "(‒)" tuşunun üstünde.
- tam boşluk
- Cambridge Z88 özel bir "tam boşluk" (0xA0 aka kod noktası 160) (anahtar kısayol tarafından Invokable sağlanan ⌑+ SPACEişletim sisteminin ekran sürücüsü tarafından olarak gösterilir), "...". Bu nedenle BBC BASIC ile birlikte "nokta alanı" olarak da biliniyordu .
- 224 (0xE0) kod noktası altında, bilgisayar ayrıca özel bir üç karakterli hücre genişliğinde BOŞLUK sembolü "SPC" sağladı (Unicode'un tek hücre genişliğindeki U+2420'sine benzer).
Boşluk olmayan boşluklar
- Kabartma Grafikleri Unicode bloğu içeren U +, 2800 ⠀ BRAİLLE KALIP BOŞ (HTML
⠀
) bir kabartma bir noktalı desen kaldırdı. Bazı yazı tipleri, karakteri sabit genişlikte bir boşluk olarak görüntüler, ancak Unicode standardı açıkça bunun bir boşluk işlevi görmediğini belirtir. - Unicode'un Kore alfabesi kapsamı, yazılı bir harfin olmadığını gösteren ve dolayısıyla bir glif göstermeyen birkaç kod noktası içerir:
- Unicode, Hangul Uyumluluk Jamo bloğunda ( U+3164 ㅤ HANGUL FILLER (HTML )) bir Hangul Dolgusu karakteri içerir . Bu bir harf olarak sınıflandırılır, ancak jamo içermeyen bir Hangul bloğu gibi boş bir alan olarak görüntülenir. Bu kullanılan KS x 1001 tanıştırmak veya bir pozisyonda bir harf yokluğunu belirtmek için dizileri birleştirme Hangul ancak Unicode'un birleştiren jamo sisteminde.
ㅤ
- Unicode'un birleşik jamo sistemi benzer Hangul Choseong Filler ve Hangul Jungseong Filler karakterlerini kullanarak, Hangul Jamo bloğuna dahil edilen bir hece bloğu içinde ilk veya orta konumda bir harfin olmadığını belirtmek için ( U+115F ᅟ HANGUL CHOSEONG FILLER (HTML
ᅟ
) , U+1160 ᅠ HANGUL JUNGSeonG FILLER (HTMLᅠ
)). - Buna ek olarak, bir Yarım genişlik Hangul Dolgu dahildir Yarım genişlik ve Fullwidth Forms ( u + FFA0 ㅤ yarı genişlik HANGUL DOLGU (HTML
ᅠ
hem karakterleri içeren kodlamaları gelen zaman eşleme kullanılır)), Johab (veya Wansung ) ve N-byte Hangul ( veya EBCDIC muadili), örneğin hem Johab hem de EBCDIC doldurucularını içeren IBM-933 gibi.
- Unicode, Hangul Uyumluluk Jamo bloğunda ( U+3164 ㅤ HANGUL FILLER (HTML )) bir Hangul Dolgusu karakteri içerir . Bu bir harf olarak sınıflandırılır, ancak jamo içermeyen bir Hangul bloğu gibi boş bir alan olarak görüntülenir. Bu kullanılan KS x 1001 tanıştırmak veya bir pozisyonda bir harf yokluğunu belirtmek için dizileri birleştirme Hangul ancak Unicode'un birleştiren jamo sisteminde.
Boşluk ve dijital tipografi
Ekran görüntüsü
Metin düzenleyiciler , kelime işlemciler ve masaüstü yayıncılık yazılımları , ekrandaki boşlukları nasıl temsil ettikleri ve satırların sonundaki ekran veya sütun genişliğinden daha uzun boşlukları nasıl temsil ettikleri bakımından farklılık gösterir. Bazı durumlarda, boşluklar yalnızca boşluk olarak gösterilir; diğer durumlarda, bir ara nokta veya başka sembollerle temsil edilebilirler . Boşluk oluşturmak için birçok farklı karakter (aşağıda açıklanmıştır) kullanılabilir ve karakter olmayan işlevler (kenar boşlukları ve sekme ayarları gibi) de boşlukları etkileyebilir.
Değişken genişlikli genel amaçlı alan
Bilgisayar karakter kodlamalarında , genişliği yazı tipinin tasarımına göre değişen normal bir genel amaçlı boşluk (Unicode karakter U+0020) vardır. Tipik değerler 1/5 em ile 1/3 em arasında değişir (dijital tipografide em , yazı tipinin nominal boyutuna eşittir, bu nedenle 10 puntoluk bir yazı tipi için boşluk muhtemelen 2 ile 3,3 punto arasında olacaktır). Gelişmiş yazı tiplerinde kalın, italik ve küçük büyük harfli yüzler için farklı boyutta boşluklar olabilir ve genellikle birleştiriciler metnin boyutuna ve belirginliğine bağlı olarak boşluğun genişliğini manuel olarak ayarlar.
Bu genel amaçlı alana ek olarak, belirli bir genişlikte bir alanı kodlamak mümkündür. Tam bir liste için aşağıdaki tabloya bakın.
Kısa çizgilerin etrafındaki saç boşlukları
Parantez içinde ayırıcı olarak kullanılan uzun tireler ve sözcük birleştirici olarak kullanıldığında uzun tireler genellikle metinle sürekli olarak ayarlanır. Ancak, böyle bir çizgi isteğe bağlı olarak bir saç boşluğu , U+200A veya ince boşluk , U+2009 ile çevrelenebilir . İnce boşluk , veya sayısal karakter referansları  
veya  
adlandırılmış varlık kullanılarak HTML'de yazılabilir  
, ancak 2016'dan itibaren henüz tarayıcılarda evrensel olarak desteklenmemektedir. İnce boşluk , varlık  
ve sayısal referanslar  
veya olarak adlandırılır  
. Bu boşluklar normal boşluktan çok daha incedir ( tek boşluklu (orantısız) yazı tipi hariç ), saç boşluğu ikisinin daha incesidir.
Kısa çizgi ile normal boşluk | sol sağ |
---|---|
Kısa çizgi ile ince boşluk | sol - sağ |
Kısa çizgi ile saç alanı | sol sağ |
Kısa çizgi ile boşluk yok | sol sağ |
bilgi işlem uygulamaları
Programlama dilleri
Gelen dil programlama sözdizimi, boşluk sık açıkça ayrı kullanılır jeton . Çoğu dilde, birden çok boşluk karakterine tek bir boşluk karakteri gibi davranılır (tırnak içine alınmış dizelerin dışında); bu tür dillere serbest biçim denir . Haskell , occam , ABC ve Python dahil olmak üzere birkaç dilde boşluk ve girinti sözdizimsel amaçlar için kullanılır. Boşluk adı verilen hiciv dilinde , boşluk karakterleri programlama için tek geçerli karakterlerdir, diğer karakterler yoksayılır.
Aşırı boşluk kullanımı, özellikle satırların sonundaki boşluklar bir sıkıntı olarak kabul edilir. Ancak boşlukların doğru kullanımı kodun okunmasını kolaylaştırabilir ve grupla ilgili mantığa yardımcı olabilir.
Çoğu dil yalnızca ASCII karakterlerini boşluk olarak tanır veya bazı durumlarda Unicode yeni satırları da tanır, ancak yukarıda listelenen karakterlerin çoğunu tanımaz. C dili karakterleri "alanı, yatay sekme, yeni satır, dikey sekme ve form besleme" olduğu boşluk tanımlar. HTTP , sadece uzay karakter: ağ protokolü gibi protokol farklı bölgelerinde kullanılmak üzere boşluk farklı gerektiren durumu bir hat sonunda hattı, CRLF ve "doğrusal boşluk" başlık değerlerinde.
Komut satırı kullanıcı arayüzleri
Komut işlemcileri tarafından işlenen komutlarda , örneğin komut dosyalarında ve yazılanlarda, boşluk karakteri iki olası işlevi olduğundan sorunlara neden olabilir: bir komut veya parametrenin parçası olarak veya bir parametre veya ad ayırıcı olarak . Belirsizlik, gömülü boşlukları yasaklayarak veya bir adı tırnak karakterleri arasına gömülü boşluklar ekleyerek önlenebilir.
İşaretleme dilleri
SGML gibi bazı biçimlendirme dilleri boşlukları yazıldığı gibi korur.
XML ve HTML gibi web işaretleme dilleri , programcıların rahatlığı için boşluk karakterleri de dahil olmak üzere boşluk karakterlerini özel olarak ele alır. Bu biçimlendirme dillerinin uygun görüntüleme zamanı işlemcileri tarafından okunan bir veya daha fazla boşluk karakteri , anlamsal bağlamlarına bağlı olarak 0 veya 1 boşluğa daraltılır. Örneğin, metin içindeki çift (veya daha fazla) boşluk, tek bir boşluğa daraltılır ve =
bir öznitelik adını değerinden ayıran " " öğesinin her iki tarafında görünen boşlukların belgenin yorumlanması üzerinde hiçbir etkisi yoktur. Öğe bitiş etiketleri, sonunda boşluklar içerebilir ve XML'deki boş öğe etiketleri, " />
" işaretinden önce boşluk içerebilir . Bu dillerde gereksiz boşluk dosya boyutunu artırır ve bu nedenle ağ aktarımlarını yavaşlatabilir. Öte yandan, gereksiz boşluk, koddaki yorumlara benzer, ancak daha az belirgin olan, göze çarpmayan bir şekilde kodu işaretleyebilir. Bu, kopyalayıp yapıştırarak işlenen bir lisans veya telif hakkı ihlalini kanıtlamak için istenebilir .
XML öznitelik değerlerinde, belge bir ayrıştırıcı tarafından okunduğunda boşluk karakterlerinin dizileri tek bir boşluk olarak kabul edilir. XML öğe içeriğindeki boşluk, ayrıştırıcı tarafından bu şekilde değiştirilmez, ancak ayrıştırıcıdan bilgi alan bir uygulama, öğe içeriğine benzer kurallar uygulamayı seçebilir. Bir XML belgesi yazarı xml:space="preserve"
, ayrıştırıcıya, aşağı akış uygulamasının o öğenin içeriğindeki boşlukları değiştirmesini engelleme talimatını vermek için bir öğedeki özniteliği kullanabilir .
Çoğu HTML öğesinde , bir boşluk karakteri dizisi, normalde sözcükler arasına bu tür boşluklar ekleyen bir dilde metin oluşturulurken tek bir boşluk karakteri olarak ortaya çıkabilen tek bir sözcük arası ayırıcı olarak ele alınır . Uyumlu HTML oluşturucuların, pre
etiket ve benzeri boşluk işlemeyi uygulamak için CSS'nin kullanıldığı herhangi bir öğe gibi önceden belirlenmiş birkaç öğe içinde daha gerçek bir pre
boşluk işlemi uygulaması gerekir . Bu tür öğelerde, boşluk karakterleri sözcükler arası ayırıcılara "daraltılmaz".
Hem XML'de hem de HTML'de, diğer "standart olmayan" boşluklarla birlikte, bölünemez boşluk karakteri daraltılabilir "boşluk" olarak ele alınmaz, bu nedenle yukarıdaki kurallara tabi değildir.
Dosya adları
Bu tür kullanım, işletim sistemleri ve gömülü alan kodlarıyla karıştırılan uygulamalar için yazılmış çok sözcüklü dosya adlarına benzer; bu tür dosya adları bunun yerine sözcük ayırıcı olarak bir alt çizgi (_) kullanır , as_in_this_phrase.
Bu tür başka bir sembol U+2422 ␢ BOŞ SEMBOL'dü . Bu, bilgisayar programlamanın ilk yıllarında kodlama formlarına yazarken kullanıldı. Tuş vuruşu operatörleri, sembolü hemen "açık alan" olarak tanıdı. Bu kullanıldı BCDIC , EBCDIC ve ASCII-1963 .
Ayrıca bakınız
- Satırbaşı
- Em (tipografi)
- Tr (tipografi)
- Form besleme
- girinti stili
- Satır besleme
- Yeni hat
- Programlama stili
- Mors kodu için prosigns
- Beyaz boşluk karakter sınıfı için normal ifade#Karakter sınıfları .
- boşluk çubuğu
- Boşluk (noktalama)
- Tab tuşu
- Kırpma (bilgisayar programlama)
- Boşluk (programlama dili)
- Sıfır genişlikli alan