Boşluk karakteri - Whitespace character

Gelen bilgisayar programlama , boşluk herhangi bir karakter veya yatay veya dikey temsil karakter dizisi alanını içinde tipografi . İşlendiğinde, boşluk karakteri görünür bir işarete karşılık gelmez, ancak genellikle sayfada bir alanı kaplar. Örneğin, ortak boşluk sembolü U+0020 SPACE (ayrıca ASCII 32) , Batı alfabelerinde sözcük ayırıcı olarak kullanılan metinde bir boşluk noktalama karakterini temsil eder .  

genel bakış

Unicode'da çeşitli boşlukların göreli genişlikleri

Birçok klavye düzeninde, bir boşluk karakteri kullanılarak bir boşluk karakteri girilebilir spacebar. Boşluğun Tab ↹uzunluğu değişebilse de, tuşun kullanımıyla birçok klavyede yatay boşluk da girilebilir . Dikey boşluk, nasıl kodlandığına göre biraz daha çeşitlidir, ancak yazmada en belirgin olanı, ↵ Enteruygulama programlarında bir 'yeni satır' kod dizisi oluşturan sonuçtur. Daha eski klavyeler, bunun yerine Return, sol durağa elektromekanik bir dönüş (ASCII- hex &0D;'de CR kodu ) ve bir satır besleme veya sonraki satıra hareket (ASCII'de LF kodu) oluşturan daktilo klavyesini kısaltarak 'Satır-Dönüş' anlamına gelebilir . -hex &0A;); bazı uygulamalarda bunlar bağımsız olarak monitörlerde metin hücresi tabanlı ekranlar çizmek veya traktör kılavuzlu yazıcılarda yazdırmak için kullanıldı; bu, metin tabanlı çıktı cihazlarının daha karmaşık çıktılar elde etmesine izin veren ters hareketler/konumlandırma kod dizileri de içerebilir. Birçok eski bilgisayar oyunu bu tür kodları bir ekran çizmek için kullandı (örneğin Kroz Krallığı ) ve kelime işlemci yazılımı bunu kalın, altı çizili ve üstü çizili gibi basılı efektler üretmek için kullanırdı.

"Boşluk" terimi, sıradan kağıt üzerinde elde edilen görünüme dayanmaktadır . Ancak, bir uygulama içinde kodlanırlar, boşluk diğer herhangi bir karakter koduyla aynı şekilde işlenebilir ve programlar, oluştukları bağlam için tanımlandığı gibi uygun eylemi yapabilir.

Tanım ve belirsizlik

En yaygın boşluk karakterleri boşluk çubuğu veya sekme tuşu aracılığıyla yazılabilir . Bağlama bağlı olarak, return veya enter tuşu tarafından oluşturulan bir satır sonu da boşluk olarak kabul edilebilir.

tek kod

Aşağıdaki tablo, Unicode Karakter Veritabanında boşluk ("WSpace=Y", "WS") karakterleri olarak tanımlanan yirmi beş karakteri listeler . On yedi, çift ​​yönlü yazma ("İki Yönlü Karakter Türü=WS") algoritmasıyla tutarlı bir boşluk tanımı kullanır ve "Bidi-WS" karakterleri olarak bilinir. Kalan karakterler de kullanılabilir, ancak bu "Bidi" türünde değildir.

Not: Aşağıdaki tabloyu görüntülemek için kullanılan tarayıcıya ve yazı tiplerine bağlı olarak, tüm boşluklar düzgün görüntülenmeyebilir.

İsim kod noktası Genişlik kutusu kırılabilir mi? In
IDN ?
Senaryo Engellemek Genel
kategori
Notlar
karakter tablosu U+0009 9 Evet Numara Yaygın Temel Latince Diğer,
kontrol
HT, Yatay Sekme . HTML/XML adlı varlık : 	, LaTeX : '\tab'
satır besleme U+000A 10 satır sonu mu Yaygın Temel Latince Diğer,
kontrol
LF, Satır besleme . HTML/XML adlı varlık:

satır tablosu U+000B 11 satır sonu mu Yaygın Temel Latince Diğer,
kontrol
VT, Dikey Sekme
form besleme U+000C 12 satır sonu mu Yaygın Temel Latince Diğer,
kontrol
FF, Form beslemesi
satırbaşı U+000D 13 satır sonu mu Yaygın Temel Latince Diğer,
kontrol
CR, Satır başı
Uzay U+0020 32 Evet Numara Yaygın Temel Latince Ayırıcı,
boşluk
En yaygın (normal ASCII alanı)
Sonraki satır U+0085 133 satır sonu mu Yaygın Latin-1
Eki
Diğer,
kontrol
NEL, Sonraki satır
kesintisiz alan U+00A0 160   Numara Numara Yaygın Latin-1
Eki
Ayırıcı,
boşluk
Bölünemez boşluk : U+0020 ile aynıdır, ancak bir çizginin kesilebileceği bir nokta değildir. HTML/XML adlı varlık:  , LaTeX: '\'
ogham boşluk işareti U+1680 5760 Evet Numara Ogham Ogham Ayırıcı,
boşluk
Kullanılan interword ayrılık içinde Ogham metni. Normalde dikey metinde dikey bir satır veya yatay metinde yatay bir satır, ancak "stemless" yazı tiplerinde boşluk da olabilir. Bir Ogham yazı tipi gerektirir.
dörtlü U+2000 8192   Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Birinin genişliği tr . U+2002, bu karaktere kanonik olarak eşdeğerdir; U+2002 tercih edilir.
dörtlü U+2001 8193 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Ayrıca "koyun eti dörtlü" olarak da bilinir. Bir em genişliği . U+2003, bu karaktere kurallı olarak eşdeğerdir; U+2003 tercih edilir.
uzayda U+2002 8194 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
"Fındık" olarak da bilinir. Birinin genişliği tr . U+2000 En Quad, bu karaktere kanonik olarak eşdeğerdir; U+2002 tercih edilir. HTML/XML adlı varlık:  , LaTeX: '\enspace'
boşluk U+2003 8195 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Ayrıca "koyun" olarak da bilinir. Bir em genişliği . U+2001 Em Quad, kanonik olarak bu karaktere eşdeğerdir; U+2003 tercih edilir. HTML/XML adlı varlık:  , LaTeX: '\quad'
em başına üç boşluk U+2004 8196 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
"Kalın boşluk" olarak da bilinir. Em genişliğinde üçte biri. HTML/XML adlı varlık: 
em başına dört boşluk U+2005 8197 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
"Orta boşluk" olarak da bilinir. Em genişliğinin dörtte biri. HTML/XML adlı varlık: 
em başına altı boşluk U+2006 8198 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Em genişliğinin altıda biri. Bilgisayar tipografisinde, bazen U+2009'a eşittir.
şekil uzayı U+2007 8199 Numara Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Şekil alanı . Tek aralıklı basamaklı yazı tiplerinde, bir basamağın genişliğine eşit. HTML/XML adlı varlık: 
noktalama alanı U+2008 8200 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Bir yazı tipindeki dar noktalama işaretleri kadar geniş, yani nokta veya virgülün ilerleme genişliği. HTML/XML adlı varlık: 
ince boşluk U+2009 8201 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
İnce boşluk ; em genişliğinin beşte biri (bazen altıda biri). SI birimleri ile yapılan ölçümlerde binlik ayırıcı olarak kullanılması önerilir . U+2002'den U+2008'e kadar olanlardan farklı olarak, genişliği dizgide ayarlanabilir. HTML/XML adlı varlık: ; LaTeX: '\,'  
saç alanı U+200A 8202 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
İnce bir boşluktan daha ince. HTML/XML adlı varlık:  ( tüm tarayıcılarda çalışmaz )
satır ayırıcı U+2028 8232 satır sonu mu Yaygın Genel
Noktalama
Ayırıcı,
çizgi
paragraf ayırıcı U+2029 8233 satır sonu mu Yaygın Genel
Noktalama
Ayırıcı,
paragraf
dar kırılmaz alan U+202F 8239 Numara Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
Dar, kırılmaz alan . U+00A0 Kesintisiz Alan işlevine benzer. Moğolca ile kullanıldığında genişliği genellikle normal boşluğun üçte biri kadardır; diğer bağlamda, genişliği bazen İnce Uzay'ın genişliğine benzer (U+2009).
orta matematiksel uzay U+205F 8287 Evet Numara Yaygın Genel
Noktalama
Ayırıcı,
boşluk
MMSP. Matematiksel formüllerde kullanılır. Bir em'in on sekizde dördü. Matematiksel tipografide, boşlukların genişlikleri genellikle bir em'nin on sekizde birinin tam katları olarak verilir ve 4/18 em birkaç durumda kullanılabilir, örneğin, a ile + arasında ve + ile b arasında. a + b ifadesi . HTML/XML adlı varlık: 
ideografik alan U+3000 12288   Evet Numara Yaygın CJK Sembolleri
ve
Noktalama İşaretleri
Ayırıcı,
boşluk
Bir CJK karakter hücresi kadar geniş (tam genişlik ). Örneğin, tai tou'da kullanılır .
 İsim  kod noktası Genişlik kutusu kırılabilir mi? In
IDN ?
Senaryo Engellemek Genel
kategori
Notlar
moğolca ünlü ayırıcı U+180E 6158 Evet Numara Moğolca Moğolca Diğer,
Biçim
MVS. Moğolca'da bir kelimenin son iki karakterinin farklı şekiller almasına neden olmak için kullanılan dar boşluk karakteri. Standardın önceki sürümlerinde olmasına rağmen, Unicode 6.3.0'da artık boşluk karakteri (yani Zs kategorisinde) olarak sınıflandırılmamaktadır.
sıfır genişlikli boşluk U+200B 8203 Evet Numara ? Genel
Noktalama
Diğer,
Biçim
ZWSP, sıfır genişlikli uzay . Açık boşluk kullanmayan komut dosyaları kullanılırken metin işleme sistemlerine sözcük sınırlarını belirtmek için kullanılır. Yumuşak kısa çizgiye benzer , ancak sonuncusu hece sınırlarını belirtmek için kullanılır ve satır kesildiğinde görünür bir kısa çizgi göstermelidir. HTML/XML adlı varlık :​
sıfır genişlikli marangoz olmayan U+200C 8204 Evet bağlama bağlı ? Genel
Noktalama
Diğer,
Biçim
ZWNJ, sıfır genişlikli marangoz olmayan . Aksi takdirde bağlanacak iki karakter arasına yerleştirildiğinde, bir ZWNJ bunların sırasıyla son ve ilk biçimlerinde yazdırılmasına neden olur. HTML/XML adlı varlık:‌
sıfır genişlik marangoz U+200D 8205 Evet bağlama bağlı ? Genel
Noktalama
Diğer,
Biçim
ZWJ, sıfır genişlikli marangoz . Aksi takdirde bağlanmayacak iki karakter arasına yerleştirildiğinde, bir ZWJ bunların bağlı formlarında yazdırılmasına neden olur. Birleştirme formlarını ayrı ayrı görüntülemek için de kullanılabilir. Varsayılan olarak bir bitişik harf veya bağlaç beklenip beklenmemesine bağlı olarak, tek bir glif ile ikameyi tetikleyebilir ( emoji ve Sinhala'da olduğu gibi ) veya bastırabilir ( Devanagari'de olduğu gibi ), yine de bireysel birleştirme formlarının kullanımına izin verirken (ZWNJ'den farklı olarak). HTML/XML adlı varlık:‍
kelime birleştirici U+2060 8288 Numara Numara ? Genel
Noktalama
Diğer,
Biçim
WJ, kelime birleştirici . U+200B'ye benzer, ancak bir çizginin kesilebileceği bir nokta değil. HTML/XML adlı varlık:⁠
sıfır genişlikte bölünmeyen boşluk U+FEFF 65279  Numara Numara ? Arapça
Sunum
Formları-B
Diğer,
Biçim
Sıfır genişlikte kırılmaz boşluk . Öncelikle Bayt Sırası İşareti olarak kullanılır . Bozulmama göstergesi olarak kullanım, Unicode 3.2'den itibaren kullanımdan kaldırılmıştır; bunun yerine U+2060'a bakın.

yedek resimler

Unicode ayrıca, görünür bir sembolün görüntülenmesi gereken bağlamlarda çeşitli boşluk karakterlerini temsil etmek için kullanılabilecek bazı görünür karakterler sağlar:

Unicode boşluk gösteren karakterler (görünür)
kod Ondalık İsim Engellemek Görüntülemek Açıklama
U+00B7 183 orta nokta Latin-1 Eki · Interpunct
Adlandırılmış varlık:·
U+21A1 8609 Aşağı doğru iki başlı ok Oklar Form beslemesi için ECMA-17 / ISO 2047 sembolü (sayfa sonu)
U+2261 8810 özdeş Matematiksel
Operatörler
Diğer kullanımların yanı sıra satır besleme için ECMA-17 / ISO 2047 sembolüdür
U+237D 9085 Omuzlu açık kutu Çeşitli Teknik Bir NBSP belirtmek için kullanılır
U+23CE 9166 Dönüş sembolü Çeşitli Teknik Satır sonu giren bir dönüş anahtarı sembolü
U+2409 9225 Yatay tablolama için sembol Kontrol Resimleri Sekme karakterinin yedekleri
U+240A 9226 Satır besleme için sembol Kontrol Resimleri Satır besleme için yedekler
U+240B 9227 Dikey tablolama için sembol Kontrol Resimleri Dikey sekmenin yedekleri (çizgi sekmesi)
U+240C 9228 Form beslemesi için sembol Kontrol Resimleri Form beslemesi için yedekler (sayfa sonu)
U+240D 9229 Satır başı için sembol Kontrol Resimleri Bir satır başı için yedekler
U+2420 9248 Uzay için sembol Kontrol Resimleri Bir ASCII alanı için yedekler
U+2422 9250 Boş sembol Kontrol Resimleri BCDIC , EBCDIC , ASCII-1963 vb.'de sözcük ayırıcı için bir sembol olarak kullanılan "boş ikame" olarak da bilinir
U+2423 9251 Açık kutu Kontrol Resimleri En azından 1980'lerden beri, boşluk karakterlerinin sayısını açıkça belirtmek gerektiğinde (örneğin kalem ve kağıt ile programlama yaparken ) blok harf el yazısında kullanılır . Bir ders kitabında (1982, 1984, 1985, 1988 Springer-Verlag tarafından yayınlanmıştır) boşluk kodlarının açık bir gösterge gerektirdiği bir programlama dili olan Modula-2'de kullanılır . Ayrıca tuş takımı kullanılan Texas Instruments' TI-8 x serisi içinde grafiğini hesap makineleri .
Adlandırılmış varlık:␣
U+2424 9252 Yeni satır için sembol Kontrol Resimleri Satır sonu için yedekler
U+25B3 9651 Beyaz yukarı dönük üçgen Geometrik şekiller Diğer kullanımların yanı sıra, ASCII alanı için ECMA-17 / ISO 2047 sembolüdür.
U+2A5B 10843 Mantıksal Veya orta saplı Tamamlayıcı
Matematiksel
Operatörler
Diğer kullanımların yanı sıra, dikey sekme (çizgi sekmesi) için ECMA-17 / ISO 2047 sembolüdür.
U+2AAA 10922 Daha küçük Tamamlayıcı
Matematiksel
Operatörler
Diğer kullanımların yanı sıra, satır başı için ECMA-17 / ISO 2047 sembolüdür
U+2AAB 10923 Daha geniş Tamamlayıcı
Matematiksel
Operatörler
Diğer kullanımların yanı sıra sekme karakteri için ECMA-17 / ISO 2047 sembolüdür.
U+3037 12343 İdeografik Telgraf Satır Besleme
Ayırıcı Sembolü
CJK Sembolleri
ve Noktalama İşaretleri
Çin telgraf kodunda 9999 kodu için kullanılan ve bir hat beslemesini temsil eden grafik
  1. ^ Sıfır "0" veya negatif "(‒)" tuşunun üstünde.
tam boşluk
  • Cambridge Z88 özel bir "tam boşluk" (0xA0 aka kod noktası 160) (anahtar kısayol tarafından Invokable sağlanan + SPACEişletim sisteminin ekran sürücüsü tarafından olarak gösterilir), "...". Bu nedenle BBC BASIC ile birlikte "nokta alanı" olarak da biliniyordu .
  • 224 (0xE0) kod noktası altında, bilgisayar ayrıca özel bir üç karakterli hücre genişliğinde BOŞLUK sembolü "SPC" sağladı (Unicode'un tek hücre genişliğindeki U+2420'sine benzer).

Boşluk olmayan boşluklar

  • Kabartma Grafikleri Unicode bloğu içeren U +, 2800 BRAİLLE KALIP BOŞ (HTML  ⠀) bir kabartma bir noktalı desen kaldırdı. Bazı yazı tipleri, karakteri sabit genişlikte bir boşluk olarak görüntüler, ancak Unicode standardı açıkça bunun bir boşluk işlevi görmediğini belirtir.
  • Unicode'un Kore alfabesi kapsamı, yazılı bir harfin olmadığını gösteren ve dolayısıyla bir glif göstermeyen birkaç kod noktası içerir:
    • Unicode, Hangul Uyumluluk Jamo bloğunda ( U+3164HANGUL FILLER (HTML  )) bir Hangul Dolgusu karakteri içerir . Bu bir harf olarak sınıflandırılır, ancak jamo içermeyen bir Hangul bloğu gibi boş bir alan olarak görüntülenir. Bu kullanılan KS x 1001 tanıştırmak veya bir pozisyonda bir harf yokluğunu belirtmek için dizileri birleştirme Hangul ancak Unicode'un birleştiren jamo sisteminde. ㅤ
    • Unicode'un birleşik jamo sistemi benzer Hangul Choseong Filler ve Hangul Jungseong Filler karakterlerini kullanarak, Hangul Jamo bloğuna dahil edilen bir hece bloğu içinde ilk veya orta konumda bir harfin olmadığını belirtmek için ( U+115F HANGUL CHOSEONG FILLER (HTML  ᅟ) , U+1160 HANGUL JUNGSeonG FILLER (HTML  ᅠ)).
    • Buna ek olarak, bir Yarım genişlik Hangul Dolgu dahildir Yarım genişlik ve Fullwidth Forms ( u + FFA0 yarı genişlik HANGUL DOLGU (HTML  ᅠhem karakterleri içeren kodlamaları gelen zaman eşleme kullanılır)), Johab (veya Wansung ) ve N-byte Hangul ( veya EBCDIC muadili), örneğin hem Johab hem de EBCDIC doldurucularını içeren IBM-933 gibi.

Boşluk ve dijital tipografi

Ekran görüntüsü

Metin düzenleyiciler , kelime işlemciler ve masaüstü yayıncılık yazılımları , ekrandaki boşlukları nasıl temsil ettikleri ve satırların sonundaki ekran veya sütun genişliğinden daha uzun boşlukları nasıl temsil ettikleri bakımından farklılık gösterir. Bazı durumlarda, boşluklar yalnızca boşluk olarak gösterilir; diğer durumlarda, bir ara nokta veya başka sembollerle temsil edilebilirler . Boşluk oluşturmak için birçok farklı karakter (aşağıda açıklanmıştır) kullanılabilir ve karakter olmayan işlevler (kenar boşlukları ve sekme ayarları gibi) de boşlukları etkileyebilir.

Değişken genişlikli genel amaçlı alan

Bilgisayar karakter kodlamalarında , genişliği yazı tipinin tasarımına göre değişen normal bir genel amaçlı boşluk (Unicode karakter U+0020) vardır. Tipik değerler 1/5 em ile 1/3 em arasında değişir (dijital tipografide em , yazı tipinin nominal boyutuna eşittir, bu nedenle 10 puntoluk bir yazı tipi için boşluk muhtemelen 2 ile 3,3 punto arasında olacaktır). Gelişmiş yazı tiplerinde kalın, italik ve küçük büyük harfli yüzler için farklı boyutta boşluklar olabilir ve genellikle birleştiriciler metnin boyutuna ve belirginliğine bağlı olarak boşluğun genişliğini manuel olarak ayarlar.

Bu genel amaçlı alana ek olarak, belirli bir genişlikte bir alanı kodlamak mümkündür. Tam bir liste için aşağıdaki tabloya bakın.

Kısa çizgilerin etrafındaki saç boşlukları

Parantez içinde ayırıcı olarak kullanılan uzun tireler ve sözcük birleştirici olarak kullanıldığında uzun tireler genellikle metinle sürekli olarak ayarlanır. Ancak, böyle bir çizgi isteğe bağlı olarak bir saç boşluğu , U+200A veya ince boşluk , U+2009 ile çevrelenebilir . İnce boşluk , veya sayısal karakter referansları   veya  adlandırılmış varlık kullanılarak HTML'de yazılabilir  , ancak 2016'dan itibaren henüz tarayıcılarda evrensel olarak desteklenmemektedir. İnce boşluk , varlık  ve sayısal referanslar  veya olarak adlandırılır  . Bu boşluklar normal boşluktan çok daha incedir ( tek boşluklu (orantısız) yazı tipi hariç ), saç boşluğu ikisinin daha incesidir.

Saç ve ince boşluklara karşı normal boşluk (tarayıcınız tarafından oluşturulduğu gibi)
Kısa çizgi ile normal boşluk sol sağ
Kısa çizgi ile ince boşluk sol - sağ
Kısa çizgi ile saç alanı sol sağ
Kısa çizgi ile boşluk yok sol sağ

bilgi işlem uygulamaları

Programlama dilleri

Gelen dil programlama sözdizimi, boşluk sık açıkça ayrı kullanılır jeton . Çoğu dilde, birden çok boşluk karakterine tek bir boşluk karakteri gibi davranılır (tırnak içine alınmış dizelerin dışında); bu tür dillere serbest biçim denir . Haskell , occam , ABC ve Python dahil olmak üzere birkaç dilde boşluk ve girinti sözdizimsel amaçlar için kullanılır. Boşluk adı verilen hiciv dilinde , boşluk karakterleri programlama için tek geçerli karakterlerdir, diğer karakterler yoksayılır.

Aşırı boşluk kullanımı, özellikle satırların sonundaki boşluklar bir sıkıntı olarak kabul edilir. Ancak boşlukların doğru kullanımı kodun okunmasını kolaylaştırabilir ve grupla ilgili mantığa yardımcı olabilir.

Çoğu dil yalnızca ASCII karakterlerini boşluk olarak tanır veya bazı durumlarda Unicode yeni satırları da tanır, ancak yukarıda listelenen karakterlerin çoğunu tanımaz. C dili karakterleri "alanı, yatay sekme, yeni satır, dikey sekme ve form besleme" olduğu boşluk tanımlar. HTTP , sadece uzay karakter: ağ protokolü gibi protokol farklı bölgelerinde kullanılmak üzere boşluk farklı gerektiren durumu bir hat sonunda hattı, CRLF ve "doğrusal boşluk" başlık değerlerinde.

Komut satırı kullanıcı arayüzleri

Komut işlemcileri tarafından işlenen komutlarda , örneğin komut dosyalarında ve yazılanlarda, boşluk karakteri iki olası işlevi olduğundan sorunlara neden olabilir: bir komut veya parametrenin parçası olarak veya bir parametre veya ad ayırıcı olarak . Belirsizlik, gömülü boşlukları yasaklayarak veya bir adı tırnak karakterleri arasına gömülü boşluklar ekleyerek önlenebilir.

İşaretleme dilleri

SGML gibi bazı biçimlendirme dilleri boşlukları yazıldığı gibi korur.

XML ve HTML gibi web işaretleme dilleri , programcıların rahatlığı için boşluk karakterleri de dahil olmak üzere boşluk karakterlerini özel olarak ele alır. Bu biçimlendirme dillerinin uygun görüntüleme zamanı işlemcileri tarafından okunan bir veya daha fazla boşluk karakteri , anlamsal bağlamlarına bağlı olarak 0 veya 1 boşluğa daraltılır. Örneğin, metin içindeki çift (veya daha fazla) boşluk, tek bir boşluğa daraltılır ve =bir öznitelik adını değerinden ayıran " " öğesinin her iki tarafında görünen boşlukların belgenin yorumlanması üzerinde hiçbir etkisi yoktur. Öğe bitiş etiketleri, sonunda boşluklar içerebilir ve XML'deki boş öğe etiketleri, " />" işaretinden önce boşluk içerebilir . Bu dillerde gereksiz boşluk dosya boyutunu artırır ve bu nedenle ağ aktarımlarını yavaşlatabilir. Öte yandan, gereksiz boşluk, koddaki yorumlara benzer, ancak daha az belirgin olan, göze çarpmayan bir şekilde kodu işaretleyebilir. Bu, kopyalayıp yapıştırarak işlenen bir lisans veya telif hakkı ihlalini kanıtlamak için istenebilir .

XML öznitelik değerlerinde, belge bir ayrıştırıcı tarafından okunduğunda boşluk karakterlerinin dizileri tek bir boşluk olarak kabul edilir. XML öğe içeriğindeki boşluk, ayrıştırıcı tarafından bu şekilde değiştirilmez, ancak ayrıştırıcıdan bilgi alan bir uygulama, öğe içeriğine benzer kurallar uygulamayı seçebilir. Bir XML belgesi yazarı xml:space="preserve", ayrıştırıcıya, aşağı akış uygulamasının o öğenin içeriğindeki boşlukları değiştirmesini engelleme talimatını vermek için bir öğedeki özniteliği kullanabilir .

Çoğu HTML öğesinde , bir boşluk karakteri dizisi, normalde sözcükler arasına bu tür boşluklar ekleyen bir dilde metin oluşturulurken tek bir boşluk karakteri olarak ortaya çıkabilen tek bir sözcük arası ayırıcı olarak ele alınır . Uyumlu HTML oluşturucuların, preetiket ve benzeri boşluk işlemeyi uygulamak için CSS'nin kullanıldığı herhangi bir öğe gibi önceden belirlenmiş birkaç öğe içinde daha gerçek bir preboşluk işlemi uygulaması gerekir . Bu tür öğelerde, boşluk karakterleri sözcükler arası ayırıcılara "daraltılmaz".

Hem XML'de hem de HTML'de, diğer "standart olmayan" boşluklarla birlikte, bölünemez boşluk karakteri daraltılabilir "boşluk" olarak ele alınmaz, bu nedenle yukarıdaki kurallara tabi değildir.

Dosya adları

Bu tür kullanım, işletim sistemleri ve gömülü alan kodlarıyla karıştırılan uygulamalar için yazılmış çok sözcüklü dosya adlarına benzer; bu tür dosya adları bunun yerine sözcük ayırıcı olarak bir alt çizgi (_) kullanır , as_in_this_phrase.

Bu tür başka bir sembol U+2422 BOŞ SEMBOL'dü . Bu, bilgisayar programlamanın ilk yıllarında kodlama formlarına yazarken kullanıldı. Tuş vuruşu operatörleri, sembolü hemen "açık alan" olarak tanıdı. Bu kullanıldı BCDIC , EBCDIC ve ASCII-1963 .

Ayrıca bakınız

Referanslar

Dış bağlantılar