E-metin - E-text

e-metin (" elektronik metinden "; bazen etext olarak yazılır ), dijital biçimde okunan herhangi bir belge ve özellikle de esas olarak metin olan bir belge için genel bir terimdir . Örneğin, minimum metin içeren bilgisayar tabanlı bir sanat kitabı veya bir dizi fotoğraf veya sayfa taraması genellikle "e-metin" olarak adlandırılmaz. Bir e-metin, herhangi bir açık kaynak veya özel yazılımla görüntülenen bir ikili veya düz metin dosyası olabilir . Bir e-metin biçimlendirme veya diğer biçimlendirme bilgileri içerebilir veya içermeyebilir. Bir e-metin, orijinal olarak oluşturulmuş veya başka ortamlarda yayınlanan bir çalışmanın elektronik bir baskısı olabilir veya orijinal olarak elektronik biçimde oluşturulabilir. Terim genellikle e-kitap ile eş anlamlıdır .

E-metin kökenleri

E-metinler veya elektronik belgeler , İnternet, Web ve özel E-kitap okuma donanımından çok önce var olmuştur. Roberto Busa bir elektronik baskı geliştirmeye başladık Aquinas büyük ölçekli elektronik metin düzenleme, süre, 1940'larda köprü , ve bu şekilde çevrimiçi okuma platformları güçlendirmek ve fress 1960'larda ortaya çıktı. Bu erken sistemler , metinlerinde biçimlendirme, işaretleme , otomatik içindekiler tablosu, köprüler ve diğer bilgilerin yanı sıra bazı durumlarda (FRESS gibi) yalnızca metni değil grafikleri de destekleyen kapsamlı bir şekilde kullandı.

"Sadece düz metin"

Bazı topluluklarda, "e-metin", tabiri caizse "düz vanilya ASCII " olan elektronik belgelere atıfta bulunmak için çok daha dar bir anlamda kullanılmaktadır . Bununla sadece belgenin düz bir metin dosyası olduğu değil, aynı zamanda "metnin kendisi" dışında hiçbir bilgiye sahip olmadığı kastedilmektedir - kalın veya italik, paragraf, sayfa, bölüm veya dipnot sınırları vb. temsili yoktur. Michael S. Örneğin Hart, bunun "hem göze hem de bilgisayara kolay gelen tek metin modu olduğunu" savundu. Hart, özel kelime işlemci biçimlerinin metinleri büyük ölçüde erişilemez hale getirdiği konusunda doğru bir noktaya değindi; ancak bunun standart, açık veri formatlarıyla ilgisi yoktur. "E-metin"in dar anlamı artık yaygın değildir, çünkü "sadece vanilya ASCII" (ilk bakışta çekici) kavramının ciddi zorluklara sahip olduğu ortaya çıkmıştır:

İlk olarak, bu dar "e-metin" türü İngilizce harflerle sınırlıdır. Birçok Avrupa dilinde kullanılan İspanyolca ñ veya aksanlı ünlüler bile temsil edilemez (garip ve belirsiz bir şekilde "~n" "a" olarak kullanılmadıkça). Asya, Slav, Yunan ve diğer yazı sistemleri imkansızdır.

İkincisi, diyagramlar ve resimler bir araya getirilemez ve pek çok kitap en azından bu tür materyallere sahiptir; çoğu zaman kitabın olmazsa olmazıdır.

Üçüncüsü, bu dar anlamda "e-metinler", "metni" bir eserde meydana gelen diğer şeylerden ayırt etmek için güvenilir bir yola sahip değildir. Örneğin, sayfa numaraları, sayfa üstbilgileri ve dipnotlar atlanabilir veya yalnızca ek metin satırları olarak görünebilir, belki öncesinde ve sonrasında boş satırlarla (veya değil). Süslü bir ayırıcı çizgi, bunun yerine bir yıldız işaretiyle (ya da değil) temsil edilebilir. Bölüm ve bölüm başlıkları da aynı şekilde yalnızca ek metin satırlarıdır: orijinalde tamamı büyük harfle yazılmışsa (ya da değil) büyük harf kullanımıyla algılanabilirler. Hangi uzlaşımların (varsa) kullanıldığını keşfetmek bile, her kitabı yeni bir araştırma veya tersine mühendislik projesi yapar.

Bunun sonucu olarak, bu tür metinler güvenilir bir şekilde yeniden biçimlendirilemez. Bir program, dipnotların, üstbilgilerin veya altbilgilerin, hatta belki paragrafların nerede olduğunu güvenilir bir şekilde söyleyemez, bu nedenle metni, örneğin daha dar bir ekrana sığdırmak için yeniden düzenleyemez veya görme engelliler için yüksek sesle okuyamaz. Programlar yapıyı tahmin etmek için buluşsal yöntemler uygulayabilir , ancak bu kolayca başarısız olabilir.

Dördüncüsü ve belki de şaşırtıcı derecede önemli bir konu, "düz metin" bir e-metin , çalışma hakkında bilgi sunmanın hiçbir yolunu sağlamaz . Örneğin, ilk mi yoksa onuncu baskı mı? Kim hazırladı ve başkalarına hangi hakları saklıyorlar veya veriyorlar? Bu, doğrudan bir tarayıcıdan çıkan ham sürüm mü yoksa yeniden okunup düzeltildi mi? Metinle ilgili üst veriler bazen bir e-metne dahil edilir, ancak bu tanım gereği önceden ayarlanmış olup olmadığını veya nerede olduğunu söylemenin bir yolu yoktur. En iyi ihtimalle, başlık sayfasının metni dahil edilebilir (veya alınmayabilir), belki de merkezleme girinti ile taklit edilebilir.

Beşincisi, daha karmaşık bilgiler içeren metinler gerçekten hiç ele alınamaz. İki dilli basım veya dipnotlar, yorumlar, kritik aparatlar, çapraz referanslar ve hatta en basit tablolar içeren kritik bir basım . Bu, sonsuz pratik sorunlara yol açar: örneğin, bilgisayar dipnotları güvenilir bir şekilde ayırt edemezse, dipnotun kesintiye uğrattığı bir ifade bulamaz.

Ham tarayıcı OCR çıktısı bile genellikle kalın ve italik kullanımı gibi bundan daha fazla bilgi üretir. Bu bilgi saklanmazsa, yeniden yapılandırmak pahalı ve zaman alıcıdır; hangi sürüme sahip olduğunuz gibi daha karmaşık bilgiler hiç kurtarılamayabilir.

Gerçeklik, "düz metin" bile bir tür "işaretleme" kullanır - genellikle karakterleri , boşlukları, sekmeleri ve benzerlerini kontrol eder: Sözcükler arasındaki boşluklar; paragraf için iki dönüş ve 5 boşluk. Daha resmi biçimlendirmeden temel fark, "düz metinlerin" örtük, genellikle belgelenmemiş sözleşmeler kullanmasıdır, bu nedenle tutarsız ve tanınması zordur.

"Sade vanilya ASCII" olarak e-metnin dar anlamı gözden düştü. Bununla birlikte, bu tür metinlerin çoğu Web'de ücretsiz olarak mevcuttur, belki de kolayca üretildikleri için olduğu kadar iddia edilen herhangi bir taşınabilirlik avantajı nedeniyle. Gutenberg Projesi uzun yıllar boyunca bu metin modelini güçlü bir şekilde tercih etti, ancak zamanla HTML gibi daha yetenekli formlar geliştirmeye ve dağıtmaya başladı .

Ayrıca bakınız

Referanslar

Dış bağlantılar