Veri doğrulama - Data validation

Olarak bilgisayar biliminin , veri doğrulama sağlama işlemidir veri uğramıştır veri temizleme bunlar sağlamak için veri kalitesi Doğru ve kullanışlı hem de, yani,. Sisteme girilen verilerin doğruluğunu, anlamlılığını ve güvenliğini kontrol eden, genellikle "doğrulama kuralları", "doğrulama kısıtlamaları" veya "kontrol rutinleri" olarak adlandırılan rutinleri kullanır. Kurallar, bir veri sözlüğünün otomatik olanakları aracılığıyla veya bilgisayarın ve uygulamasının açık uygulama programı doğrulama mantığının dahil edilmesiyle uygulanabilir .

Bu, bir belirtimi veya özelliği uygulamak için algoritmaların doğruluğunu kanıtlamaya veya çürütmeye çalışan resmi doğrulamadan farklıdır .

genel bakış

Veri doğrulama, bir uygulama veya otomatik sistemdeki verilerin uygunluğu ve tutarlılığı için iyi tanımlanmış belirli garantiler sağlamayı amaçlar. Veri doğrulama kuralları, çeşitli metodolojiler kullanılarak tanımlanabilir ve tasarlanabilir ve çeşitli bağlamlarda konuşlandırılabilir. Bunların uygulanması, bildirime dayalı veri bütünlüğü kurallarını veya prosedüre dayalı iş kurallarını kullanabilir .

Veri doğrulama garantilerinin mutlaka doğruluğu içermediğini ve yanlış yazımlar gibi veri giriş hatalarının geçerli olarak kabul edilmesinin mümkün olduğunu unutmayın. Bir sistemdeki yanlışlığı azaltmak için diğer büro ve/veya bilgisayar kontrolleri uygulanabilir.

Farklı çeşit

Veri doğrulamanın temellerini değerlendirirken, kapsamlarına, karmaşıklıklarına ve amaçlarına göre farklı doğrulama türleri hakkında genellemeler yapılabilir.

Örneğin:

  • Veri türü doğrulaması;
  • Aralık ve kısıtlama doğrulaması;
  • Kod ve çapraz referans doğrulaması;
  • Yapılandırılmış doğrulama; ve
  • tutarlılık doğrulama

Veri türü kontrolü

Veri türü doğrulaması, geleneksel olarak bir veya daha fazla basit veri alanında gerçekleştirilir.

En basit veri türü doğrulama türü, kullanıcı girişi yoluyla sağlanan bireysel karakterlerin, bir programlama dilinde veya veri depolama ve alma mekanizmasında tanımlandığı gibi bir veya daha fazla bilinen ilkel veri türünün beklenen karakterleriyle tutarlı olduğunu doğrular.

Örneğin, bir tamsayı alanı yalnızca 0 ile 9 arasındaki karakterleri kullanmak için girdi gerektirebilir.

Basit aralık ve kısıtlama kontrolü

Basit aralık ve kısıtlama doğrulaması, minimum/maksimum aralıkla tutarlılık için girdiyi veya normal ifadelere karşı bir veya daha fazla test gibi bir karakter dizisini değerlendirmek için bir testle tutarlılığı inceleyebilir. Örneğin, negatif olmayan bir tam sayı olması için bir sayaç değeri gerekli olabilir ve minimum uzunluğu karşılamak ve birden çok kategoriden karakter içermesi için bir parola gerekebilir.

Kod ve çapraz referans kontrolü

Kod ve çapraz referans doğrulama, verilerin belirli bir kuruluş, bağlam veya temel varsayımlar kümesiyle ilgili bir veya daha fazla olası harici kural, gereksinim veya koleksiyonla tutarlı olduğunu doğrulamaya yönelik işlemleri içerir. Bu ek geçerlilik kısıtlamaları, LDAP gibi bilinen bir arama tablosu veya dizin bilgi hizmeti ile sağlanan verilere çapraz referans vermeyi içerebilir .

Örneğin, mevcut bir jeopolitik bölgeyi tanımlamak için kullanıcı tarafından sağlanan bir ülke kodu gerekebilir.

Yapılandırılmış kontrol

Yapılandırılmış doğrulama, daha karmaşık işlemlerle birlikte diğer doğrulama türlerinin kombinasyonuna izin verir. Bu tür karmaşık işleme, bir sistem içindeki tüm karmaşık bir veri nesnesi veya bir dizi işlem işlemi için koşullu kısıtlamaların test edilmesini içerebilir.

Tutarlılık denetimi

Tutarlılık doğrulaması, verilerin mantıklı olmasını sağlar. Örneğin, bir siparişin teslim tarihinin, sevkiyat tarihinden önce gelmesi yasaklanabilir.

Örnek

10 basamaklı 2007 öncesi ISBN'ler için çok sayıda veri doğrulama türü geçerlidir (ISO 2108'in 2005 baskısı, 2007'den itibaren ISBN'lerin 13 basamaklı olmasını gerektirmiştir).

  • Boy. 2007 öncesi bir ISBN, dört bölümünü ayıran isteğe bağlı kısa çizgiler veya boşluklarla birlikte 10 basamaktan oluşmalıdır.
  • Biçim kontrolleri. İlk 9 hanenin her biri 0 ile 9 arasında ve 10. basamak ya 0 ile 9 arasında ya da bir X şeklinde olmalıdır .
  • Kontrol basamağı . Rakamların değiştirildiği veya yer değiştirildiği transkripsiyon hatalarını tespit etmek için, 2007 öncesi bir ISBN'nin son basamağı, diğer 9 basamağı ( ISBN-10 kontrol basamakları ) içeren bir matematiksel formülün sonucuyla eşleşmelidir .

Doğrulama Türleri

İzin verilen karakter kontrolleri
Bir alanda yalnızca beklenen karakterlerin mevcut olup olmadığını kontrol eder. Örneğin, sayısal bir alan yalnızca 0-9 arasındaki rakamlara, ondalık basamağa ve belki bir eksi işaretine veya virgüllere izin verebilir. Kişisel ad gibi bir metin alanı, işaretleme için kullanılan karakterlere izin vermeyebilir . Bir e-posta adresi en az bir @ işareti ve çeşitli diğer yapısal detaylar gerektirebilir. Normal ifadeler , bu tür kontrolleri uygulamanın etkili yolları olabilir.
parti toplamları
Eksik kayıtları kontrol eder. Bir toplu iş içindeki tüm kayıtlar için sayısal alanlar birlikte eklenebilir. Parti toplamı girilir ve bilgisayar, toplamın doğru olup olmadığını kontrol eder, örneğin, birkaç işlemin 'Toplam Maliyet' alanını birlikte ekleyin.
kardinalite kontrolü
Kaydın geçerli sayıda ilgili kaydı olduğunu kontrol eder. Örneğin, bir ilgili kişi kaydı "müşteri" olarak sınıflandırılmışsa, en az bir ilişkili siparişe sahip olmalıdır (önemlilik > 0). Bu tür bir kural, ek koşullar nedeniyle karmaşık olabilir. Örneğin, bir bordro veritabanındaki bir ilgili kişi kaydı "eski çalışan" olarak sınıflandırılırsa, ayrılma tarihinden sonra herhangi bir ilişkili maaş ödemesi olmamalıdır (önemlilik = 0).
Rakamları kontrol et
Sayısal veriler için kullanılır. Hata tespitini desteklemek için, diğer rakamlardan hesaplanan bir sayıya fazladan bir rakam eklenir.
Tutarlılık kontrolleri
Bu alanlardaki verilerin karşılık geldiğinden emin olmak için alanları kontrol eder, örneğin, son kullanma tarihi geçmişse durum "etkin" değildir.
Sistemler arası tutarlılık kontrolleri
Tutarlı olduğundan emin olmak için farklı sistemlerdeki verileri karşılaştırır. Sistemler aynı verileri farklı şekilde temsil edebilir, bu durumda karşılaştırma dönüşüm gerektirir (örneğin, bir sistem müşteri adını 'Doe, John Q' olarak tek bir Ad alanında saklayabilirken, bir diğeri First_Name 'John' ve Last_Name 'Doe' ve Middle_Name'i kullanır. 'Kalite').
Veri türü kontrolleri
Girilen verilerle giriş uygunluğunu kontrol eder. Örneğin, sayısal verileri kabul eden bir giriş kutusu 'O' harfini reddedebilir.
Dosya varlığı kontrolü
Belirtilen ada sahip bir dosyanın var olup olmadığını kontrol eder. Bu kontrol, dosya işlemeyi kullanan programlar için gereklidir.
Biçim kontrolü
Verilerin belirli bir formatta (şablon) olup olmadığını kontrol eder, örneğin tarihlerin YYYY-AA-GG formatında olması gerekir. Bu tür doğrulama için normal ifadeler kullanılabilir.
Durum kontrolü
Verilerin mevcut olup olmadığını kontrol eder, örneğin müşterilerin bir e-posta adresine sahip olmaları gerekebilir.
Aralık kontrolü
Verilerin belirli bir değer aralığında olup olmadığını kontrol eder, örneğin bir olasılık 0 ile 1 arasında olmalıdır.
Bilgi tutarlılığı
İki ilişkisel veritabanı tablosundaki değerler, yabancı anahtar ve birincil anahtar aracılığıyla bağlanabilir. Yabancı anahtar alanındaki değerler dahili mekanizmalar tarafından kısıtlanmıyorsa, referans tablosunun her zaman referans verilen tablodaki bir satıra atıfta bulunmasını sağlamak için doğrulanmaları gerekir.
Yazım ve dil bilgisi denetimi
Yazım ve dilbilgisi hatalarını arar.
benzersizlik kontrolü
Her değerin benzersiz olup olmadığını kontrol eder. Bu, birkaç alana uygulanabilir (yani Adres, Ad, Soyadı).
Tablo arama kontrolü
Tablo arama kontrolü, verileri izin verilen değerler koleksiyonuyla karşılaştırır.

Doğrulama sonrası işlemler

icra eylemi
Yürütme eylemi genellikle veri girişi talebini reddeder ve girdi aktörünün verileri uyumlu hale getirecek bir değişiklik yapmasını gerektirir. Bu, gerçek bir kişinin bilgisayarda oturduğu ve giriş yaptığı etkileşimli kullanım için en uygun olanıdır. Ayrıca, bir dosya girişinin reddedilebileceği ve verilerin neden reddedildiği konusunda giriş kaynağına bir dizi mesajın geri gönderilebileceği toplu yükleme için de iyi çalışır.
Başka bir yaptırım eylemi biçimi, verileri otomatik olarak değiştirmeyi ve orijinal sürüm yerine uyumlu bir sürümü kaydetmeyi içerir. Bu kozmetik değişim için en uygun olanıdır. Örneğin, bir [tümü büyük harf] girişini [Pascal durumu] girişine dönüştürmek için kullanıcı girişi gerekmez. Otomatik yaptırımın uygun olmayan bir şekilde kullanılması, yaptırımın işletme bilgilerinin kaybolmasına neden olduğu durumlarda olabilir. Örneğin, uzunluk beklenenden daha uzunsa, kesilmiş bir yorumun kaydedilmesi. Önemli veri kaybına neden olabileceğinden bu genellikle iyi bir şey değildir.
Tavsiye Eylemi
Tavsiye eylemleri genellikle verilerin değiştirilmeden girilmesine izin verir, ancak kaynak aktöre karşılaşılan doğrulama sorunlarını belirten bir mesaj gönderir. Bu, en çok etkileşimli olmayan sistem için, değişikliğin iş açısından kritik olmadığı sistemler için, mevcut verilerin temizlenmesi adımları ve bir giriş sürecinin doğrulama adımları için uygundur.
Doğrulama İşlemi
Doğrulama eylemleri, tavsiye eylemlerinin özel durumlarıdır. Bu durumda, kaynak aktörden, aksine bir öneri ışığında, bu verilerin gerçekten girmek istedikleri şey olduğunu doğrulaması istenir. Burada, kontrol adımı bir alternatif önerir (örneğin, bir posta adresinin kontrolü, o adresi biçimlendirmenin farklı bir yolunu döndürür veya tamamen farklı bir adres önerir). Bu durumda, kullanıcıya öneriyi kabul etme veya sürümlerini koruma seçeneği vermek istersiniz. Bu, tasarım gereği katı bir doğrulama süreci değildir ve adresleri yeni bir konuma veya doğrulama veritabanları tarafından henüz desteklenmeyen bir konuma yakalamak için kullanışlıdır.
Doğrulama günlüğü
Veri doğrulamanın herhangi bir sorun bulmadığı durumlarda bile, yapılan doğrulamaların ve sonuçlarının bir günlüğünü sağlamak önemlidir. Bu, veri sorunları ışığında ve doğrulamayı iyileştirmede eksik veri doğrulama kontrollerini belirlemeye yardımcı olur.

Doğrulama ve güvenlik

Veri doğrulamadaki hatalar veya eksiklikler, verilerin bozulmasına veya güvenlik açığına neden olabilir . Veri doğrulama, verilerin işlenmeden önce amaca uygun, geçerli, mantıklı, makul ve güvenli olduğunu kontrol eder.

Ayrıca bakınız

Referanslar

Dış bağlantılar