Uzun bir aradan sonra tekrardan merhaba 🙂 DU Yolculuğu isimli içerik serisi oluşturarak bir Document Understanding projesini en ayrıntılı şekilde içerikleştirmeyi planlıyoruz.
DU Yolculuğu #1 isimli ilk içeriğimizde Assetlerin bir Document Understanding projesindeki önemi nedir? Assetler nedir? Ne yapar? Nasıl kullanılır? gibi sorulara cevap vermeye çalışacağız.
Asset Nedir?
Asset, UiPath Orchestrator üzerinde tanımlanan ve robotlar tarafından kullanılabilen merkezi bilgi kaynaklarıdır. Bu bilgiler sabit veriler (örneğin dosya yolu, API anahtarı), kimlik bilgileri (kullanıcı adı/şifre), ayarlar veya bayraklar olabilir. Bir anlamda, asset’ler RPA projelerinde dinamik ve güvenli konfigürasyon yönetimini mümkün kılar.
Document Understanding Projelerinde Assetlerin Rolü
Document Understanding projeleri, genellikle birden fazla bileşeni bir araya getirir: OCR motorları, sınıflandırıcılar, veri çıkarım modelleri, doğrulama istasyonları, Queue işlemleri vb.
Bu bileşenlerin birbiriyle sağlıklı çalışması için belirli parametrelerin merkezi bir yerden sağlanması gerekir. İşte burada asset’ler devreye girer.
Asset’lerin Stratejik Önemi
-
Merkezi Konfigürasyon Yönetimi
Asset’ler sayesinde bir projenin tüm sabit değerleri tek bir yerden yönetilebilir. Örneğin:-
Belgelerin okunduğu klasör yolu
-
Kullanılacak olan OCR motorunun türü
-
Extraction modeli adı
-
-
Güvenlik
Kimlik bilgileri asset olarak saklandığında, bunlar şifreli şekilde Orchestrator’da korunur. Böylece, şifre gibi hassas bilgiler robot içerisinde açıkta yer almaz. -
Esneklik ve Taşınabilirlik
Asset’ler sayesinde aynı DU projesi, farklı ortamlar (dev, test, prod) arasında sadece asset değerleri değiştirilerek kolayca taşınabilir. -
Bakım Kolaylığı
Süreçte bir parametre değiştiğinde (örneğin hedef klasör), sadece ilgili asset değeri değiştirilir. Workflow’larda kod değişikliği gerekmez.
Document Understanding Projelerinde Kullanılan Varsayılan Assetler
-
SkipExtractorTraining
-
SkipClassifierTraining
-
DU_StorageBucketName
-
DU_StorageBucketDirectoryPath
-
DU_QueuePath
-
DU_QueueName
-
DU_MinimumNumberOfRepetitions
-
DU_ClassificationThreshold
-
DU_AutocorrectStorageBucketDirectoryPath
-
DU_AutocorrectionFieldName
-
DU_AutocorrectionEnabled
-
DU_ActionFolderPath
-
DU_ActionCatalogName
-
DocumentUnderstandingApiKey
-
AlwaysValidateExtraction
-
AlwaysValidateClassification
Bir Document Understanding projesinin çalışabilmesi için yukarıdaki 16 assete ihtiyaç duymaktadır, ilgili assetler varsayılan assetlerdir, geliştiriciler daha fazla asset ekleyebilir.
Assetlerin Sahip Olması Gereken Değerler ve Açıklamalar
-
SkipExtractorTraining
Extractor (veri çıkarım) bileşenlerinin eğitimini atlamak için kullanılır. True ise eğitim yapılmaz, false ise eğitim çalışır. -
SkipClassifierTraining
Classifier (belge türü tanıma) bileşenlerinin eğitimini atlamak için kullanılır. Eğitim süresi kazanmak için test senaryolarında true yapılabilir. -
DU_StorageBucketName
İşlenecek belgelerin ve çıktıların tutulduğu AI Center Storage Bucket’ın adıdır. -
DU_StorageBucketDirectoryPath
Storage Bucket içerisindeki klasör yoludur. İşlem dosyalarının organize edilmesi için kullanılır. -
DU_QueuePath
Orchestrator üzerindeki queue’nun tam yoludur (Tenant/Folder formatında). Queue işlemleri bu yol üzerinden yapılır. -
DU_QueueName
DU süreci sırasında kullanılacak queue’nun ismidir. Belgeler bu queue’ya eklenir ve oradan işlenir. -
DU_MinimumNumberOfRepetitions
Eğitim için her belge türü başına minimum kaç etiketleme yapılması gerektiğini belirtir. Yeterli veri yoksa model eğitimi yapılmaz. -
DU_ClassificationThreshold
Belge türü sınıflandırma sonucunda, modelin sonucu geçerli sayması için gereken minimum güven oranıdır (örn. 0.85 = %85). -
DU_AutocorrectStorageBucketDirectoryPath
Otomatik düzeltme yapılacak belgelerin bulunduğu klasör yoludur. Eğitim veya düzeltme işlemleri bu klasördeki verilere göre yapılır. -
DU_AutocorrectionFieldName
Otomatik düzeltme için hedeflenen belirli alanın (örneğin “Fatura Numarası”) adıdır. -
DU_AutocorrectionEnabled
Otomatik düzeltme işlemi aktif mi değil mi bilgisini taşır. True ise sistem çıkardığı sonuçları otomatik düzeltmeye çalışır. -
DU_ActionFolderPath
DU sürecinde oluşturulan Action (doğrulama/gözden geçirme) görevlerinin gönderileceği Orchestrator klasör yoludur. -
DU_ActionCatalogName
DU için kullanılan Action katalog ismidir. Görevlerin sınıflandırılması ve kullanıcıya atanması için gereklidir. -
DocumentUnderstandingApiKey
DU modellerine erişmek ve kullanmak için gerekli olan UiPath API anahtarıdır. AI Center veya DU Public Endpoints için kullanılır. -
AlwaysValidateExtraction
Çıkarılan veriler doğru bile olsa her zaman insan doğrulamasına gönderilsin mi? True ise her belge gözden geçirilir. -
AlwaysValidateClassification
Sınıflandırma sonucu doğru olsa bile doğrulamaya gönderilsin mi? Eğitim ve test için faydalı bir seçenektir.