Document Understanding

DU Yolculuğu #1 – Asset Yapılandırılmaları.



Uzun bir aradan sonra tekrardan merhaba 🙂 DU Yolculuğu isimli içerik serisi oluşturarak bir Document Understanding projesini en ayrıntılı şekilde içerikleştirmeyi planlıyoruz.

DU Yolculuğu #1 isimli ilk içeriğimizde Assetlerin bir Document Understanding projesindeki önemi nedir?  Assetler nedir? Ne yapar? Nasıl kullanılır? gibi sorulara cevap vermeye çalışacağız.

Asset Nedir?

Asset, UiPath Orchestrator üzerinde tanımlanan ve robotlar tarafından kullanılabilen merkezi bilgi kaynaklarıdır. Bu bilgiler sabit veriler (örneğin dosya yolu, API anahtarı), kimlik bilgileri (kullanıcı adı/şifre), ayarlar veya bayraklar olabilir. Bir anlamda, asset’ler RPA projelerinde dinamik ve güvenli konfigürasyon yönetimini mümkün kılar.

Document Understanding Projelerinde Assetlerin Rolü

Document Understanding projeleri, genellikle birden fazla bileşeni bir araya getirir: OCR motorları, sınıflandırıcılar, veri çıkarım modelleri, doğrulama istasyonları, Queue işlemleri vb.

Bu bileşenlerin birbiriyle sağlıklı çalışması için belirli parametrelerin merkezi bir yerden sağlanması gerekir. İşte burada asset’ler devreye girer.

Asset’lerin Stratejik Önemi

  1. Merkezi Konfigürasyon Yönetimi
    Asset’ler sayesinde bir projenin tüm sabit değerleri tek bir yerden yönetilebilir. Örneğin:

    • Belgelerin okunduğu klasör yolu

    • Kullanılacak olan OCR motorunun türü

    • Extraction modeli adı

  2. Güvenlik
    Kimlik bilgileri asset olarak saklandığında, bunlar şifreli şekilde Orchestrator’da korunur. Böylece, şifre gibi hassas bilgiler robot içerisinde açıkta yer almaz.

  3. Esneklik ve Taşınabilirlik
    Asset’ler sayesinde aynı DU projesi, farklı ortamlar (dev, test, prod) arasında sadece asset değerleri değiştirilerek kolayca taşınabilir.

  4. Bakım Kolaylığı
    Süreçte bir parametre değiştiğinde (örneğin hedef klasör), sadece ilgili asset değeri değiştirilir. Workflow’larda kod değişikliği gerekmez.

Document Understanding Projelerinde Kullanılan Varsayılan Assetler

 

du-1-asset

  • SkipExtractorTraining

  • SkipClassifierTraining

  • DU_StorageBucketName

  • DU_StorageBucketDirectoryPath

  • DU_QueuePath

  • DU_QueueName

  • DU_MinimumNumberOfRepetitions

  • DU_ClassificationThreshold

  • DU_AutocorrectStorageBucketDirectoryPath

  • DU_AutocorrectionFieldName

  • DU_AutocorrectionEnabled

  • DU_ActionFolderPath

  • DU_ActionCatalogName

  • DocumentUnderstandingApiKey

  • AlwaysValidateExtraction

  • AlwaysValidateClassification

Bir Document Understanding projesinin çalışabilmesi için yukarıdaki 16 assete ihtiyaç duymaktadır, ilgili assetler varsayılan assetlerdir, geliştiriciler daha fazla asset ekleyebilir. 

Assetlerin Sahip Olması Gereken Değerler ve Açıklamalar

 

  • SkipExtractorTraining
    Extractor (veri çıkarım) bileşenlerinin eğitimini atlamak için kullanılır. True ise eğitim yapılmaz, false ise eğitim çalışır.

  • SkipClassifierTraining
    Classifier (belge türü tanıma) bileşenlerinin eğitimini atlamak için kullanılır. Eğitim süresi kazanmak için test senaryolarında true yapılabilir.

  • DU_StorageBucketName
    İşlenecek belgelerin ve çıktıların tutulduğu AI Center Storage Bucket’ın adıdır.

  • DU_StorageBucketDirectoryPath
    Storage Bucket içerisindeki klasör yoludur. İşlem dosyalarının organize edilmesi için kullanılır.

  • DU_QueuePath
    Orchestrator üzerindeki queue’nun tam yoludur (Tenant/Folder formatında). Queue işlemleri bu yol üzerinden yapılır.

  • DU_QueueName
    DU süreci sırasında kullanılacak queue’nun ismidir. Belgeler bu queue’ya eklenir ve oradan işlenir.

  • DU_MinimumNumberOfRepetitions
    Eğitim için her belge türü başına minimum kaç etiketleme yapılması gerektiğini belirtir. Yeterli veri yoksa model eğitimi yapılmaz.

  • DU_ClassificationThreshold
    Belge türü sınıflandırma sonucunda, modelin sonucu geçerli sayması için gereken minimum güven oranıdır (örn. 0.85 = %85).

  • DU_AutocorrectStorageBucketDirectoryPath
    Otomatik düzeltme yapılacak belgelerin bulunduğu klasör yoludur. Eğitim veya düzeltme işlemleri bu klasördeki verilere göre yapılır.

  • DU_AutocorrectionFieldName
    Otomatik düzeltme için hedeflenen belirli alanın (örneğin “Fatura Numarası”) adıdır.

  • DU_AutocorrectionEnabled
    Otomatik düzeltme işlemi aktif mi değil mi bilgisini taşır. True ise sistem çıkardığı sonuçları otomatik düzeltmeye çalışır.

  • DU_ActionFolderPath
    DU sürecinde oluşturulan Action (doğrulama/gözden geçirme) görevlerinin gönderileceği Orchestrator klasör yoludur.

  • DU_ActionCatalogName
    DU için kullanılan Action katalog ismidir. Görevlerin sınıflandırılması ve kullanıcıya atanması için gereklidir.

  • DocumentUnderstandingApiKey
    DU modellerine erişmek ve kullanmak için gerekli olan UiPath API anahtarıdır. AI Center veya DU Public Endpoints için kullanılır.

  • AlwaysValidateExtraction
    Çıkarılan veriler doğru bile olsa her zaman insan doğrulamasına gönderilsin mi? True ise her belge gözden geçirilir.

  • AlwaysValidateClassification
    Sınıflandırma sonucu doğru olsa bile doğrulamaya gönderilsin mi? Eğitim ve test için faydalı bir seçenektir.

 



İlgili İçerikler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu