Merhaba bu yazımızda Generative Artificial Intelligence (GenAI) Türkçe tabiri ile Üretken Yapay Zekâ’nın UiPath’in Document Understanding teknolojisindeki yaptığı büyük devrimi siz değerli okuyucularımıza aktarmaya çalışacağım. 🙂
İlk olarak çok yüzeysel şekilde tanım yapalım. GenAI bahse konu olan devrimi Document Understanding teknolojisinde 2 tane aktivite ile yapmakta.
1. Generative Classifier
-
Yapay zekâ destekli belge sınıflandırma aktivitesidir.
- Model, belgenin içeriğini analiz eder ve en uygun sınıfı tahmin eder.
-
Önceden tanımlanmış veya eğitimli modeller yerine büyük dil modelleri (LLM) kullanarak içerik bazlı sınıflandırma yapar.
-
Prompt tabanlı çalışır, yani kullanıcı belgenin hangi türlere ayrılması gerektiğini belirten bir istem (prompt) yazar.
- Örneğin, bir fatura ve sözleşme içeren belgeler için şu şekilde bir prompt verilebilir:
Bu belgenin türünü belirleyin: "Fatura", "Sözleşme" veya "Diğer"
2. Generative Extractor
-
Yapılandırılmış veya yapılandırılmamış belgelerden belirli bilgileri çıkarmak için kullanılır.
-
Geleneksel OCR tabanlı veri yakalama yerine, GenAI ile doğal dil anlayışı (NLU) kullanarak çıkarım yapar.
-
Özelleştirilebilir prompt ile çalışır. Kullanıcı hangi bilgileri çıkarmak istediğini belirtir.
-
Örneğin, bir faturadan tarih, tutar ve tedarikçi adını çekmek için şu prompt kullanılabilir:
Lütfen belgeden aşağıdaki bilgileri çıkar:
- Fatura tarihi
- Toplam tutar
- Tedarikçi adı
Tanım ile çok fazla zaman kaybetmeden doğrudan pratiğe geçelim.
İlk olarak aktivitelerimizi nasıl yapılandırdığımıza bakalım.
1. Generative Classifier
- Bu alan, hangi Document Understanding projesinin kullanılacağını belirler.
-
“Predefined” (Ön Tanımlı) seçeneği, UiPath’in hazır yapılandırılmış ayarlarını kullanır.
-
Eğer özel bir proje oluşturulmuşsa, burada özelleştirilmiş bir Document Understanding modeli seçilebilir.
Bu alanın amacı, sınıflandırma ve veri çıkarma işlemlerinin hangi DU projesi kapsamında çalıştırılacağını belirlemektir
2. Kullanacağımız sınıflandırıcıyı seçtiğimiz alan. Biz Generative Classifer sınıflandırıcısını seçeceğiz.
3. Sınıflandırma işlemini yapmak için prompt girdiğimiz alan.
3.1 Belge türünü belirlediğimiz alan.
3.2 Belge türüne ait prompt girdiğimiz alan.
4. Projemizde kullanmak istediğimiz dosyamızı seçtiğimiz alan. İlgili alanda LocalResource.FromPath(“pasaport.jpg”) kod parçacığı yazmakta, ben .jpg uzantılı bir dosya seçtim.
2. Generative Extractor
- Bu alan, hangi Document Understanding projesinin kullanılacağını belirler.
-
“Predefined” (Ön Tanımlı) seçeneği, UiPath’in hazır yapılandırılmış ayarlarını kullanır.
-
Eğer özel bir proje oluşturulmuşsa, burada özelleştirilmiş bir Document Understanding modeli seçilebilir.
Bu alanın amacı, sınıflandırma ve veri çıkarma işlemlerinin hangi DU projesi kapsamında çalıştırılacağını belirlemektir
2. Kullanacağımız çıkarıcıyı seçtiğimiz alan. Biz Generative Extractor çıkarıcısını seçeceğiz.
3. Çıkarma işlemini yapmak için prompt girdiğimiz alan.
3.1 Belgelerden hangi veriyi çıkarmak istediğimiz alan için isim belirlediğimiz kısım.
3.2 Belgelerden hangi veriyi çıkarmak istediğimiz promptları yazdığımız kısım.
4. Projemizde kullanmak istediğimiz dosyamızı seçtiğimiz alan. İlgili alanda LocalResource.FromPath(“pasaport.jpg”) kod parçacığı yazmakta, ben .jpg uzantılı bir dosya seçtim.
Örnek bir belgeden ilgili aktivitelerin nasıl çalıştığını daha net anlayalım;
İlk olarak Generative Classifier ve Generative Extractor aktivitemizin girdisinin pasaport belgesi olduğundan emin olalım.
Pasaport belgemizi Generative Classifier aktivitesinde tanımladık.
Örnek bir pasaporttan kişinin adını alalım. Generative Extractor aktivitemizde yer alan prompt alanına gerekli promptları yazıyoruz.
Kişinin adı için: “What is the passport first name?”
Kişinin soyadı için: “What is the passport surname?”
Projemizi çalıştırdık, Output panelinden logları incelediğimizde Pasaporttaki ad ve soyad bilgisini başarılı bir şekilde elde edildiğini görüyoruz.