Merhaba bu yazımızda Document Understanding projelerinde ikinci adımda kullanılan Digitize adımından bahsedeceğiz.
İlk olarak Digitize nedir? Ne işe yarar? Gibi sorulara cevap verelim.
Digitize adımı, belgeleri dijital formata dönüştürmek için tasarlanmış bir adımdır. Bu adım, belgelerde yer alan metinleri, çizimleri ve diğer bilgileri dijital olarak erişilebilir ve işlenebilir hale getirir. Bunun yapılabilmesi için genellikle OCR (Optik Karakter Tanıma) teknolojisi kullanılır. OCR teknolojisi, basılı veya el yazısıyla yazılmış metinleri tanır ve bu metinleri dijital karakterler haline getirir. Bu verilerin dijital sistemler tarafından işlenmesini mümkün kılar.
Aktivitemizin genel görünümü yukarıdaki görsel gibidir. 1 girdi vermekte, 2 çıktı almaktayız. 1 tane de OCR aktivitemiz bulunmakta.
Aktivitemizin Properties alanını inceleyelim;
- İşlenecek belgeleri aktivitemize girdi olarak verdiğimiz alan. Bu belgeler .pdf, .jpg, .png gibi yaygın dosya formatlarında olabilir.
- DOM (Document Object Model), işlenecek belgede yer alan nesnelerin (kelimeler, resimler, tablolar vb.) X ve Y koordinatlarına göre belgenin yapısal bir modelini oluşturur. Bu model, belgedeki her bir nesnenin konumunu ve ilişkisini tanımlar, bu da daha doğru bir dijitalleştirme işlemi yapılmasına yardımcı olur.
- Aktivitemize girdi olarak verdiğimiz belgeler üzerinde dijitalleştirme işlemi yapıldıktan sonra çıktı aldığımız alan.
Küçük bir örnek yapalım;
Bir fatura seçtik ve akışımızı çalıştırdık. Çıktıyı Log Message aktivitesi yardımıyla loga yazdırdık. Gördüğümüz gibi belgenin içerisindeki metinleri bize çıktı olarak verdi.