Terörün finanse edilmesiyle mücadele eden banka müfettişleri ve istihbarat memurları genellikle dağınık kâğıtlardan oluşan belge dağcıkları arasından, ilgili verileri bulabilmek için zorlu DOCEX (Belge İşleme) veya SD (Kaynak Belge) süreçleri ile karşı karşıya kalırlar. İlgili bölgesel uzmanlığa ve gereken dil yeterliliğine sahip finansal analistler ve çevirmenler çokça talep görmekte ve az sayıda bulunmaktadır. En çok Arapça dil yeterlilikleri talep edilirken bunu Peştuca, Urduca ve Farsça takip etmektedir.
Arapça bilen analist eksikliğinin giderilmesi için metinsel belgelerin işlenişi ve süreçten geçirilmesi yeteneğini arttıran yeni teknolojilere ciddi anlamda ihtiyaç vardır. Vredenburg Bilgi Teknolojileri Kıdemli Başkan Yardımcısı Larry Den’e göre, gerekli sayıda dilbilimcinin bulunamaması, belirli veri türleri için makina çevirisine başvurulması eğilimini arttırıyor. Bu durumun sebebi ise, özellikle belgenin çevrilmeden arşivlenmek üzere etiketlenemiyor oluşudur. Veri girişi için sıkça kullanılan bir teknoloji de Optik Karakter Tanımadır (OCR – Optical Character Recognition). Bu teknoloji sayesinde metinsel görseller dijital olarak tanımlanabilir metinlere dönüştürülür ve böylece kullanıcıların metni başka bir dile çevirmesi işlemi de dâhil olmak üzere söz konusu metinler başka bilgisayar uygulamaları tarafından da kullanılabilir ve aranabilir hale getirilir.
Her ne kadar OCR teknolojisi Latin harfli (İngilizce, Fransızca ve İtalyanca gibi) metinler üzerinde kusursuzca çalışsa da içerik Arapça olunca maalesef çok güvenilir bir araç olmaktan çıkmaktadır. Burada esas engel Arapçadaki ağır üslûpsal yazma şeklinin karmaşıklığıdır. Her bir Arapça karakter, kelimedeki konumuna bağlı olarak dört ayrı şekle sahip olabilmektedir (Bkz. Şekil 1). İngilizce gibi bir dilde karakterlerin kelime içerisindeki konum ve üslûbu bu kadar katı olmadığı için Arapça karakterlerin tespit edilmesi daha zordur. Bunun yanı sıra, söz konusu dört ayrı şekil zikzak (yılankavi) karakterler, halkalı karakterler, noktalı karakterler ve aksanlı karakterler de içerebilir.
OCR teknolojisindeki eksiklikler sebebiyle Ortadoğu ve Kuzey Afrika bölgesindeki Belge İşlemesi (DOCEX) ve Kaynak Belge (SD) operasyonları sancılı ve yoğun süreçler olmaya devam etmektedir. Çift dile hâkim Arapça bilen analistlerin az bulunur olması nedeniyle belgeleri ilk gözden geçiren personelin genellikle kaynak dile hâkimiyeti ya sınırlı olmakta ya da hiç bulunmamaktadır. Bu da içeriği doğru biçimde değerlendirme yeterliliği olmayan analistlerin yüksek sayıdaki karmaşık belgeyi elle incelemesi sebebiyle terörün finansmanıyla mücadelede faydalı olabilecek kritik bilgilerin atlanabilmesine sebep olabiliyor. Her ne kadar makina çevirisinde kullanılan yazılım gün geçtikçe daha da geliştirilse de henüz tam kalifiye bir dilbilimcinin yeterliliklerinin yanından dahi geçemez.
OCR teknolojisi Arapça görevler için mükemmelleştirilene kadar DOCEX / SD insan eliyle gerçekleştirilen bir süreç olmaya devam edecek. Fara Grup, gerek ODKA bölgesinde gerekse diğer yetki bölgelerindeki projelerde görevlendirilebilecek çift dilli Arap finansal analistlerden oluşan yetkin ekibini geçtiğimiz yıllar içerisinde oluşturmuştur. Hem kâğıt üstünde hem de dijitalleşmiş belgelerin incelenmesine sistemik bir yaklaşım benimseyerek ilgili verilerin tespit edilip yapılandırılmış bir formatta kaydedilmesi mümkündür. Bu süreçte e-keşif platformları da uygulanmaktadır. Bu veriler, bireysel insan kaynaklardan ve zararlı veri tabanlarından elde edilen istihbaratla tamamlanabilir ve daha sonra tutarlı bir adli rapora entegre edilebilir. Fara Grup, Ortadoğu ülkelerinde de olmak üzere uluslararası DOCEX / SD projelerini başarıyla uygulamıştır.