قبل خمسة أعوام، وكجزء من عمل مجموعة فارا في مجال مكافحة غسل الأموال/مكافحة تمويل الإرهاب، قمنا بمراجعة حسابات أحد البنوك الخاضعة للتصفية، والذي سبق أن فرضت عليه وزارة الخزانة الأمريكية عقوبات. وتمثلت مهمتنا الأساسية في تحديد الحسابات السامة وأصحاب الحسابات ذات الصلة لمنع المزيد من التلوث في النظام المالي الأوسع، سواء في البلد الذي يقع فيه البنك أو على الصعيد الدولي. وقد تكلل المشروع بالنجاح، حيث كشفت جهودنا، من بين أمور أخرى، عن شبكات ومعاملات مختلفة، وساعدت في تشكيل إجراءات السياسة الحكومية ضد ممولي منظمة إرهابية عالمية مصنفة بشكل خاص.
وبالنظر إلى الممارسات المعيبة في حفظ السجلات وحفظ البيانات في البنك، والبيئة العامة التي كان يعمل فيها، فقد ثبت أن المشروع كان جهدًا يدويًا مكثفًا تطلب فريقًا متخصصًا من اللغويين وعلماء البيانات وأخصائيي المحاسبة الجنائية وغيرهم من الموظفين الموجودين في ولايات قضائية متعددة.
كما انطوت المشاركة أيضًا على مخاطر أمنية كبيرة حيث كان على الإدارة العليا والمحللين السفر مرارًا وتكرارًا إلى مواقع عالية الخطورة بسبب التأخير في الحصول على البيانات اللازمة وفهمها، والتي كان معظمها محفوظًا في صناديق من المجلدات المادية و/أو على أجهزة الكمبيوتر المحلية.
باختصار، لقد كانت مهمة مكلفة ومعقدة ومثقلة بالتحديات التي قد تبدو أقل صعوبة اليوم بفضل ثورة الذكاء الاصطناعي التي حدثت منذ ذلك الحين. ومع ذلك، فإن هذه الحالة أيضًا بمثابة مثال على المجالات التي من المرجح أن يستمر فيها الذكاء الاصطناعي في التقصير عن الجهود البشرية الدقيقة، على الأقل في المستقبل القريب.
صعوبات في استغلال الوثائق
تضمنت هذه المشاركة معالجة كميات كبيرة من البيانات غير المهيكلة المنتشرة عبر أرشيف ضخم من ملفات PDF والوثائق الورقية المادية، والتي تضمنت، من بين أشياء أخرى، صورًا لشيكات، ونماذج اعرف عميلك المملوءة يدويًا، ووثائق القروض، وتقارير الأنشطة المشبوهة (SARs). كل هذا كان يجب مراجعته بدقة من قبل أكثر من اثني عشر فاحصًا ومحللًا من مجموعة Fara Group وإدخاله يدويًا في مجموعات بيانات منظمة.
وقد تفاقم التحدي بسبب حقيقة أن العديد من الوثائق كانت باللغة العربية وتتضمن تفاصيل مهمة مكتوبة بخط اليد. وعلى الرغم من أننا استخدمنا أحدث برامج التعرف الضوئي على الحروف (OCR) في ذلك الوقت، إلا أن هذه التقنية لم تكن كافية. فقد كان البرنامج يعاني من عدم الدقة، وغالباً ما كان يسيء تفسير الأحرف أو يتخطى أجزاء من المستندات تماماً. وكان بطيئاً وعرضة للأخطاء وغير قادر على إدارة التخطيطات المعقدة، مما جعل عملية الرقمنة مملة وتستغرق وقتاً طويلاً. وكان التعامل مع النصوص غير اللاتينية أو تنسيقات المستندات المختلطة شبه مستحيل.
شهدت تقنية التعرف الضوئي على الحروف اليوم تحولاً كبيراً. فالخوارزميات المتقدمة توفر الآن التعرف على المستندات بشكل أسرع وأكثر دقة، حتى بالنسبة للتخطيطات الصعبة. وقد تحسّنت موثوقية التعرف الضوئي على الحروف بشكل كبير، مما أتاح عمليات أكثر سلاسة لرقمنة المستندات واستخراج البيانات. ولكن لا يزال هناك عمل يتعين القيام به في هذا المجال، لا سيما في سد الثغرات في النصوص غير اللاتينية، والتي لا تزال مجالاً بالغ الأهمية للتحسين.
التحديات في تحليلات مكافحة غسل الأموال
وسرعان ما لاحظنا أن جزءًا كبيرًا من بيانات المعاملات المصرفية المهيكلة، التي تم سحبها من نظام تكنولوجيا المعلومات القديم، كانت تفتقر إلى الرموز الهامة التي تربط المعاملات بين الحسابات، مما جعل التسوية مهمة معقدة. وقد أدى التطبيق غير المتسق للرسوم عبر الحقول إلى زيادة تعقيد التحدي، في حين فشلت مجموعات بيانات سويفت من خادم منفصل في التوافق مع بيانات المعاملات المصرفية المهيكلة.
على الرغم من أن برنامج Excel وأدوات التحليل الجنائي المختلفة التي جربناها قد وفرت بعض القدرة على تحديد الأنماط وفرز الحسابات ذات الحجم الكبير، إلا أنها كانت جامدة بشكل مفرط وقاصرة من حيث الكفاءة وقابلية التوسع. كان يمكن لحلول الذكاء الاصطناعي، التي تستفيد من التعلم الآلي والتحليلات التنبؤية والحوسبة السحابية القوية، أن تقوم بمطابقة البيانات آلياً، وتضع علامات على الحالات الشاذة، وتعالج مجموعات البيانات الضخمة بسرعة ودقة وقدرة أكبر على التكيف، مما يؤدي إلى تبسيط العملية بشكل كبير.
ابتكار حلول الترجمة الصوتية لمطابقة مجموعات البيانات
وتمثلت إحدى المهام الرئيسية في تحديد ما إذا كان هناك أي أفراد مرتبطين بمنظمة إرهابية مدرجة في قاعدة بيانات عملائنا من أصحاب الحسابات أو من بين الأطراف المقابلة في معاملاتهم. وتمثل أحد التحديات في أن مجموعة البيانات التي تم الحصول عليها للأفراد المشتبه بهم كانت مكتوبة بالحروف العربية التي يمكن ترجمتها بأشكال مختلفة بينما كانت قائمة عملاء البنك مكتوبة بالحروف اللاتينية. (وكمثال على ذلك، فإن اسم ”محمد“ الشائع للغاية يحتوي على أكثر من 20 اختلافًا إملائيًا مختلفًا في الكتابة اللاتينية).
لقد وجدنا أن أفضل طريقة لسد هذه الفجوة بين المجموعتين العربية والإنجليزية بفعالية وضمان المطابقة الدقيقة للبيانات هي أن يقوم المتحدثون باللغة العربية في فريقنا بإنشاء قاموس يدوياً لأكثر من 200,000 اسم عربي فريد من نوعه يمكن أن يتطابق مع بيانات البنك بكل ترجماتها الصوتية الإنجليزية الممكنة. تطلبت هذه العملية المضنية آلاف الساعات من الجهد وتوسيع نطاق المعالجة الحاسوبية من خلال خدمات AWS السحابية. كما قمنا بإشراك مطوري Python لأتمتة أجزاء كبيرة من العملية، مما عزز الكفاءة وقلل من الجهد اليدوي.
لقد نجحنا في تحديد الآلاف من حالات التطابق بين أصحاب الحسابات بأحجام معاملات إجمالية تتجاوز 6 مليارات دولار.
في حين أن الذكاء الاصطناعي للتعلم الآلي يمكن أن يساعد في أجزاء من هذه العملية، إلا أن خبرة متحدثي اللغة العربية الأصليين كانت حاسمة. فقد وفرت هذه الخبرة فهماً متعمقاً للاختلافات في الأسماء، كما أنها وفرت فهماً متعمقاً لاختلافات الأسماء، وكان بإمكانها توقع كيف يمكن أن يتم تغيير الأسماء عمداً من قبل غاسلي الأموال لتجنب الكشف عنها.
اليوم، باستخدام الأدوات والاستعلامات الصحيحة، يمكن لتطبيقات الذكاء الاصطناعي إنجاز هذه المهمة بكفاءة أكبر بكثير. على سبيل المثال، يقوم ChatGPT بتوليد 22 صيغة مختلفة لاسم ”محمد“ في 12 ثانية فقط، مما يدل على إمكانية إكمال معجم كامل للأسماء العربية في ساعات، اعتماداً على قوة المعالجة.
الاكتشاف الإلكتروني
باستخدام منصة eDiscovery، قمنا بتعيين العلاقات ومعلومات المعاملات والبيانات الأخرى ذات الصلة الموجودة في مئات الآلاف من رسائل البريد الإلكتروني للبنك. على الرغم من القدرة على إجراء هذا الجزء من التحقيق من خلال منصة رقمية، إلا أن العملية لا تزال تتطلب مراجعات يدوية دقيقة من قبل المحللين لدينا. وقد اعتمد الفريق على عمليات البحث عن الكلمات الرئيسية، وهي طريقة قد لا تلتقط الاتصالات الدقيقة أو المشفرة المصممة للتهرب من الكشف (ومما زاد من تعقيد الأمور أن بعض رسائل البريد الإلكتروني كانت مكتوبة باللغة العربية). بالإضافة إلى ذلك، مع ظهور الآلاف من رسائل البريد الإلكتروني في بعض عمليات البحث، كان من المستحيل تقريبًا على المحللين مراجعة كل نتيجة في الوقت المناسب.
لقد أحدث الذكاء الاصطناعي ثورة في مجال الاكتشاف الإلكتروني في تحقيقات غسيل الأموال من خلال تجاوز قيود المنهجيات القديمة. واليوم، يستفيد الذكاء الاصطناعي من معالجة اللغة الطبيعية (NPL) والتعلم الآلي لتحليل السياق والكشف عن الأنماط وربط الاتصالات المشبوهة بسجلات المعاملات بدقة ملحوظة. وقد أدى هذا التحول إلى تحسين سرعة ودقة التحقيقات بشكل كبير، مما مكن المؤسسات المالية وكذلك إدارات إنفاذ القانون من معالجة كميات هائلة من البيانات في دقائق مع تقليل مخاطر فقدان الأدلة.
يمكن أن تتكامل منصات eDiscovery مع مجموعات بيانات المعاملات المهيكلة لإحداث ثورة في التحقيقات المالية، مما يتيح رؤى أعمق في أنشطة غسيل الأموال. من خلال ربط اتصالات البريد الإلكتروني بسجلات المعاملات، تسمح هذه الأدوات بالربط المتقدم بين البيانات والتعرف على الأنماط، وكشف الحالات الشاذة المشبوهة مثل المبالغ أو التوقيت غير المعتاد. يعزز هذا الاتصال من التحقيقات من خلال تتبع التدفقات المالية إلى جانب مسارات الاتصالات، وكشف الشبكات أو المخططات الخفية.
تضمنت مخرجاتنا رسوماً بيانية متنوعة توضح تدفق المعاملات بين الأفراد والكيانات، بما في ذلك التواريخ والمبالغ، وفي كثير من الحالات كانت مصحوبة بوثائق ثابتة كدليل داعم.
لماذا قد لا يزال الاعتماد الكلي على الذكاء الاصطناعي جسراً بعيد المنال؟
قلل الذكاء الاصطناعي من الحاجة إلى التفكير النقدي في العديد من المجالات. وغالباً ما تقدم نتائج دون الكشف عن المنطق الكامن وراءها. في حين أنه يحاكي العمليات البشرية، إلا أنه يعمل بسرعة أكبر بكثير وعلى نطاق أوسع بكثير.
ومع ذلك، فإن البيانات غير كاملة، وهنا لا يزال الخبراء في هذا المجال يلعبون دوراً حاسماً – حيث يمكنهم التعرف على الفروق الدقيقة والتناقضات التي قد يغفلها الذكاء الاصطناعي. قد يفهم علماء البيانات العلم الكامن وراء الأرقام، ولكنهم قد يفتقرون إلى الفهم العميق للبيانات نفسها. تظل الخبرة البشرية ضرورية لتوفير السياق والحكم والرؤى. تعمل تقنية الذكاء الاصطناعي، التي تعتمد على بيانات غير كاملة، على تكملة الجهود البشرية وليس استبدالها في العديد من المجالات المعقدة.
وبعبارة أخرى، على الرغم من التطورات العديدة التي تحققت، إلا أن الذكاء الاصطناعي لا يزال قاصراً عن فهم التفاصيل الدقيقة للديناميكيات المصرفية، ولا سيما في الولايات القضائية غير الغربية. على غرار بعض علماء البيانات الذين يمكنهم تحليل الأرقام الأولية دون سياق أعمق، يواجه الذكاء الاصطناعي صعوبات في التعرف على الفروق الثقافية أو الجغرافية أو غيرها من الفروق الدقيقة التي تعتبر حيوية في عمليات مثل ”اعرف عميلك“ أو الموافقات على القروض.
علاوةً على ذلك، لا يمكنه (حتى الآن!) التقاط الإشارات غير اللفظية التي يتم الحصول عليها من خلال ذكاء المصادر البشرية، مثل أثناء مقابلة شخصية مع مدير أحد البنوك، كما أنه لا يمتلك القدرة على توقع الديناميكيات السياسية المحلية أو العلاقات الحساسة المحيطة بمؤسسة معينة وعملائها. قد تؤدي هذه الثغرات إلى إشارات خاطئة أو علاقات متوترة مع العملاء أو تقييمات غير صحيحة للمخاطر.
من ناحية أخرى، كما هو مذكور أعلاه، فإن قيود تقنية التعرف الضوئي على الحروف التي أصبحت واضحة بشكل صارخ خلال مهمة التدقيق المصرفي التي قمنا بها منذ خمس سنوات قد تحسنت بشكل كبير منذ ذلك الحين. توفر الخوارزميات المتقدمة الآن التعرف على المستندات بشكل أسرع وأكثر دقة، حتى بالنسبة للتخطيطات الصعبة، وتتيح موثوقية التعرف الضوئي على الحروف اليوم إمكانية رقمنة المستندات وعمليات استخراج البيانات بشكل أكثر سلاسة. ومع ذلك، ضع في اعتبارك أنه على الرغم من أن هذه التطورات تمثل تقدمًا كبيرًا، إلا أن سد الفجوة بالنسبة للنصوص غير اللاتينية لا يزال بحاجة إلى العمل.
من خلال تجربتنا، فإن إعداد تقارير مفصلة عن الروابط المحتملة لتمويل الإرهاب يمثل تحديات فريدة من نوعها، ويرجع ذلك في المقام الأول إلى الطبيعة غير المتسقة وغير المكتملة للمعلومات المتاحة. وشملت المشاكل أوجه القصور التكنولوجية في النظام المصرفي القديم، مثل البيانات غير الآمنة ومحدودية الشخصية، بالإضافة إلى الحالات التي كان يتم فيها إجراء الفحص الواجب للعملاء شفهياً من قبل موظفي البنك بدلاً من النظام. من خلال التدقيق الحاذق لمحللينا الذين تمكنوا من مضاهاة المعلومات من مختلف نقاط البيانات، بما في ذلك النماذج غير المهيكلة المطبوعة وجمع المعلومات من مصادر بشرية والنتائج التي تم التوصل إليها على منصات الاكتشاف الإلكتروني، اكتشفنا بيانات كبيرة مفقودة و/أو غير متسقة و/أو تم تغييرها يدويًا في ما كان ينبغي أن يكون نظامًا مصرفيًا آليًا.
ومن الأمور الأخرى التي تزيد الأمر تعقيدًا والتي لا تزال صحيحة اليوم هي حقيقة أن الجهات الفاعلة السيئة تحاول، بقدر ما تستطيع، تجنب الطرق التي يمكن تتبعها وكشفها لنقل أموالها (مثل التحويلات البرقية المباشرة)، وتبتكر بدلاً من ذلك حلولاً مبتكرة دائمة التغير. واعتمادًا على نقاط الضعف المحددة في الولاية القضائية التي يعملون فيها، يستخدمون أيضًا أساليب غير تقليدية لجلب الأموال إلى النظام المالي (مثل السحب على المكشوف عمدًا من الحسابات والتسوية نقدًا، كمثال واحد فقط).
كل هذا يعني أن الخبرة على أرض الواقع وفهم العلاقات التي تبدو غامضة بين مختلف الجهات الفاعلة أمر بالغ الأهمية.
في حالتنا، تطلب تعقيد التحليل وخصوصيته خبرة بشرية لتفسير وتوليف أنواع مختلفة من البيانات. في حين أن الذكاء الاصطناعي الحديث كان يمكن أن يكون بمثابة أداة قيّمة لجوانب معينة من هذه العملية، مثل تحديد الأنماط في معالجة مجموعات البيانات الكبيرة، إلا أنه من المحتمل أن يفتقر إلى القدرة على توليد مخرجات مصممة خصيصًا بشكل كامل تتطلب حكمًا دقيقًا وفهمًا سياقيًا وقدرة على التكيف.
يمكن للذكاء الاصطناعي والبصيرة البشرية معاً تعزيز الكفاءة. ومع ذلك، يبدو من المرجح أن الجهود التي يقودها الإنسان ستظل في صميم توليد مخرجات مفصلة ومراعية للسياق لحالات محددة مثل هذه المراجعة المصرفية، على الأقل في المستقبل القريب.
الخاتمة
قامت مجموعة فارا بدمج الذكاء الاصطناعي في سير العمل لديها وتعتبره أداة قوية ومكملة وليس حلاً واحداً يناسب الجميع. يعمل الذكاء الاصطناعي كمضاعف للقوة، مما يتيح إنجاز المهام التي كانت تستغرق آلاف الساعات في جزء صغير من الوقت.
نحن نفكر في الذكاء الاصطناعي كمبتدئ لامع ينضم إلى فريقنا التحليلي. يمكن أن يفاجئك بسرعته وقدرته على الكشف عن رؤى قيمة. ومع ذلك، يمكن أيضًا أن يقصّر في فهم السياق ويجد صعوبة في فهم السياق ويغفل عن الموضوعات الواضحة ويسيء فهم التفاصيل الدقيقة.
ويبقى في صميم العملية التحليلية كبير الخبراء في هذا المجال، والذي تجلب خبرته فهماً نقدياً وقدرة على إصدار الأحكام خلال العملية التحليلية وتقييم النتائج. على الأقل في الوقت الراهن، فهي أفضل من الذكاء الاصطناعي في التعرف على مصدر البيانات وقيودها، وسد الثغرات في المعلومات ودمج المعلومات من مصادر مختلفة بما في ذلك الرؤى الاستخباراتية ذات المصدر البشري، من أجل إنشاء تحليلات غنية وذات مغزى حول ما هو مهم حقًا لعملائنا.