تقنيات معالجة اللغات الطبيعية

نعمل على تطوير نماذج لغوية واسعة (LLM) وتقنيات معالجة اللغة الطبيعية (NLP) قادرة على فهم السياق واللغة والثقافة وصياغة محتوى دقيق وذو صلة. تهدف أبحاثنا إلى ابتكار حلول تدعم مجالات متعددة مثل المساعدات الذكية، أنظمة دعم القرار، تحليل المحتوى النصي والصوتي، والنماذج متعددة الوسائط. كما نركز على تعزيز التخصيص والتفاعل الطبيعي بين الإنسان والآلة، بما يتيح تجارب أكثر سلاسة وفعالية ويؤسس لأساس علمي للجيل القادم من الحلول الذكية.

المجالات البحثية

النماذج اللغوية الكبيرة متعددة الصيغ

نعمل على تطوير نماذج الذكاء الاصطناعي التي تدمج بين النصوص والصور والصوت والفيديو لدراسة الاستدلال عبر الوسائط، تعلم التمثيلات، والفهم المتعدد الوسائط.

النماذج اللغوية الصوتية ومعالجة الكلام

نبحث في مجالات النماذج اللغوية الكبيرة والخوارزميات المتخصصة في التعرف على الكلام، التوليد الصوتي، والفهم الصوتي، مما يمكّن من تطوير المساعدات الذكية، واجهات الصوت، والتواصل متعدد الوسائط.

الاستدلال (نماذج التفكير - الاستدلال اللغوي - الرؤية)

ندرس ونستكشف النماذج القادرة على الاستدلال المنطقي، السببي، والعقلاني عبر الوسائط، بما في ذلك التفكير المنظم في اللغة، الاستدلال البصري، وحل المشكلات في مختلف المجالات.

الذكاء الاصطناعي الوكيل و الوكيل الذكي

ندرس تطوير تقنيات الذكاء الاصطناعي الوكيل و الوكلاء الذكيين المستقلين الذين يخططون، يستدلون، ويتصرفون عبر خطوات متعددة، لاتمام المهام دون تدخل بشري.

مجالات بحثية أخرى:

النماذج اللغوية الكبيرة الانتشارية

نبحث في تقنيات النموذج توليدي الانتشاري الذي يتعلم إنشاء بيانات جديدة من خلال عكس عملية إضافة الضوضاء إلى بيانات التدريب.

الذكاء الاصطناعي الفيزيائي

أبحاث في أنظمة الذكاء الاصطناعي التي تتفاعل مع العالم الفيزيائي، مثل الذكاء المتجسد، ودمج الإدراك، والتحكم، واتخاذ القرار.

النماذج العالمية الكبيرة (WLM)

نتطلع للمستقبل ونستثمر في ابحاث النماذج التي تتعلم وتتنبأ بديناميكيات البيئة الحقيقية، مما يمكّن من البحث في التخطيط، التعلم المعزز القائم على النماذج، والتحويل من المحاكاة إلى الواقع.

الأبحاث العلمية المنشورة

1. Arabic Named Entity Recognition with a CRF Model Based on Transformer Architecture

2. Arabic named entity recognition using transformer - based -crf model

3. Recent Advances in Long Documents Classification Using Deep –Learning

4. AraLegal -BERT: A pretrained language model for Arabic Legal text

5. Leveraging BERT Language Model for Arabic Long Document Classification

6. Deep learning for sign language recognition: Current techniques, benchmarks, and open issues

7. pyStudio: An Open -Source Machine Learning Platform

8. Improving Automated Speech Recognition Using Retrieval-Based Voice Conversion

9. Calm-Whisper: Reduce Whisper Hallucination On Non-Speech By Calming Crazy Heads Down

10. Open Universal Arabic ASR Leaderboard

اهم براءات الاختراع المسجلة

1. Method for Accelerated Long Document Search using Hilbert Curve Mapping

2. Method and apparatus for identifying similar data elements using string matching

3. Method and apparatus with arabic information extraction and semantic search

4. Method and computer readable storage medium for automated speech recognition using retrieval-based voice conversion

5. Method and system for realtime measuring of product reputation

تقنيات معالجة اللغات الطبيعية​

تقنيات معالجة اللغات الطبيعية