الوصف الوظيفي
مقدمة
يتم البحث عن عالم بيانات أول ذو مهارات عالية وخبرة عميقة في التعلم الآلي، التعلم العميق، والذكاء الاصطناعي التوليدي. يجب أن يكون لدى المرشح المثالي سجل قوي في تقديم حلول علم البيانات من البداية إلى النهاية في بيئات الإنتاج، بالإضافة إلى خبرة عملية مع نماذج اللغة الكبيرة وأطر الذكاء الاصطناعي الوكيلة. ستكون مسؤولاً عن قيادة مشاريع الذكاء الاصطناعي والتعلم الآلي من الفكرة إلى النشر، والتعاون مع فرق متعددة التخصصات، وضمان تنفيذات قابلة للتوسع.
دورك ومسؤولياتك
- قيادة تنفيذات داتابريكس من البداية إلى النهاية تغطي إدخال البيانات، أنابيب ETL و ELT، هندسة دلتا ليك، تطوير النماذج المعتمدة على MLflow، النشر، والمراقبة، وتوسيع المنصة باستخدام وكلاء داتابريكس وتطبيقات داتابريكس لبناء تطبيقات مدفوعة بالذكاء الاصطناعي آمنة وقابلة للتوسع للاستخدامات المؤسسية.
- تنفيذ مشاريع علم البيانات من البداية إلى النهاية بما في ذلك جمع البيانات، المعالجة المسبقة، هندسة الميزات، النمذجة، التقييم، والنشر.
- تصميم وتنفيذ خوارزميات التعلم الآلي المتقدمة (التصنيف، الانحدار، التجميع، طرق التجميع) وخوارزميات معالجة اللغة الطبيعية.
- تطوير ونشر حلول الذكاء الاصطناعي التوليدي المعتمدة على نماذج اللغة الكبيرة باستخدام منصات مثل أوبن إيه آي، هوجينغ فيس، و LLaMA، مع توليد معزز للاسترجاع RAG وأنماط RAG المتقدمة بما في ذلك البحث الهجين، قواعد البيانات المتجهة، إعادة الترتيب، تحسين المطالبات، وتأسيس السياق للاستخدامات المؤسسية.
- تطبيق أطر الذكاء الاصطناعي الوكيلة مثل LangChain، LangGraph، Crew AI، أو Microsoft Semantic Kernel لتصميم، تنظيم، وإدارة سير العمل متعدد الوكلاء.
- مهارة في الاستفادة من منصات التعلم الآلي، قواعد البيانات المدارة، خدمات استضافة الويب، وأدوات الذكاء الاصطناعي الوثائقي لتطوير الحلول من البداية إلى النهاية.
- إجادة تصميم ونشر حلول التعلم الآلي القابلة للتوسع باستخدام الهياكل السحابية، مع خبرة عملية في منصة رئيسية واحدة على الأقل (Azure، AWS، GCP، أو IBM Cloud).
- التعاون مع أصحاب المصلحة في الأعمال لتعريف بيانات المشكلة، تقديم الرؤى، وتحقيق التأثير.
- الحفاظ على إمكانية التكرار والتحكم في النسخ باستخدام Git، GitHub.
- التواصل بفعالية حول المفاهيم التقنية ونتائج المشاريع مع كل من أصحاب المصلحة الفنيين وغير الفنيين.
التعليم المطلوب
درجة البكالوريوس
التعليم المفضل
درجة الماجستير
الخبرة الفنية والمهنية المطلوبة
- 7-9 سنوات من الخبرة العملية في علم البيانات، التعلم الآلي، التعلم العميق، ومعالجة اللغة الطبيعية في بيئة الإنتاج.
- 3+ سنوات من الخبرة التطبيقية في الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة (مثل أوبن إيه آي، LLama).
- خبرة عملية قوية في تنفيذ داتابريكس من البداية إلى النهاية بما في ذلك إدخال البيانات، أنابيب ETL و ELT، دلتا ليك، MLflow، ونشر تحليلات قابلة للتوسع، تطبيقات التعلم الآلي، والذكاء الاصطناعي.
- إجادة في تطوير الذكاء الاصطناعي الوكيلة باستخدام أطر مثل LangChain، LangGraph، أو ما شابه.
- مهارات برمجة قوية في بايثون وخبرة مع مكتبات التعلم الآلي والتعلم العميق.
- خبرة في نشر النماذج عبر واجهات برمجة التطبيقات REST أو تطبيقات الويب.
- إجادة في SQL لاستخراج البيانات، التحويل، والتحليل.
- خبرة في العمل مع مجموعات بيانات كبيرة، هندسة الميزات، وأنابيب معالجة البيانات.
- فهم قوي لتقييم النماذج، التحقق المتقاطع، ومقاييس الأداء.
- خبرة في MLOps، بما في ذلك اختبار النماذج، أنابيب النشر، أطر الحوكمة، والمراقبة المستمرة لعمليات التعلم الآلي الموثوقة والمتوافقة.
- خبرة مع أنابيب وخدمات التعلم الآلي السحابية (إجادة في واحدة على الأقل من Azure، AWS، GCP، و IBM Cloud).
- مهارات تواصل بين شخصية قوية مع العملاء.
سنوات الخبرة:7-9
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.