الوصف الوظيفي
جدول العمل:
أخرى
ظروف العمل:
مكتب
وصف الوظيفة:
الغرض الملخص:
نقدم فرصة لمهندس بيانات متوسط المستوى لتصميم وبناء واختبار وضبط ودعم خطوط بيانات الإنتاج باستخدام باي سبارك، بايثون، SQL المتقدم، خدمات بيانات AWS، ممارسات التعامل الآمن مع البيانات، وقدرات هندسة البيانات المدعومة بالذكاء الاصطناعي.
التعليم/الخبرة:
- درجة البكالوريوس أو ما يعادلها في علوم الكمبيوتر، تكنولوجيا المعلومات، هندسة البيانات، أو مجال ذي صلة
- 3-5 سنوات من الخبرة في هندسة البيانات، تطوير ETL، SQL، منصات بيانات AWS، أو دعم خطوط بيانات الإنتاج
المسؤوليات الرئيسية:
- تطوير واختبار وضبط وصيانة ETL وخطوط البيانات باستخدام باي سبارك، بايثون، SQL، وخدمات AWS
- دعم استيعاب وتحويل الملفات المسطحة، قواعد البيانات العلائقية، واجهات برمجة التطبيقات، مستودعات البيانات، ومصادر البيانات المؤسسية
- التعاون مع محللي الأعمال، مهندسي البيانات، ضمان الجودة، تطوير العمليات، والمهندسين الكبار لتنفيذ خرائط المصدر إلى الهدف وحلول البيانات
- تنفيذ CDC، تصميم التحميل التزايدي، معالجة خطوط البيانات غير القابلة للتكرار، وأنماط تسوية البيانات لضمان حركة بيانات موثوقة
- الحفاظ على الوثائق الفنية، مواصفات الخرائط، تحديثات كتالوج البيانات، كتب التشغيل، الاختبارات الآلية، ومواد دعم الإصدار
المعرفة، المهارات، والقدرات:
- خبرة عملية مع باي سبارك، بايثون، SQL المتقدم، أفضل ممارسات ETL، نمذجة البيانات، ومعالجة البيانات على نطاق واسع
- معرفة عميقة بتحسين أداء Redshift بما في ذلك مفاتيح التوزيع، مفاتيح الفرز، ترميز الضغط، Spectrum، وجهات النظر المادية، WLM، التفريغ، والتحليل
- معرفة قوية بتحسين Athena بما في ذلك تقليم الأقسام، تنسيقات الملفات، الضغط، تطور المخطط، وتصميم الاستعلامات بتكلفة فعالة
- فهم قوي لنمذجة بيانات DynamoDB، تصميم قائم على أنماط الوصول، تخطيط السعة، GSIs/LSIs، TTL، Streams، وتحسين الأداء
- تعرض لممارسات التعامل الآمن مع PHI/PII بما في ذلك التشفير، ضوابط الوصول، القابلية للتدقيق، الاحتفاظ، التمويه، وإزالة الهوية حيثما كان ذلك مناسبًا
- مهارات تحليلية قوية، حل المشكلات، توثيق، تواصل، وتعاون عبر الوظائف
المهارات الأساسية:
- خبرة في باي سبارك، بايثون، SQL المتقدم، تطوير ETL، وتنفيذ خطوط البيانات
- خبرة في خدمات بيانات AWS بما في ذلك S3، Glue، Lambda، Step Functions، ECS، DynamoDB، Redshift، PostgreSQL، SQL Server، وتكامل Athena
- استيعاب الملفات المسطحة، خرائط المصدر إلى الهدف، منطق التحويل، CDC، التحميلات التزايدية، المعالجة غير القابلة للتكرار، التسوية، وفحوصات جودة البيانات
- CI/CD، تدفقات عمل GitHub، الاختبار الآلي، وإدارة الإصدار لخطوط البيانات وتغييرات قاعدة البيانات
- مهارات حل المشكلات، دعم الإنتاج، تصحيح الأخطاء، توثيق، ومهارات تسليم Agile
المهارات الجيدة:
- تعرض لأتمتة الخرائط المدعومة بالذكاء الاصطناعي واستخدام LLMs لتنظيف البيانات، فحوصات جودة البيانات، منطق التحويل، أو التوثيق
- معرفة بأنماط RAG، التضمينات، قواعد البيانات المتجهة، البحث الدلالي، أو حلول اكتشاف البيانات المدعومة بالذكاء الاصطناعي
- فهم لمعايير بيانات الرعاية الصحية مثل HL7، FHIR، CCD، بيانات المطالبات، استخراج EMR، بيانات التجارب السريرية، وإزالة هوية المرضى
- معرفة بالبنية التحتية ككود مثل Terraform أو CloudFormation، بالإضافة إلى Databricks، Snowflake، البث، الرصد، أو ممارسات DevOps
ساعات العمل:
- الهند: 05:30 مساءً إلى 02:30 صباحًا بتوقيت الهند القياسي
- الفلبين: 08:00 مساءً إلى 05:00 صباحًا بتوقيت الفلبين
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.