الوصف الوظيفي
ميندريفت تبحث عن مهندسين متخصصين في استخراج البيانات باستخدام بايثون لمشروع تندم، لدفع سير العمل المتخصص في استخراج البيانات ضمن نظامنا الهجين من الذكاء الاصطناعي + البشر.
في هذا الدور، كطيار ذكاء اصطناعي - هذا ما نشير إليه بهذا الدور في ميندريفت - ستتعاون مع وكلاء تندم الذين يتعاملون مع المهام المتكررة، بينما تقدم التفكير النقدي، وخبرة المجال، ومراقبة الجودة لتقديم نتائج دقيقة وقابلة للتنفيذ.
هذه الفرصة بدوام جزئي عن بُعد مثالية للمهنيين التقنيين الذين لديهم خبرة عملية في استخراج البيانات، واستخراج البيانات، والمعالجة.
ما نقوم به منصة ميندريفت تربط المتخصصين بمشاريع الذكاء الاصطناعي من مبتكري التكنولوجيا الرئيسيين.
مهمتنا هي فتح إمكانيات الذكاء الاصطناعي التوليدي من خلال الاستفادة من الخبرات الواقعية من جميع أنحاء العالم.
حول الدور هذه وظيفة حرة لمشروع تندم.
كمهندس استخراج بيانات بايثون، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج البيانات من الويب ومعالجتها، باستخدام أدوات مختلفة مثل أدواتنا المقدمة (أبايفي وأوبنراوتر) جنبًا إلى جنب مع أساليبك الخاصة.
المسؤوليات الرئيسية امتلاك سير عمل استخراج البيانات من البداية إلى النهاية عبر مواقع الويب المعقدة، مع ضمان التغطية الكاملة، والدقة، والتسليم الموثوق لمجموعات البيانات المنظمة.
الاستفادة من الأدوات الداخلية (أبايفي، أوبنراوتر) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات، والتحقق، وتنفيذ المهام مع تلبية المتطلبات المحددة.
ضمان استخراج موثوق من مصادر الويب الديناميكية والتفاعلية، مع تكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعتمد على جافا سكريبت وسلوك الموقع المتغير.
فرض معايير جودة البيانات من خلال فحوصات التحقق، وضوابط التناسق عبر المصادر، والامتثال لمواصفات التنسيق، والتحقق المنهجي قبل التسليم.
توسيع عمليات استخراج البيانات لمجموعات البيانات الكبيرة باستخدام التجميع الفعال أو التوازي، ومراقبة الفشل، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع.
التعويض في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، اعتمادًا على مستوى وسرعة المساهمة.
يختلف التعويض عبر المشاريع حسب النطاق، والتعقيد، والخبرة المطلوبة.
يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات كسب مختلفة بناءً على متطلباتها.
كيفية البدء ببساطة تقدم لهذه الوظيفة، وتحقق من المؤهلات، واحصل على فرصة للمساهمة في مشاريع تتناسب مع مهاراتك التقنية، وفقًا لجدولك الزمني.
من البرمجة والأتمتة إلى ضبط مخرجات الذكاء الاصطناعي، ستلعب دورًا رئيسيًا في تعزيز قدرات الذكاء الاصطناعي وتطبيقاته في العالم الحقيقي.
لماذا قد تكون هذه الفرصة الحرة مناسبة لك؟
العمل عن بُعد بالكامل وفقًا لجدولك الزمني مع مجرد جهاز كمبيوتر محمول واتصال إنترنت مستقر.
اكتساب خبرة عملية في بيئة هجينة فريدة حيث يتعاون الخبراء البشريون ووكلاء الذكاء الاصطناعي بسلاسة - مجموعة مهارات مميزة في مجال سريع النمو.
المشاركة في برامج المكافآت القائمة على الأداء التي تكافئ العمل عالي الجودة والتسليم المستمر.
خبرة لا تقل عن 3 سنوات في هندسة البيانات، واستخراج البيانات، والأتمتة، أو تطوير البرمجيات (مطلوب).
درجة البكالوريوس أو الماجستير في الهندسة، أو الرياضيات التطبيقية، أو علوم الحاسوب، أو المجالات التقنية ذات الصلة تعتبر ميزة.
خبرة قوية في استخراج البيانات باستخدام بايثون (بيوتيفول سوب، سيلينيوم أو ما شابه)، بما في ذلك المحتوى الديناميكي (جافا سكريبت، أجاكس، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر البروكسيات.
القدرة المثبتة على استخراج البيانات من الهياكل المعقدة (التسلسلات الهرمية، الصفحات المؤرشفة، HTML غير المتسق).
خلفية قوية في تنظيف البيانات، والتطبيع، والتحقق، وتقديم مجموعات بيانات منظمة (CSV، JSON، جداول بيانات جوجل).
خبرة عملية مع نماذج اللغة الكبيرة وأطر الذكاء الاصطناعي لتعزيز الأتمتة وحل المشكلات.
اهتمام قوي بالتفاصيل والالتزام بدقة البيانات.
أخلاقيات العمل الذاتية مع القدرة على حل المشكلات بشكل مستقل.
رابط إلى حساب GitHub يعتبر ميزة.
إجادة اللغة الإنجليزية: مستوى فوق المتوسط (B2) أو أعلى (مطلوب).
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.