كلما زادت طلبات التقديم التي ترسلينها، زادت فرصك في الحصول على وظيفة!

إليك لمحة عن معدل نشاط الباحثات عن عمل خلال الشهر الماضي:

عدد الفرص التي تم تصفحها

عدد الطلبات التي تم تقديمها

استمري في التصفح والتقديم لزيادة فرصك في الحصول على وظيفة!

هل تبحثين عن جهات توظيف لها سجل مثبت في دعم وتمكين النساء؟

اضغطي هنا لاكتشاف الفرص المتاحة الآن!
نُقدّر رأيكِ

ندعوكِ للمشاركة في استطلاع مصمّم لمساعدة الباحثين على فهم أفضل الطرق لربط الباحثات عن عمل بالوظائف التي يبحثن عنها.

هل ترغبين في المشاركة؟

في حال تم اختياركِ، سنتواصل معكِ عبر البريد الإلكتروني لتزويدكِ بالتفاصيل والتعليمات الخاصة بالمشاركة.

ستحصلين على مبلغ 7 دولارات مقابل إجابتك على الاستطلاع.


تم إلغاء حظر المستخدم بنجاح
https://bayt.page.link/RPHRwtmLrePgjddm8
العودة إلى نتائج البحث‎

Site Reliability Engineer - Observability

قبل 16 يوم 2026/09/03 ينتهي خلال 15 يومًا
لا يشترط وجود خبرة سابقة
خدمات الدعم التجاري الأخرى
أنشئ تنبيهًا وظيفيًا لوظائف مشابهة
تم إيقاف هذا التنبيه الوظيفي. لن تصلك إشعارات لهذا البحث بعد الآن.

الوصف الوظيفي

About UsAt Mirai - a Scopely Studio, we believe high-quality software is about partnership, advocacy, and deep respect for our colleagues.
The best engineers augment their technical ability with listening first, asking thoughtful questions, and influencing through clarity, not volume.
If that’s you, you’re going to thrive here and learn a ton!
With world-class games like MonopolyGo, PokémonGo, Marvel StrikeForce, and Star Trek F.
C., we're full of trendsetters solving interesting problems on a scale no other gaming company has.
We’re game-changing (literally), and intentional about building a great place to be.
About the role We are hiring an SRE focused on observability, automation, and runtime reliability for AI platforms and internal agentic systems.
This is not a generic SOC role.
It is an engineering role for someone who builds telemetry, automates findings-to-fix loops, improves production readiness, and keeps AI systems measurable, resilient, and controllable in production.
Suitable backgrounds Site Reliability Engineers or backend engineers with strong automation skills Platform reliability or observability engineers who build tooling, not just dashboards Cloud automation engineers with strong logging, tracing, and incident-response instincts Detection or security automation engineers who prefer code, pipelines, and remediation over ticket operations Tech stack Python for automation and workflow integration Observability tooling: metrics, logs, traces, OpenTelemetry, Datadog or adjacent stacks AWS logging, telemetry, IAM-aware diagnostics, and infrastructure scripting CI/CD integration for runtime checks, rollback drills, and policy validation Nice to have: Wiz, CrowdStrike, Orca, GuardDuty, WAF / RASP-style controls, MCP / agent telemetry Design and operate the telemetry and observability layer for AI platforms, including audit trails, tool-call logs, correlation IDs, traces, and runtime visibility across service boundaries.
Build automated findings-to-fix loops for AI and cloud platforms, integrating signals from tooling such as Wiz, Astrix, or future AI security products into pragmatic remediation workflows.
Implement reliability and hardening controls for internal AI systems, including alerting, health checks, rollback drills, kill-switch validation, rate limiting, and drift detection.
Codify detections, policies, and operational checks as code where they reduce toil, prevent regressions, and improve platform control.
Review platform and AI-application changes from a reliability and application-hardening perspective, especially around secrets, telemetry, external calls, risky MCP usage, and production readiness.
Own AI-platform-specific operational readiness and partner with central IT / EAS / SOC teams for escalations, handoffs, and shared incident workflows when needed.
Continuously improve production readiness through automation, post-incident learning, and repeatable playbooks for AI runtime issues.
Qualifications 3+ years in SRE, production engineering, platform operations, or security automation with strong coding ability.
Hands-on scripting and coding experience, especially Python, with comfort working against APIs, log pipelines, and automation workflows.
Experience building pragmatic observability and alerting systems in AWS or comparable cloud environments.
Ability to reduce operational toil through automation while keeping signal quality high and false positives manageable.
Comfortable with incident handling, rollback thinking, SLA / SLO discussions, and evidence-driven postmortems.
Interest in AI systems, agent runtimes, and MCP-style integration risks is highly valuable.
Nice to have Software engineering background beyond scripting, including code review and testing habits.
Experience with AI agent runtimes, prompt / tool telemetry, or internal platform hardening for LLM-powered systems.
Experience with privacy-aware telemetry, compliance-oriented logging, or runtime protection products.
لقد تمت ترجمة هذا الإعلان الوظيفي بواسطة الذكاء الاصطناعي وقد يحتوي على بعض الاختلافات أو الأخطاء البسيطة.

المرشح المفضل

عدد سنوات الخبرة
لا يشترط وجود خبرة سابقة
الشهادة
بكالوريوس/ دبلوم عالي

لقد تجاوزت الحد الأقصى المسموح به للتنبيهات الوظيفية (15). يرجى حذف أحد التنبيهات الحالية لإضافة تنبيه جديد.
تم إنشاء تنبيه وظيفي لهذا البحث. ستصلك إشعارات فور الإعلان عن وظائف جديدة مطابقة.
هل أنت متأكد أنك تريد سحب طلب التقديم إلى هذه الوظيفة؟

لن يتم النظر في طلبك لهذة الوظيفة، وسيتم إزالته من البريد الوارد الخاص بصاحب العمل.