هندسة موثوقية موقع ويكيميديا
Site Reliability Engineering
|
فريق هندسة موثوقية الموقع، أو SRE باختصار، هو الفريق المسؤول عن تطوير وصيانة البنية التحتية للإنتاج في ويكيميديا. كانت تُعرف سابقًا باسم العمليات الفنية، وهي مسؤولة عن التأكد من أن جميع مواقع وخدمات ويكيميديا التي يستخدمها الجمهور (بما في ذلك ميدياويكي وجميع الخدمات المرتبطة بها) تعمل بشكل موثوق وآمن وبأداء عالٍ.
أبلغنا بحالات الطوارئ باستخدام Klaxon.
يمكن العثور على وثائق إضافية تتعلق بالبنية التحتية لدينا وعمل الفريق على Wikitech.
هيكل الفريق
Collaboration Services
We are responsible for building and maintaining the infrastructure aspects of the source code management, CI and CD, task and ticket management systems as well as hosting non-MediaWiki websites and other collaboration services.
عمليات مركز البيانات
يتولى فريق عمليات مركز البيانات مسؤولية جميع عمليات نشر مركز بيانات ويكيميديا والخدمات اللوجستية بالإضافة إلى الحفاظ على تواجدنا في مواقع حول العالم. إنهم يؤدون العمل في الموقع ويحافظون على دورة الحياة الكاملة البالغة 5 سنوات (المواصفات، والشراء، والتثبيت الفعلي، والكسر/الإصلاح، وإيقاف التشغيل) لجميع الأجهزة.
أسس البنية التحتية
يركز الفريق على بناء وصيانة منصتنا الأساسية ("السحابة المعدنية") التي تشكل الأسس التي يعتمد عليها كل شيء آخر تقريبًا في بنيتنا التحتية. علاوة على عمليات النشر المخصصة لدينا، تشمل مسؤولياتهم (على سبيل المثال لا الحصر) أنظمة إدارة التكوين وأتمتة البنية التحتية وأدوات التنسيق وأمن البنية التحتية وعمليات الشبكة.
#wikimedia-sre-foundations تواصل
إمكانية الملاحظة
يعمل فريق Observability، أو "o11y" باختصار، عبر SRE والتكنولوجيا لتزويد الفرق بأدوات التشخيص والأنظمة الأساسية والرؤى حول كيفية أداء الأنظمة والخدمات. فهو يستفيد من تقنيات مثل Grafana وKibana/Logstash وOpenSearch وPrometheus وAlertManager والمزيد.
#wikimedia-observability تواصل
حركة المرور
يتولى فريق المرور مسؤولية الطبقة الأولى المهمة من البنية التحتية ذات حركة المرور العالية والتي تمتد الآن في معظم أنحاء العالم، بما في ذلك طبقات إنهاء TLS والتخزين المؤقت (ATS، Varnish)، وموازنة التحميل، وDNS، وشبكتنا الخاصة.
ثبات البيانات
يركز فريق استمرارية البيانات على أنظمة تخزين واسترجاع البيانات المستمرة في ويكيميديا، بما في ذلك قواعد بيانات SQL وتخزين الكائنات (الموزعة) وتخزين الملفات وأنظمة النسخ الاحتياطي.
#wikimedia-data-persistence تواصل
عمليات الخدمة
يعتني فريق عمليات الخدمة بالخدمات العامة و"المرئية للمستخدم" بالتعاون الوثيق مع كل من فريقي التكنولوجيا والمنتجات. يتضمن ذلك منصة MediaWiki الخاصة بنا، والبنية التحتية لخدمة SOA المستندة إلى Kubernetes، بالإضافة إلى الخدمات التي تواجه المجتمع والمطورين مثل Gitlab وGerrit وPhabricator وVRTS.
الاتصال بالفريق
إذا كنت بحاجة إلى الاتصال بالفريق، هناك تعليمات مفصلة على wikitech:SRE Team requests.