Sayt etibarlılığı mühəndisliyi üzrə aparıcı/baş mühəndis
at
ABB
Tam ştat
Görəcəyiniz işlər:
Mikroservis əsaslı tətbiqlər üçün xidmət səviyyəsi göstəriciləri (SLI) və məqsədlərini (SLO) müəyyənləşdirmək və həyata keçirmək
İnformativ panellər, metriklər və xəbərdarlıq mexanizmləri quraşdırmaq və təkmilləşdirmək
Sistem müşahidəsini davamlı yaxşılaşdırmaq - metriklər və izləmə sistemlərini təkmilləşdirərək sistem performansına daha dərin nəzarət, problem həlli vaxtını azaltmaq və proaktiv incident aşkarlanmasına dəstək vermək
İnfrastruktur, tətbiq və xidmət etibarlılığı üçün yüksək standartlar təyin edərək kod review vasitəsilə ən yaxşı təcrübələri irəli sürmək, mühəndisləri təlim etmək və komandalar arasında arxitektura və deployment proseslərinə təsir etmək
Strukturlaşdırılmış növbətçilik dəstək prosesinin (On Call) inkişafına və tətbiqinə töhfə vermək
İnsidentlər və əməliyyat anormallıqlarını araşdırmaq, həll etmək, əsas səbəb təhlili aparmaq və sonrakı təhlil prosesini həyata keçirmək
Təkrarlanan və ya manual əməliyyat tapşırıqlarını ("toil") müəyyən etmək, səmərəlilik və etibarlılığı artırmaq üçün skriptlər və ya avtomatlaşdırma həlləri hazırlamaq
Development, QA və Platform komandaları ilə sıx işbirliyi edərək etibarlılıq, genişlənə bilmə qabiliyyəti və təhlükəsizliyin sistem və tətbiq dizaynlarına inteqrasiya edilməsini təşviq etmək
Yeni texnologiyaları və yenilikləri izləmək, sistem davamlılığını və əməliyyat mükəmməlliyini artıran yeni alətlər və ya yanaşmaların qəbulu üçün tövsiyələr vermək
Bizim üçün uyğun namizəd:
Kompüter Mühəndisliyi və ya Kompüter Elmləri sahəsində ali təhsil
Əla ünsiyyət bacarıqları - komanda təşkilatdaxili digər komandalarla sıx əməkdaşlıq edəcək
Linux təcrübəsi və şəbəkə sistemləri ilə tanışlıq
Python, Java və ya Go proqramlaşdırma dillərindən biri ilə təcrübə (Java üstünlükdür)
Mürəkkəb, genişmiqyaslı distributed sistemlərdə konteyner orkestrləşdirilməsi (nümunə: kubernetes), yük balanslaşdırıcıları (load balancers), verilənlər bazaları və storage sistemləri ilə tanışlıq
Güclü problem həll etmə qabiliyyəti(troubleshooting) və mövcud problemləri həll etməyi öyrənmək istəyi
Monitoring frameworklər ilə təcrübə, (OpenTelemetry üstünlükdür)
Prometheus + Thanos, Grafana Tempo, Grafana Loki ilə təcrübə (üstünlükdür)
OpenShift ilə təcrübə (üstünlükdür)