Нещодавно ми писали, що власники хабів Ajax стикнулися з проблемами – хаби не бачили інші пристрої, були проблеми з авторизацією у застосунках та з постановкою і зняттям з охорони. Проблему вдалося швидко розв’язати, і в компанії розповіли про те, що тоді сталося.
Проблеми були викликані падінням сервера, через нього і виникли неполадки в системі, і команда Ajax Systems вдячна користувачам за їхню терплячість, поки фахівці розв’язували це питання.
“Після всебічного розслідування інциденту аналіз показав, що в наших журналах подій та метриках не було знайдено жодних явних причин для падіння. Ця ситуація створила значну проблему при визначенні основної причини, – говорять у пресслужбі Ajax Systems. – Падіння сервісу сталося через відмову одного з наших серверів, і наша система балансування навантаження не змогла впоратися з цим відразу”.
В компанії заявили, що перші повідомлення про затримку на Постановку/Зняття з охорони почали надходити о 18:08, і фахівці почали розгортати інший кластер сервера. До 18:45 вдалося частково відновити роботу систем та застосунків, але аномальне навантаження на базу даних завадило повністю розгортати кластери серверів кілька разів кожні 30 хвилин. Третя спроба впровадження о 21:15 повністю відновила нормальну комунікацію для всіх застосунків та хабів Ajax.
“Для забезпечення подальшої надійності наших послуг ми активно розглядаємо різні гіпотези, включаючи можливість некоректного використання пам’яті, фатальні помилки ядра Linux або невідстежувані проблеми у службах Amazon Web Services (AWS), – говорять в пресслужбі компанії. – На цих напрямках працюють наші найкращі інженери з кібербезпеки”.
В компанії також запевняють, що функціонал Ajax не обмежується виключно хмарними сервісами, і всі офлайн інструменти доступні незалежно від хмари. Наприклад, пряме підключення до централізованої станції моніторингу, прямі SMS/дзвінки з телефону та використання SpaceControl і KeyPad для увімкнення та вимкнення системи працюватимуть без потреби у з’єднанні з хмарою.
Ajax також працює над політикою щодо екстрених повідомлень, неполадок та інших подібних ситуацій, щоб користувачі вчасно дізнавалися про поточний стан. Однак в компанії сподіваються, що ця політика не стане у пригоді. Також в пресслужбі додали, що команди фахівців ретельно працюють над пошуком можливих проблемних моментів і впровадженням необхідних вдосконалень.
Читайте також: