| 1. Обзор инцидента |
| Инцидент | SAPP Временами не работали переводы |
| Дата | 27.02.2026 |
| Время начала | 14:51:00 |
| Время решения | 15:53:00 |
| DownTime | 01:02 (62 мин) |
| ИС/Сервис | SAPP |
| Статус | Решено |
| Критичность | High |
| Обзор инцидента |
| Влияние | Пользователи SAPP с первого раза не могли совершить переводы |
| Что произошло? | Выходила ошибка "Не удалось получить курсы валют" |
| Как решили? | Перезагрузили сервисы Colvir |
| Анализ причин |
| Корневая причина (5 why?) | Не известна, на анализе у команды Colvir'a |
| Ретро |
| Что было плохо? | Учитывая что не обёрнуты сервисы в мониторинг, мы заранее не увидили ошибку |
| Уроки |
| Цель | Установить Dynatrace для полного мониторинга SAPP |
| Хронология |
| Время | Событие |
| 14:51 | Renat Tukanov - Тенизбаев Нурбол Нурлубаевич Чистяков Евгений Олегович проблем внутри SAPP по части переводов между собственными счетами и на счета других клиентов внутри банка не наблюдается? Очень медленно у меня отрабатывает и отваливается по таймауту судя по всему (выходит - Нет интернета или что-то такое) |
| 14:53 | Дежурный Мониторинга собрал call в SuperApp_WarRoom - Критический инцидент 📢 |
| 15:38 | Запустили рестарт сервисов Colvir в k8s |
| 15:49 | Поднялись сервисы Colvir в k8s |
| 15:53 | Подтвердили решение проблемы |
| Action Plan |
| Задача | Ответственный | Срок | Статус |
| Провести анализ ошибки | - | 2026-03-06 | Запланировано ⚠️ |
|