Техподдержка и SLA: процессы, метрики и эскалации

Почему SLA в эквайринге критичен
Каналы и режим работы службы поддержки
SLA и ключевые метрики: что мы измеряем
Приоритеты инцидентов и целевые сроки
Процесс реагирования и эскалации
Status page и коммуникации
Устойчивость: обходные маршруты и BCP
Мониторинг и алёртинг платёжных потоков
Постинцидентный анализ и профилактика
Интеграции и взаимодействие с вашим стеком
Что присылать в тикет: чек‑лист мерчанта
Отчётность по SLA и сервисные кредиты
Частые зависимости: онлайн‑касса и безопасность
Заключение и следующий шаг

Интернет‑платежи чувствительны к задержкам и сбоям: минуты простоя и процентный пункт просадки авторизаций напрямую бьют по выручке. Поэтому SLA эквайринг — это не формальность, а способ управлять рисками: фиксируем время реакции поддержки, целевые метрики доступности и чёткие сценарии эскалации инцидентов. На этой странице — как устроена наша техподдержка платежей, какие процессы и метрики мы используем, и чего ждать в случае инцидента.

![Схема процесса эскалации — placeholder]

Почему SLA в эквайринге критичен

Деньги и репутация: платёжная ошибка = потеря корзины и лояльности.
Комплаенс и регуляторика: карточные стандарты и 54‑ФЗ требуют устойчивых процессов и трассируемости событий.
Прозрачность для бизнеса: понятные KPI позволяют прогнозировать доступность и планировать нагрузку.

Если вы только изучаете тему, начните с раздела об основах интернет‑эквайринга и сравнения поставщиков (сравнение провайдеров).

Каналы и режим работы службы поддержки

Наша служба поддержки платежей работает 24×7 для критических инцидентов и в расширенном режиме для запросов низкого приоритета.

Каналы обращения:

Оперативные: чат/мессенджер (Telegram), телефон для P1/P2, интеграционный Slack при необходимости.
Тикет‑система: email и портал с приоритетами, SLA и статусами.
Публичные обновления: status page с подпиской на уведомления.

Мы разделяем поддержку мерчанта (B2B) и консультации плательщиков: в интернете это снижает среднее время реакции поддержки и повышает FCR (решение с первого обращения). По вопросам интеграции используйте разделы API и документация и Интеграция с CMS.

SLA и ключевые метрики: что мы измеряем

Ниже — типовые целевые значения (могут отличаться для тарифа/регионов и закрепляются в договоре SLA по эквайрингу).

Метрика	Описание	Целевое значение
Доступность платёжного шлюза (Uptime)	Время доступности критичных сервисов авторизации	99.95% в месяц
MTTA (время до первичной реакции)	От открытия тикета до подтверждения принятия в работу	P1: ≤5 мин; P2: ≤15 мин; P3: ≤60 мин; P4: ≤1 раб. день
MTTR (время восстановления)	До возврата работоспособности или устойчивого workaround	P1: ≤60 мин до обходного решения, ≤4 ч до нормализации; P2: ≤4 ч; P3: ≤2 раб. дня
FCR	Доля запросов, решённых с первого контакта	≥75%
Латентность API	P95 времени авторизации/клиринга	Авторизация ≤1.5 с; Webhook ≤60 с
Ошибки по вине платформы	5xx и системные таймауты	≤0.1% транзакций

Дополнительно в SLA можем фиксировать: график плановых работ, окно информирования, RTO/RPO в рамках BCP (план непрерывности bcp).

Приоритеты инцидентов и целевые сроки

Чёткая классификация ускоряет реакцию и корректно запускает эскалацию инцидентов.

Приоритет	Критерии	Примеры	MTTA/MTTR (цель)
P1 — критический	Простой оплаты для всех/большинства мерчанта, безопасность, утечка	Массовые 5xx, недоступен checkout, компрометация ключей	5 мин / 60 мин (workaround)
P2 — высокий	Серьёзное ухудшение качества сервиса	Резкий рост decline по банку/методу, задержка вебхуков	15 мин / 4 ч
P3 — средний	Частичный функционал/единичные мерчанты	Ошибки при возвратах, рекуррентные отказы	60 мин / 2 раб. дня
P4 — низкий	Консультации, улучшения, документирование	Запросы по аналитике, настройки витрины	1 раб. день / по плану

Под «workaround» понимаем обходной сценарий (включая переключение маршрута), который минимизирует ущерб и восстанавливает приём платежей.

Процесс реагирования и эскалации

Детектирование: алёрты мониторинга или обращение клиента.
Классификация: назначение приоритета (P1–P4) и команды (L1/L2/L3).
Коммуникации: старт обновлений в тикете и на status page (для P1/P2).
Локализация дефекта: анализ логов, метрик, сопутствующих систем (касса, PSP, банк‑эквайер).
Митигация: включение обходных маршрутов, ограничение проблемных методов/регионов.
Нормализация: постоянное исправление, деплой, верификация.
Постмортем: причины, влияние, действия по предотвращению.

Пример эскалационной матрицы для P1:

Условие	Действие	Кого подключаем
5 минут без ответа/эффекта	Эскалация менеджеру инцидента	Incident Manager (24×7)
15 минут без восстановления	Эскалация на L3/архитекторов	L3, SRE, DevOps
30 минут, высокий бизнес‑эффект	Эскалация внешним партнёрам	Банк‑эквайер/PSP, операторы SBP, дата‑центр
Любой риск безопасности	Параллельная ветка SecOps	DPO/CISO, юристы

![Пример статус-страницы провайдера — placeholder]

Status page и коммуникации

Мы поддерживаем публичную status page с историей событий, текущим статусом модулей (авторизация, вебхуки, касса, личный кабинет) и подпиской на уведомления (email/мессенджер). При P1/P2 мы публикуем:

старт инцидента и затронутые регионы/методы;
статус каждые 15–30 минут или по вехам;
подтверждение workaround и ETA на полное восстановление;
постмортем с причинами и действиями.

Рекомендуем закрепить у себя внутренний канал ретрансляции обновлений status page, чтобы коммерция, саппорт и IT видели единый источник истины.

Устойчивость: обходные маршруты и BCP

Чтобы инциденты не останавливали продажи, мы заранее проектируем обходные маршруты и план непрерывности (BCP):

Роутинг по нескольким банкам/PSP, активный failover, балансировка по BIN/региону.
Переключение на альтернативные методы: например, временный перевод трафика в СБП/QR при проблемах с картами.
Feature‑flags: точечное отключение проблемного метода, 3‑D Secure версии, определённого BIN‑пула.
Деградация с сохранением ядра: сбор заказа и отложенная оплата/линк‑инвойс, если checkout временно недоступен.
Дублирование инфраструктуры, резервирование каналов связи, RTO/RPO по данным клиринга и мерчант‑настройкам.

Для специфичных сценариев — рекуррентные платежи, маркетплейсы и split, международные платежи — предусмотрены отдельные runbook’и и маршруты.

Мониторинг и алёртинг платёжных потоков

Мы наблюдаем не только «жив ли хост», но и бизнес‑метрики:

Авторизационные метрики: approve rate, распределение кодов отказов, латентность по P95/P99.
Технические: 5xx, таймауты, ошибки 3‑D Secure, очередь и задержка webhook/Callback.
Финансовые: сверка сумм и статусов, SLA по срокам зачисления.
Синтетические прогоны: платежи‑роботы по ключевым методам ежеминутно.

Дашборды и автоматические отчёты доступны в разделе Аналитика и отчёты. По вашим запросам настраиваем бизнес‑алёрты (например, «просадка approve rate Visa RU на 3 п.п. за 5 минут»).

Постинцидентный анализ и профилактика

Каждый значимый инцидент — обязательный постмортем:

RCA (root cause analysis) с таймлайном событий и связями причин.
Корректирующие действия: тесты, алёрты, архитектурные изменения, обучение.
Превентивные меры: расширение лимитов, пересмотр таймаутов, контрактные изменения с провайдерами.

Итоги документируются и попадают в базу знаний, глоссарий и runbook’и (см. Глоссарий).

Интеграции и взаимодействие с вашим стеком

Чтобы ускорить решения, поддержка плотно работает с вашими разработчиками:

Совместная отладка по API и документации, чёткие форматы логов и корреляционные ID.
Готовые модули для CMS/фреймворков — в разделе Интеграция с CMS.
Советы по росту конверсии и снижению отказов — в разделе Оптимизация конверсии.

Если вы на старте, посмотрите, как быстро пройти онбординг — Как подключить, а условия обслуживания — в разделе Тарифы и комиссии.

Что присылать в тикет: чек‑лист мерчанта

Правильные данные ускоряют диагностику в разы. Пожалуйста, указывайте:

Merchant ID, окружение (prod/sandbox), приоритет (P1–P4) и бизнес‑критичность.
Даты/время (UTC+зона), Payment/Order ID, сумма, валюта, метод оплаты.
Для карт: BIN (первые 6), банк эмитент, 3‑DS step, коды ошибок/decline.
Для СБП/QR: банк плательщика, сессия, статус от участника СБП.
Скриншоты/логи фронтенда и бэкенда (маскируйте персональные и PAN).
Примеры 3–5 проблемных и 3–5 успешных транзакций для сравнения.

По кейсам возвратов и арбитража — раздел Возвраты и чарджбеки.

Отчётность по SLA и сервисные кредиты

Ежемесячно предоставляем отчёты SLA: доступность, MTTA/MTTR, инциденты, выполненные действия по BCP и улучшениям. По договорённости — сервисные кредиты при нарушении SLO, а также сравнение динамики по провайдерам в рамках мульти‑эквайринга.

Частые зависимости: онлайн‑касса и безопасность

Инциденты нередко связаны со смежными компонентами:

Онлайн‑касса и 54‑ФЗ: задержки фискализации, очередь чеков, ошибки ОФД — см. 54‑ФЗ и онлайн‑касса.
Безопасность и соответствие PCI DSS: ключи, токены, шифрование, хранение карт — см. Безопасность и PCI.

В сложных интеграциях мы учитываем влияние этих компонентов на общий SLA эквайринга.

Заключение и следующий шаг

Надёжная техподдержка платежей — это процессы, метрики и дисциплина эскалации. Мы фиксируем SLA по эквайрингу, поддерживаем прозрачную status page, держим готовыми обходные маршруты и BCP, чтобы ваши продажи не останавливались.

Готовы обсудить ваш целевой SLA и сценарии устойчивости? Изучите базовые возможности интернет‑эквайринга, сравните варианты в разделе Сравнение провайдеров и оставьте заявку в разделе Как подключить. Дополнительные ответы — в FAQ и Глоссарии.

Техподдержка и SLA: процессы, метрики и эскалации

Техподдержка и SLA: процессы, метрики и эскалации

Table of contents

Почему SLA в эквайринге критичен

Каналы и режим работы службы поддержки

SLA и ключевые метрики: что мы измеряем

Приоритеты инцидентов и целевые сроки

Процесс реагирования и эскалации

Status page и коммуникации

Устойчивость: обходные маршруты и BCP

Мониторинг и алёртинг платёжных потоков

Постинцидентный анализ и профилактика

Интеграции и взаимодействие с вашим стеком

Что присылать в тикет: чек‑лист мерчанта

Отчётность по SLA и сервисные кредиты

Частые зависимости: онлайн‑касса и безопасность

Заключение и следующий шаг