Мы подошли к этому, как к стратегической задаче, которая требует внимания к выбору оборудования и сетевых связей, чтобы система оставалась работоспособной при любых отказах. Материалы о том, как строятся отказоустойчивые системы и кластеры, мы нашли на https://dataru.ru/technology, где каждое решение описано с точки зрения архитектуры и практической пользы. Сначала это дало нам понимание, какие компоненты должны быть резервированы. Затем мы внедрили кластер с автоматическим переключением при сбоях, и теперь даже при отключении узла сервисы продолжают работать. Это позволило избежать потерь рабочего времени и данных. Система стала намного устойчивее, и мы уверены в её стабильности.
|