Skalowanie nie zaczyna się od Kubernetes. Zaczyna się od obserwowalności: metryk, logów i alertów, które mówią, co naprawdę dzieje się w systemie.
Drugi krok to wąskie gardła w danych: indeksy, zapytania, kolejki i cache. Większość problemów przy wzroście to nie „serwery”, tylko baza danych i niewydolne ścieżki krytyczne.
Kiedy masz już widoczność, możesz planować architekturę: separację usług, limity, rate limiting, odporność na awarie i sensowną politykę retry.
Najlepsza strategia to stopniowe wzmacnianie fundamentów. Zamiast przepisywać wszystko, wybieraj te elementy, które mają największy wpływ na uptime i koszty.