Эволюция ML-платформы на базе Kubernetes
TIP! Right-click and select "Save link as..." to download.
ML-платформа — повседневный инструмент ML-инженера в Тинькофф. Под капотом это большой и сложный инфраструктурный проект. Команда разработки прошла большой путь переезда со Slurm на Kubernetes. В докладе Никита расскажет, как они учились запускать задачи в Kubernetes и какие подводные камни встретили на пути. Поделится, как в итоге внедрили open source решение в процесс оркестрации в платформе и решили часть проблем.