Cloud Spark

Решайте задачи обработки больших массивов данных в несколько кликов с помощью удобного сервиса на основе инструментов с открытым исходным кодом
Сценарии использования Cloud Spark
Распределенная потоковая и пакетная обработка данных из разных источников
SQL‑аналитика
Машинное обучение
Задачи Data Science
Сервис реализован на базе Managed Kubernetes от VK Cloud и Apache Spark


Cloud Spark упрощает и ускоряет обработку данных по сравнению с традиционной инсталляцией Spark, развернутой в Hadoop
Spark в Hadoop
Масштабирование
По клику, встроенные инструменты автоматического масштабирования
Стоимость
Снижение затрат за счет возможности уйти в "сон" и автоматического масштабирования в обе стороны.
Изолируемость
Доступна по клику за счет контейнеризации и Kubernetes
Сloud Spark
Масштабирование
По клику, встроенные инструменты автоматического масштабирования
Стоимость
Снижение затрат за счет возможности уйти в "сон" и автоматического масштабирования в обе стороны.
Изолируемость
Доступна по клику за счет контейнеризации и Kubernetes
Cloud Spark оптимально подходит для работы с ML за счет встроенной масштабируемой библиотеки машинного обучения MLlib
Простое использование
Производительность
Большой выбор алгоритмов и утилит
Преимущества Cloud Spark
FAQ
Нужно ли мне разбираться в Kubernetes для работы с Cloud Spark?
Должен ли я использовать kubectl для запуска приложений в Cloud Spark и управления кластером?
Как научиться работе с Cloud Spark?
Чем отличается Cloud Spark от обычного Spark, например, в составе Hadoop кластера?
Должен ли я собрать свой Docker образ для начала работы с Cloud Spark k8s?
Как запустить своё первое приложение в Cloud Spark?