Ликбез

История развития проекта StarRocks

Starrocks

Происхождение проекта

StarRocks берет свое начало от проекта Apache Doris, который, в свою очередь, развился из Baidu Palo (2017 год). Изначально проект был форком существующего решения, но со временем претерпел значительные изменения.

Ключевые этапы развития

2020-2021 годы стали переломным моментом в истории проекта:
  • Команда разработчиков выделилась в отдельный проект
  • Была проведена масштабная переработка ключевых компонентов системы

Основные технические улучшения

В период активного развития были реализованы следующие важные функции:
  • Векторизированная система выполнения, которая обеспечила ускорение выполнения запросов в 3-5 раз
  • Оптимизатор на основе затрат (CBO) — улучшил планирование запросов
  • Real-time ingestion — добавлена поддержка интеграции с Kafka, Flink, CDC
  • Расширение SQL-диалекта — улучшена поддержка BI-функций

Современное состояние

Текущая версия StarRocks характеризуется следующими особенностями:
  • Проект распространяется под лицензией Apache License 2.0
  • Существует активная коммерческая поддержка через StarRocks Inc.
  • Система развивается как полноценный open-source проект с коммерческим бэкендом

Методологическое развитие

Проект StarRocks эволюционировал от форка Apache Doris до самостоятельной платформы и занял уникальную нишу между:
  • Традиционными DWH-системами (Greenplum, Vertica, Teradata)
  • Потоковыми системами обработки данных (Kafka + Flink)
StarRocks ориентирован на:
  • BI-аналитику в реальном времени
  • Работу с большими объемами данных
  • Поддержку сложных аналитических запросов
  • Интеграцию с современными инструментами аналитики

Текущие направления развития

Ключевые приоритеты развития проекта включают:
  • Улучшение производительности запросов
  • Расширение возможностей интеграции
  • Развитие поддержки Lakehouse-архитектур
  • Усиление BI-функционала