Происхождение проекта
StarRocks берет свое начало от проекта Apache Doris, который, в свою очередь, развился из Baidu Palo (2017 год). Изначально проект был форком существующего решения, но со временем претерпел значительные изменения.
Ключевые этапы развития
2020-2021 годы стали переломным моментом в истории проекта:
- Команда разработчиков выделилась в отдельный проект
- Была проведена масштабная переработка ключевых компонентов системы
Основные технические улучшения
В период активного развития были реализованы следующие важные функции:
- Векторизированная система выполнения, которая обеспечила ускорение выполнения запросов в 3-5 раз
- Оптимизатор на основе затрат (CBO) — улучшил планирование запросов
- Real-time ingestion — добавлена поддержка интеграции с Kafka, Flink, CDC
- Расширение SQL-диалекта — улучшена поддержка BI-функций
Современное состояние
Текущая версия StarRocks характеризуется следующими особенностями:
- Проект распространяется под лицензией Apache License 2.0
- Существует активная коммерческая поддержка через StarRocks Inc.
- Система развивается как полноценный open-source проект с коммерческим бэкендом
Методологическое развитие
Проект StarRocks эволюционировал от форка Apache Doris до самостоятельной платформы и занял уникальную нишу между:
- Традиционными DWH-системами (Greenplum, Vertica, Teradata)
- Потоковыми системами обработки данных (Kafka + Flink)
StarRocks ориентирован на:
- BI-аналитику в реальном времени
- Работу с большими объемами данных
- Поддержку сложных аналитических запросов
- Интеграцию с современными инструментами аналитики
Текущие направления развития
Ключевые приоритеты развития проекта включают:
- Улучшение производительности запросов
- Расширение возможностей интеграции
- Развитие поддержки Lakehouse-архитектур
- Усиление BI-функционала