TileDB вводит формате канонических хранения базы данных

tiles.jpg

С тех пор, как откровение, что не все данные могут быть аккуратно хранятся в строках и столбцах, похоже, едва день проходит без появление еще одной новой базы данных с собственным двигателем запросов и уникальной таблицы или файлы в формате. TileDB слилось в силу, кричать, «Остановите это безумие» в своем стремлении создать массивы в качестве новой формы универсального формата хранения.

В отличие от большинства СЕО базе, основатель TileDB Ставрос Пападопулос приходит с научной, а не технологическим сообществом. Что в конечном итоге стало TileDB возникла из еще одного проекта Майкл Stonebraker МИТ SciDB, который предложил СУБД подходит для использования на исследования ученых из-за своей структуры массива, продается как парадигма 4. Поскольку данные не насильно втиснуть в строках и столбцах, то он может представлять собой практически любую структуру данных, и в продаже он был использован для создания многомерных массивов, которые имеют некоторое сходство с поколения денормализованные базы данных хранилища molap.

Но Пападопулос определил один ключевой недостаток SciDB-это не очень хорошо обрабатывать разреженности данных. Вот где многие графы пустые или null, сценарий, что весьма характерно для геномных наборов данных, фокусируясь на том, как видов или особей отличающихся друг от друга; для людей, типичные отклонения в геноме человека едва ли 0.1%. Теоретически, вы могли бы хранить все избыточные данные, но это было бы огромной тратой ресурсов, так что в результате большинство геномных наборов данных очень скудная.

Так основатель Пападопулос покинул башню из слоновой кости в MIT и, поддерживаемая посевное финансирование от Intel капитал, начали TileDB. Это поднимает, где SciDB листья путем создания разреженности в ее оптимизации, и, в отличие от большинства баз данных, полностью концентрируется на хранение данных и управления, но оставляет вычислительные машины/запрос в качестве замены. Это обратное тому, что базы данных, как MySQL и MariaDB, где они имеют общего уровня вычислений, но сделать механизм хранения сменной. Так, например, TileDB версии данных, поддерживает «путешествие во времени» (мы предполагаем, через снимки), а также решает задачи обслуживания, такие как контроль доступа, протоколирование и управление метаданными.

Но в некоторых отношениях, TileDB образом очень похожий шаблон проектирования в облаке всемирную базу данных, где механизм хранения является общим, но через разные API. Майкрософт космос DB-это самый известный пример такого подхода, имея базовый уровень хранилища с API для SQL, формат JSON, график, и широкая колонна. Кроме того, Amazon Aurora и Keyspaces, вместе с гаечным ключем Google облако и облачные хранилища данных, все бегут в хранилище системы через API.

TileDB предлагает два продукта. Она включает в себя TileDB встроенные, с открытым исходным кодом, нативных облачных и хранение библиотека для многомерных массивов и TileDB облако, без использования сервера версии SaaS для обмена данными и кодом и обеспечивает условия для эффективного вычисления, которые в настоящее время работает на AWS и использует S3 для физического хранилища.

Благодаря использованию облачных систем хранения данных, реферирование вычислительные ядра запросов, и с облачным предложением, которое предназначено для бессерверной, TileDB способствует ее способность к масштабированию. Объявив недавно в серии финансирования $15 млн, компания первоначально была направлена случаев применения в геномике и геопространственных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *