Компания JetBrains анонсировала бета-версию приложения Datalore, созданного для анализа данных на Python.
Datalore имеет сразу ряд преимуществ перед известными опенсорсными решениями для задач машинного обучения (к примеру, Jupiter Notebook): все необходимые инструменты data science здесь доступны сразу «из коробки», а умный редактор кода на Python облегчает процесс анализа данных. Ниже перечислим некоторые из основных особенностей Datalore.
Как и все продукты JetBrains, Datalore оснащен умным редактором, который облегчает рабочий процесс автодополнениями, подсветкой синтаксиса, инспекциями, а также подсказками и автогенерацией релевантного кода по нажатию одной кнопки.
Кроме того, присутствует поддержка инкрементальных вычислений, что позволяет не перезапускать весь воркбук с нуля, в том случае, если пользователь просто заменил одну строку или добавил ячейку. Datalore автоматически запускает вычисление только тех операций, которые зависели от правок. С учетом того, что все вычисления запускаются автоматически, в окне вывода всегда будут отображены самые актуальные цифры и таблицы.
Также разработчики подчеркивают, что Datalore объединяет все основные инструменты data science в одном веб-приложении: от базовых библиотек для работы с данными (библиотеки алгоритмов машинного обучения sklearn, библиотеки pytorch для алгоритмов deep learning) до мощных инструментов для визуализации. Так, datalore.plot — это реализованный на Phyton аналог библиотеки ggplot языка R. Модуль datalore.geo_maps разработан специально для создания интерактивных карт.
Datalore сохраняет весь процесс анализа в облаке. Работа начинается с удобного файлового хранилища всех воркбуков. То есть можно поделиться с коллегами ссылкой на воркбук и решать задачи совместно: Datalore поддерживает одновременную работу нескольких пользователей. Изменения в воркбуке сохраняются автоматически, так что можно забыть о безнадежно утраченных данных.
Так как сервис заточен на работу с данными, тщательно продумали и защиту информации. Разработчики заверили нас, что в архитектуру Datalore заложены фичи, обеспечивающие надежное хранение в облаке, благодаря которым датасеты пользователей находятся в безопасности.
"Лично я больше всего доволен внедрением инкрементальных перевычислений: необходимость перезапускать код с нуля после малейших изменений тяготит, а в анализе, визуализации данных таких изменений множество. В Datalore пользователь сразу же видит результаты своих правок, причем пересчитываются зависевшие от них процессы. Ну и интеллектуальный редактор кода, разумеется, наша сильная сторона. Мы хотим, чтобы человеку было в радость работать с данными, поэтому стремимся развивать функционал, который делает процесс работы аналитика легче и избавляет от рутины", — рассказал ][ Константин Соломатов, руководитель проекта Datalore в компании JetBrains.
В режиме публичной беты Datalore доступен по бесплатному коммьюнити-плану. В дальнейшем плата за использование будет зависеть от объема загруженных данных и использованных мощностей.
Зарегистрировать и опробовать Datalore в деле можно на datalore.io. Специалисты JetBrains призывают пользователей оставлять комментарии и отзывы о продукте на официальном форуме.