Apache Mahout

редактировать
Apache Mahout
Apache Mahout Logo
Разработчик (и) Apache Software Foundation
Первоначальный выпуск7 апреля 2009 г.; 11 лет назад (07.04.2009)
Стабильный выпуск 14.1 / 7 октября 2020 г.; 6 дней назад (07.10.2020)
Репозиторий Репозиторий Mahout
Написан наJava, Scala
Операционная система Кросс-платформенная
Тип Машинное обучение
Лицензия Apache License 2.0
Веб-сайтmahout.apache.org

Apache Mahout является проектом Apache Software Foundation для создания бесплатных реализаций распределенных или иным образом масштабируемых алгоритмов машинного обучения, ориентированных главным образом на линейную алгебру. В прошлом многие реализации использовали платформу Apache Hadoop, однако сегодня она в первую очередь ориентирована на Apache Spark. Mahout также предоставляет библиотеки Java / Scala для общих математических операций (ориентированных на линейную алгебру и статистику) и примитивных коллекций Java. Mahout находится в стадии разработки; был реализован ряд алгоритмов.

В то время как основные алгоритмы Mahout для кластеризации, классификация и пакетная совместная фильтрация реализованы поверх Apache Hadoop с использованием map / reduce парадигма, она не ограничивает вклад в реализации на основе Hadoop. Также приветствуются вклады, которые выполняются на одном узле или в кластере, отличном от Hadoop. Например, рекомендательный компонент совместной фильтрации «Вкус» в Mahout изначально был отдельным проектом и может работать автономно без Hadoop.

Начиная с версии 0.10.0, проект сместил фокус на создание независимой от серверной части среды программирования под кодовым названием «Samsara». Среда состоит из алгебраического оптимизатора, не зависящего от серверной части, и алгебраического DSL Scala, объединяющего операторы оперативной памяти и распределенные алгебраические операторы. Поддерживаемые алгебраические платформы: Apache Spark, H2O и Apache Flink. Поддержка алгоритмов MapReduce начала постепенно прекращаться в 2014 году.

Особенности

  • Доменно-специфический язык (DSL) Mahout-Samsara Scala
  • В августе 2016 года была разработана структура для создания интерфейса «Python Like» для пользователей, которым нужны готовые алгоритмы. См. MAHOUT PR 246.
  • В октябре 2016 года началась работа по аппаратному ускорению, в частности, с использованием ViennaCL (для ускорения на основе графического процессора) и OpenMP (для ускорения ЦП вне JVM) см. MAHOUT PR 261

.

.

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-11 20:10:47
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте