Разработчик (и) | Apache Software Foundation |
---|---|
Первоначальный выпуск | 7 апреля 2009 г.; 11 лет назад (07.04.2009) |
Стабильный выпуск | 14.1 / 7 октября 2020 г.; 6 дней назад (07.10.2020) |
Репозиторий | Репозиторий Mahout |
Написан на | Java, Scala |
Операционная система | Кросс-платформенная |
Тип | Машинное обучение |
Лицензия | Apache License 2.0 |
Веб-сайт | mahout.apache.org |
Apache Mahout является проектом Apache Software Foundation для создания бесплатных реализаций распределенных или иным образом масштабируемых алгоритмов машинного обучения, ориентированных главным образом на линейную алгебру. В прошлом многие реализации использовали платформу Apache Hadoop, однако сегодня она в первую очередь ориентирована на Apache Spark. Mahout также предоставляет библиотеки Java / Scala для общих математических операций (ориентированных на линейную алгебру и статистику) и примитивных коллекций Java. Mahout находится в стадии разработки; был реализован ряд алгоритмов.
В то время как основные алгоритмы Mahout для кластеризации, классификация и пакетная совместная фильтрация реализованы поверх Apache Hadoop с использованием map / reduce парадигма, она не ограничивает вклад в реализации на основе Hadoop. Также приветствуются вклады, которые выполняются на одном узле или в кластере, отличном от Hadoop. Например, рекомендательный компонент совместной фильтрации «Вкус» в Mahout изначально был отдельным проектом и может работать автономно без Hadoop.
Начиная с версии 0.10.0, проект сместил фокус на создание независимой от серверной части среды программирования под кодовым названием «Samsara». Среда состоит из алгебраического оптимизатора, не зависящего от серверной части, и алгебраического DSL Scala, объединяющего операторы оперативной памяти и распределенные алгебраические операторы. Поддерживаемые алгебраические платформы: Apache Spark, H2O и Apache Flink. Поддержка алгоритмов MapReduce начала постепенно прекращаться в 2014 году.
.
.