Автор (ы) | Дэвид Курнапо |
---|---|
Первый выпуск | июнь 2007 г.; 13 лет назад (2007-06) |
Стабильный выпуск | 0.23.2 / 4 августа 2020 г.; 2 месяца назад (4 августа 2020 г.) |
Репозиторий | |
Написано на | Python, Cython, C и C ++ |
Операционная система | Linux, macOS, Windows |
Тип | Библиотека для машинного обучения |
Лицензия | Новая лицензия BSD |
Веб-сайт | scikit-learn.org |
Scikit-learn (ранее scikits.learn, а также sklearn ) - это бесплатное программное обеспечение машинное обучение библиотека для Python языка программирования. Он содержит различные алгоритмы классификации, регрессии и кластеризации, включая векторные машины поддержки, случайные леса, повышение градиента, k-means и DBSCAN, и разработан для взаимодействия с числовыми и научными библиотеками Python NumPy и SciPy.
Проект scikit-learn начался как scikits.learn, проект Google Summer of Code, созданный Дэвидом Курнапо. Его название происходит от того, что это «SciKit» (SciPy Toolkit), отдельно разработанное и распространяемое сторонним расширением для SciPy. Исходная кодовая база позже была переписана другими разработчиками. В 2010 году Фабиан Педрегоса, Гаэль Вароко, Александр Грамфор и Винсент Мишель, все из Французского института исследований в области компьютерных наук и автоматизации в Роккенкур, Франция, приняли руководство проекта и выпустило первый публичный релиз 1 февраля 2010 года. Из различных scikit scikit-learn, а также scikit-image были описаны как «хорошо поддерживаемые и популярные» в ноябре 2012 года. Scikit-learn - одна из самых популярных библиотек машинного обучения на GitHub.
Scikit-learn в основном написана на Python и широко использует numpy для обеспечения высокой производительности. линейная алгебра и операции с массивами. Кроме того, некоторые основные алгоритмы написаны на Cython для повышения производительности. Машины опорных векторов реализуются оболочкой Cython вокруг LIBSVM ; машины логистической регрессии и линейных векторов поддержки с помощью аналогичной оболочки вокруг LIBLINEAR. В таких случаях расширение этих методов с помощью Python может оказаться невозможным.
Scikit-learn хорошо интегрируется со многими другими библиотеками Python, такими как matplotlib и plotly для построения графиков, numpy для векторизации массивов, pandas dataframes, scipy и многое другое.
Scikit-learn был первоначально разработан Дэвидом Курнапо как Google летний проект кода в 2007 году. Позже к проекту присоединился Матье Брюхе и начал его использовать в рамках его дипломной работы. В 2010 г. подключился INRIA, Французский институт исследований в области компьютерных наук и автоматизации, и в конце января 2010 г. был опубликован первый общедоступный выпуск (v0.1 beta).