Python 中的开源低代码机器学习库

🎉🎉🎉 PyCaret 3.0 现已推出。 🎉🎉🎉

`pip install --upgrade pycaret`

文档• 教程• 博客• LinkedIn • YouTube • Slack

概述
持续集成/持续交付
代码
下载
执照
社区

欢迎来到 PyCaret

PyCaret 是一个开源、低代码的 Python 机器学习库，可自动化机器学习工作流程。它是一种端到端的机器学习和模型管理工具，可以成倍地加快实验周期并提高您的工作效率。

与其他开源机器学习库相比，PyCaret 是一个替代的低代码库，可以用几行代码替换数百行代码。这使得实验的速度和效率呈指数级增长。 PyCaret 本质上是多个机器学习库和框架的 Python 包装器，例如 scikit-learn、XGBoost、LightGBM、CatBoost、Optuna、Hyperopt、Ray 等。

PyCaret 的设计和简单性受到了公民数据科学家这一新兴角色的启发，该术语由 Gartner 首次使用。公民数据科学家是高级用户，他们可以执行简单和中等复杂的分析任务，而这些任务以前需要更多的技术专业知识。 PyCaret 的灵感来自于 R 编程语言中的插入符库。

🚀 安装

🌐 选项 1：通过 PyPi 安装

PyCaret 在 64 位系统上经过测试并受支持：

Python 3.8、3.9、3.10 和 3.11
Ubuntu 16.04 或更高版本
Windows 7 或更高版本

您可以使用 Python 的 pip 包管理器安装 PyCaret：

# install pycaret
pip install pycaret

PyCaret 的默认安装不会自动安装所有可选依赖项。根据使用案例，您可能对一项或多项附加功能感兴趣：

# install analysis extras
pip install pycaret[analysis]
# models extras
pip install pycaret[models]
# install tuner extras
pip install pycaret[tuner]
# install mlops extras
pip install pycaret[mlops]
# install parallel extras
pip install pycaret[parallel]
# install test extras
pip install pycaret[test]
##
# install multiple extras together
pip install pycaret[analysis,models]

检查所有可选的依赖项。如果您想安装所有内容，包括所有可选依赖项：

# install full version
pip install pycaret[full]

📄 选项 2：从源代码构建

直接从源安装库的开发版本。 API 可能不稳定。不建议用于生产用途。

pip install git+https://github.com/pycaret/pycaret.git@master --upgrade

📦选项3：Docker

Docker 使用容器创建虚拟环境，使 PyCaret 安装与系统的其余部分分开。 PyCaret docker 预装了 Jupyter 笔记本。它可以与其主机共享资源（访问目录、使用 GPU、连接到互联网等）。 PyCaret Docker 镜像始终针对最新的主要版本进行测试。

# default version docker run -p 8888:8888 pycaret/slim

# full version docker run -p 8888:8888 pycaret/full

<clipboard-copy aria-label="Copy" class="ClipboardButton btn btn-invisible js-clipboard-copy m-2 p-0 tooltipped-no-delay d-flex flex-justify-center flex-items-center" data-copy-feedback="Copied!" data-tooltip-direction="w" value="# default version docker run -p 8888:8888 pycaret/slim

full version

docker run -p 8888:8888 pycaret/full" tabindex="0" role="button">

🏃‍♂️ 快速入门

1. 函数式API

# Classification Functional API Example
# loading sample dataset
from pycaret.datasets import get_data
data = get_data('juice')
# init setup
from pycaret.classification import *
s = setup(data, target = 'Purchase', session_id = 123)
# model training and selection
best = compare_models()
# evaluate trained model
evaluate_model(best)
# predict on hold-out/test set
pred_holdout = predict_model(best)
# predict on new data
new_data = data.copy().drop('Purchase', axis = 1)
predictions = predict_model(best, data = new_data)
# save model
save_model(best, 'best_pipeline')

2.面向对象的API

# Classification OOP API Example
# loading sample dataset
from pycaret.datasets import get_data
data = get_data('juice')
# init setup
from pycaret.classification import ClassificationExperiment
s = ClassificationExperiment()
s.setup(data, target = 'Purchase', session_id = 123)
# model training and selection
best = s.compare_models()
# evaluate trained model
s.evaluate_model(best)
# predict on hold-out/test set
pred_holdout = s.predict_model(best)
# predict on new data
new_data = data.copy().drop('Purchase', axis = 1)
predictions = s.predict_model(best, data = new_data)
# save model
s.save_model(best, 'best_pipeline')

📁 模块

分类

功能性API	面向对象的API

回归

功能性API	面向对象的API

时间序列

功能性API	面向对象的API

聚类

功能性API	面向对象的API

异常检测

功能性API	面向对象的API

👥 谁应该使用 PyCaret？

PyCaret 是一个任何人都可以使用的开源库。我们认为 PyCaret 的理想目标受众是：

希望提高生产力的经验丰富的数据科学家。
喜欢低代码机器学习解决方案的公民数据科学家。
想要构建快速原型的数据科学专业人士。
数据科学和机器学习的学生和爱好者。

🎮 在 GPU 上进行训练

要在 GPU 上训练模型，只需在 setup 函数中传递 use_gpu = True 即可。 API的使用没有变化；但是，在某些情况下，必须安装额外的库。可以在 GPU 上训练以下模型：

极端梯度提升
猫助推器
Light Gradient Boosting Machine 需要安装 GPU
Logistic 回归、岭分类器、随机森林、K 邻域分类器、K 邻域回归器、支持向量机、线性回归、岭回归、套索回归要求cuML >= 0.15

🖥️ PyCaret Intel sklearnex 支持

您可以将英特尔优化应用于机器学习算法并加快工作流程。要训练具有英特尔优化的模型，请使用sklearnex引擎。 API的使用没有变化，但是需要安装Intel sklearnex：

pip install scikit-learn-intelex

🤝 贡献者

📝 许可证

PyCaret 是完全免费和开源的，并根据MIT许可证获得许可。

ℹ️更多信息

重要链接	描述
⭐教程	由核心开发人员开发和维护的教程
📋示例笔记本	社区创建的示例笔记本
📙博客	PyCaret 创建者的官方博客
📚文档	API文档
📺视频	视频资源
✈️ 备忘单	社区备忘单
📢讨论	GitHub 上的社区讨论区
🛠️发行说明	发行说明

yuanzhongqiao / pycaret Goto Github PK

pycaret's Introduction