![绘画](/pycaret/pycaret/raw/master/docs/images/logo.png)
概述 | |
---|---|
持续集成/持续交付 | |
代码 | |
下载 | |
执照 | |
社区 |
PyCaret 是一个开源、低代码的 Python 机器学习库,可自动化机器学习工作流程。它是一种端到端的机器学习和模型管理工具,可以成倍地加快实验周期并提高您的工作效率。
与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,可以用几行代码替换数百行代码。这使得实验的速度和效率呈指数级增长。 PyCaret 本质上是多个机器学习库和框架的 Python 包装器,例如 scikit-learn、XGBoost、LightGBM、CatBoost、Optuna、Hyperopt、Ray 等。
PyCaret 的设计和简单性受到了公民数据科学家这一新兴角色的启发,该术语由 Gartner 首次使用。公民数据科学家是高级用户,他们可以执行简单和中等复杂的分析任务,而这些任务以前需要更多的技术专业知识。 PyCaret 的灵感来自于 R 编程语言中的插入符库。
PyCaret 在 64 位系统上经过测试并受支持:
- Python 3.8、3.9、3.10 和 3.11
- Ubuntu 16.04 或更高版本
- Windows 7 或更高版本
您可以使用 Python 的 pip 包管理器安装 PyCaret:
# install pycaret pip install pycaret
PyCaret 的默认安装不会自动安装所有可选依赖项。根据使用案例,您可能对一项或多项附加功能感兴趣:
# install analysis extras pip install pycaret[analysis]# models extras pip install pycaret[models]
# install tuner extras pip install pycaret[tuner]
# install mlops extras pip install pycaret[mlops]
# install parallel extras pip install pycaret[parallel]
# install test extras pip install pycaret[test]
##
# install multiple extras together pip install pycaret[analysis,models]
检查所有可选的依赖项。如果您想安装所有内容,包括所有可选依赖项:
# install full version pip install pycaret[full]
直接从源安装库的开发版本。 API 可能不稳定。不建议用于生产用途。
pip install git+https://github.com/pycaret/pycaret.git@master --upgrade
Docker 使用容器创建虚拟环境,使 PyCaret 安装与系统的其余部分分开。 PyCaret docker 预装了 Jupyter 笔记本。它可以与其主机共享资源(访问目录、使用 GPU、连接到互联网等)。 PyCaret Docker 镜像始终针对最新的主要版本进行测试。
# default version docker run -p 8888:8888 pycaret/slim# full version docker run -p 8888:8888 pycaret/full
docker run -p 8888:8888 pycaret/full" tabindex="0" role="button">
# Classification Functional API Example# loading sample dataset from pycaret.datasets import get_data data = get_data('juice')
# init setup from pycaret.classification import * s = setup(data, target = 'Purchase', session_id = 123)
# model training and selection best = compare_models()
# evaluate trained model evaluate_model(best)
# predict on hold-out/test set pred_holdout = predict_model(best)
# predict on new data new_data = data.copy().drop('Purchase', axis = 1) predictions = predict_model(best, data = new_data)
# save model save_model(best, 'best_pipeline')
# Classification OOP API Example# loading sample dataset from pycaret.datasets import get_data data = get_data('juice')
# init setup from pycaret.classification import ClassificationExperiment s = ClassificationExperiment() s.setup(data, target = 'Purchase', session_id = 123)
# model training and selection best = s.compare_models()
# evaluate trained model s.evaluate_model(best)
# predict on hold-out/test set pred_holdout = s.predict_model(best)
# predict on new data new_data = data.copy().drop('Purchase', axis = 1) predictions = s.predict_model(best, data = new_data)
# save model s.save_model(best, 'best_pipeline')
功能性API | 面向对象的API |
---|---|
![]() |
![]() |
功能性API | 面向对象的API |
---|---|
![]() |
![]() |
功能性API | 面向对象的API |
---|---|
![]() |
![]() |
功能性API | 面向对象的API |
---|---|
![]() |
![]() |
功能性API | 面向对象的API |
---|---|
![]() |
![]() |
PyCaret 是一个任何人都可以使用的开源库。我们认为 PyCaret 的理想目标受众是:
- 希望提高生产力的经验丰富的数据科学家。
- 喜欢低代码机器学习解决方案的公民数据科学家。
- 想要构建快速原型的数据科学专业人士。
- 数据科学和机器学习的学生和爱好者。
要在 GPU 上训练模型,只需在 setup 函数中传递 use_gpu = True 即可。 API的使用没有变化;但是,在某些情况下,必须安装额外的库。可以在 GPU 上训练以下模型:
- 极端梯度提升
- 猫助推器
- Light Gradient Boosting Machine 需要安装 GPU
- Logistic 回归、岭分类器、随机森林、K 邻域分类器、K 邻域回归器、支持向量机、线性回归、岭回归、套索回归要求cuML >= 0.15
您可以将英特尔优化应用于机器学习算法并加快工作流程。要训练具有英特尔优化的模型,请使用sklearnex
引擎。 API的使用没有变化,但是需要安装Intel sklearnex:
pip install scikit-learn-intelex
PyCaret 是完全免费和开源的,并根据MIT许可证获得许可。
重要链接 | 描述 |
---|---|
⭐教程 | 由核心开发人员开发和维护的教程 |
📋示例笔记本 | 社区创建的示例笔记本 |
📙博客 | PyCaret 创建者的官方博客 |
📚文档 | API文档 |
📺视频 | 视频资源 |
社区备忘单 | |
📢讨论 | GitHub 上的社区讨论区 |
🛠️发行说明 | 发行说明 |