| 开源状态 | |
| 教程 | |
| 代码 | |
| 下载量 | |
| 项目信息 | |
| 文档 | |
| 引用 | |
| 测试 |
Feature-engine 是一个 Python 库,提供多种转换器,用于为机器学习模型进行特征工程和特征选择。
Feature-engine 的转换器遵循 Scikit-learn 的 API 设计,具有 fit() 和 transform() 方法,可以从数据中学习转换参数,然后进行数据转换。
我们想让更多人了解 Feature-engine。如果你能告诉我们你是如何发现我们的,那将对我们帮助很大。
这样我们就能知道哪些方式有效,以及通过哪些渠道来分享这个项目。
请通过回答 1 个快速问题来分享你的故事
点击此链接
。 😃
通过 PyPI 使用 pip 安装:
pip install feature_engine
通过 Anaconda 安装:
conda install -c conda-forge feature_engine
或者直接克隆仓库:
git clone https://github.com/feature-engine/feature_engine.git
>>> import pandas as pd
>>> from feature_engine.encoding import RareLabelEncoder
>>> data = {'var_A': ['A'] * 10 + ['B'] * 10 + ['C'] * 2 + ['D'] * 1}
>>> data = pd.DataFrame(data)
>>> data['var_A'].value_counts()
Out[1]:
A 10
B 10
C 2
D 1
Name: var_A, dtype: int64
>>> rare_encoder = RareLabelEncoder(tol=0.10, n_categories=3)
>>> data_encoded = rare_encoder.fit_transform(data)
>>> data_encoded['var_A'].value_counts()
Out[2]:
A 10
B 10
Rare 3
Name: var_A, dtype: int64
在我们的 Jupyter Notebook 示例库
或文档 中可以找到更多示例。
有关如何贡献的详细信息,请参阅 贡献页面
简要步骤如下:
git clone https://github.com/<YOURUSERNAME>/feature_engine.git
cd feature_engine
pip install -e .
pip install -e ".[tests]"
git checkout -b myfeaturebranch
谢谢!!
Feature-engine 文档使用 Sphinx 构建,并托管在 Read the Docs 上。
要构建文档,请确保已安装依赖项:从根目录运行:
pip install -r docs/requirements.txt
现在你可以使用以下命令构建文档:
sphinx-build -b html docs build
本仓库的内容采用 BSD 3-Clause 许可证 授权。
Feature-engine 的开发得到了 Train in Data 的支持。