配套阅读:使用 ChatGPT 和 LangChain 的代理与工具创建(基本)自主的 HR 助手
这是一个企业级应用原型——一个能够使用其现有工具回答 HR 查询的自主代理。它使用 LangChain 的代理和工具模块构建,以 Pinecone 作为向量数据库,并由 ChatGPT 或 gpt-3.5-turbo 提供支持。前端使用 Streamlit 框架和 streamlit_chat 组件。
可用工具:
1. 考勤政策 - 一份由 ChatGPT 生成的示例 HR 政策文档。使用 OpenAI 的 text-embedding-ada-002 模型为该文档创建嵌入向量,并存储在 Pinecone 索引中。
2. 员工数据 - 一个包含虚拟员工数据(如姓名、主管、休假天数等)的 CSV 文件。它被加载为 pandas DataFrame,并由 LLM 通过 LangChain 的 PythonAstREPLTool 进行操作。
3. 计算器 - 这是 LangChain 的计算器链模块 LLMMathChain。


pip install -r requirements.txt。hr_agent_backend_local.py 文件中输入你自己的 API 密钥(如果想使用 Azure 版本,请在 hr_agent_backend_azure.py 中输入,并在 frontend.py 文件中取消相应注释)。streamlit run hr_agent_frontent.py。store_embeddings_in_pinecone.ipynb。将 Pinecone 和 OpenAI 的 API 密钥(用于嵌入模型)替换为你自己的密钥。Azure OpenAI 服务 - 面向 Azure 客户的 OpenAI 服务。
LangChain - 围绕 LLM 构建应用程序的开发框架。
Pinecone - 用于存储嵌入向量的向量数据库。
Streamlit - 用于前端开发。部署 Python Web 应用的轻量级框架。
Azure Data Lake - 用于存放员工数据 CSV 文件。任何其他云存储(如 Blob、S3 等)同样适用。
Azure Data Factory - 用于创建数据管道。
SAP HCM - 员工数据的源系统。
欢迎通过以下方式联系我:
领英:https://www.linkedin.com/in/stephenbonifacio/
推特:https://twitter.com/Stepanogil