数据集简介
哈佛大学专利数据集(HUPD/hupd)是一个专利相关的数据集,收录了美国专利与商标局(USPTO)的专利文献信息。
主要用途
该数据集主要用于专利分析、自然语言处理(NLP)任务以及学术研究,例如专利文本挖掘、分类、信息抽取和技术趋势分析。
数据类型/模态
- 文本数据:包含专利的标题、摘要、权利要求书、说明书等文本内容。
- 结构化数据:可能包含专利的元数据,如申请号、公开号、申请日期、发明人、分类号等。
规模或统计信息
- 下载量:669次
- 点赞数:42次
- 更新日期:2022年10月24日
使用场景
- 学术研究:用于法律、经济学、计算机科学等领域的专利分析研究。
- 机器学习:训练专利分类、相似性匹配或文本生成模型。
- 商业分析:支持企业进行技术竞争情报分析和专利布局研究。