微软必应新冠相关查询数据集
数据集简介
这是一个由微软(Microsoft)发布的公开数据集,包含了用户在必应(Bing)搜索引擎上提交的与新冠病毒(COVID-19)相关的查询记录。
主要用途
该数据集主要用于研究在新冠疫情期间,公众通过搜索引擎关注和搜索哪些与疫情相关的信息,可用于分析公众兴趣、信息需求趋势、以及疫情相关的社会行为研究。
数据类型与模态
- 模态类型:表格数据(Tabular)、文本(Text)
- 数据格式:Parquet
- 数据规模:包含约 31.8 万行数据记录
使用场景
- 信息流行病学研究:分析疫情不同阶段公众关注焦点的演变。
- 自然语言处理(NLP):可用于训练或评估与疫情相关的查询理解、意图分类或主题挖掘模型。
- 社会科学研究:探究重大公共卫生事件下的公众信息寻求行为与社会心理。