| nvidia/Nemotron-CC-v2
100
• 文本处理
• Hugging Face
• NVIDIA
• 2025-12-23
|
| nvidia/Nemotron-Post-Training-Dataset-v2
98
• 文本处理
• Hugging Face
• NVIDIA
• 2025-08-21
|
| internlm/Agent-FLAN
96
• Hugging Face
• Intern Large Models
• 2024-03-20
|
| m-a-p/FineFineWeb
95
• 表格处理
• 文本处理
• Hugging Face
• Multimodal Art Projection
• 2024-12-19
|
| OpenDataArena/ODA-Mixture-100k
95
• 文本处理
• Hugging Face
• OpenDataArena
• 2026-01-21
|
| allenai/qasper
95
• 文本处理
• Hugging Face
• Ai2
• 2022-10-07
|
| EleutherAI/hendrycks_math
94
• 文本处理
• Hugging Face
• EleutherAI
• 2025-01-12
|
| google/boolq
94
• 文本处理
• Hugging Face
• Google
• 2024-01-22
|
| FreedomIntelligence/ALLaVA-4V
92
• 图像处理
• 文本处理
• Hugging Face
• FreedomAI
• 2025-06-08
|
| zai-org/CC-Bench-trajectories
90
• 表格处理
• 文本处理
• Hugging Face
• Z.ai
• 2025-09-30
|
| osunlp/Multimodal-Mind2Web
89
• 图像处理
• 文本处理
• Hugging Face
• OSU NLP Group
• 2024-06-05
|
| unicamp-dl/mmarco
87
• Hugging Face
• unicamp-dl
• 2024-03-06
|
| HuggingFaceTB/smol-smoltalk
87
• 文本处理
• Hugging Face
• Hugging Face Smol Models Research
• 2025-02-06
|
| grammarly/coedit
87
• 文本处理
• Hugging Face
• Grammarly
• 2023-10-21
|
| nvidia/AudioSkills
86
• 音频处理
• Hugging Face
• NVIDIA
• 2026-01-08
|
| TeichAI/glm-4.7-2000x
86
• 文本处理
• Hugging Face
• TeichAI
• 2025-12-23
|
| Helsinki-NLP/opus_books
86
• 文本处理
• Hugging Face
• Helsinki-NLP Research Group
• 2024-03-29
|
| lingshu-medical-mllm/ReasonMed
85
• 文本处理
• Hugging Face
• Lingshu: MLLMs for Unified Multimodal Medical Understanding and Reasoning
• 2025-06-24
|
| stanfordnlp/coqa
84
• 文本处理
• Hugging Face
• Stanford NLP
• 2024-01-04
|
| InternRobotics/InternData-A1
83
• 文本处理
• Hugging Face
• Intern Robotics
• 2026-01-28
|