OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  sheetsmith:基于 Pandas 的 CSV 与 Excel 管理工具,支持快速预览

sheetsmith:基于 Pandas 的 CSV 与 Excel 管理工具,支持快速预览

 
  frontend ·  2026-02-07 03:20:04 · 3 次点击  · 0 条评论  

名称: sheetsmith
描述: 基于 Pandas 的 CSV 与 Excel 管理工具,支持快速预览、摘要统计、筛选过滤、数据转换和格式转换。当你需要查看电子表格文件、计算列级统计、应用查询或表达式,或将清洗后的数据导出为新 CSV/TSV/XLSX 文件时,可使用此技能,无需每次都重写 pandas 代码。


Sheetsmith

概述

Sheetsmith 是一个轻量级的 pandas 封装工具,专注于处理 CSV/Excel 文件:预览、描述、筛选、转换和格式转换一站式完成。CLI 位于 skills/sheetsmith/scripts/sheetsmith.py,它能自动加载任何 CSV/TSV/Excel 文件,报告结构元数据,运行 pandas 表达式,并安全地将结果写回。

快速开始

  1. 将电子表格文件(CSV、TSV 或 XLS/XLSX)放入工作空间,或通过完整路径引用。
  2. 运行 python3 skills/sheetsmith/scripts/sheetsmith.py <命令> <路径>,命令说明见下文。
  3. 修改数据时,可提供 --output 新文件 保存副本,或使用 --inplace 覆盖源文件。
  4. 查看 references/usage.md 获取更多示例命令和技巧。

命令

summary

打印行数/列数、数据类型分布、存在缺失值的列,以及头部/尾部预览。使用 --rows 控制摘要后显示的行数,--tail 可预览尾部而非头部。

describe

运行 pandas.DataFrame.describe(include='all')(可通过 --include 自定义),快速查看数值统计、基数及频率信息。使用 --percentiles 可添加额外百分位线。

preview

快速以表格形式预览前几行(--rows)或后几行(--tail),便于在执行操作前检查列顺序或格式。

filter

通过 --query 输入 pandas 查询字符串(例如 state == 'CA' and population > 1e6)。该命令可打印筛选后的行,或在使用 --output 时,将筛选后的表格写入新的 CSV/TSV/XLSX 文件。添加 --sample 可查看随机子集而非全部结果。

transform

创建新列、重命名或删除现有列,并立即查看结果表。提供一个或多个 --expr 表达式,如 total = quantity * price。使用 --rename 旧名:新名--drop 列名 重塑表格,并通过 --output--inplace 持久化更改。预览版本(不写入)使用与其他命令相同的 --rows/--tail 标志。

convert

在支持的格式(CSV/TSV/Excel)之间转换。始终使用 --output 指定目标扩展名,工具会自动检测合适的写入器(Excel 使用 openpyxl,CSV 默认保留逗号分隔符,TSV 使用制表符)。这是在运行其他命令前标准化数据的最简单方式。

工作流规则

  • 始终保留原始文件的副本或写入新路径;脚本仅在明确要求 --inplace 时才会覆盖原始文件。
  • 同一 CLI 既可用于探索(summarypreviewdescribe),也可用于编辑(filtertransform)。--output 标志适用于筛选和转换命令,便于轻松分支结果。
  • 底层脚本依赖 pandas + tabulate 进行 Markdown 预览,并支持 Excel/CSV/TSV 格式,请确保相关依赖已安装(本系统通过 apt 安装了 pandas、openpyxl、xlrd、tabulate)。
  • 当上述基本命令描述不够时,可查看 references/usage.md 获取扩展示例(多步骤清洗、数据集比较、表达式技巧)。

参考

  • 使用指南: references/usage.md(包含可直接复制的命令、表达式模式及数据集清理方案)。

资源

  • GitHub: https://github.com/CrimsonDevil333333/sheetsmith
  • ClawHub: https://www.clawhub.ai/skills/sheetsmith
3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor