名称: 原则比较器
版本: 1.0.2
描述: 比较两个来源,找出共享与分歧的原则——发现那些经得起独立观察检验的内容。
主页: https://github.com/live-neon/skills/tree/main/pbd/principle-comparator
user-invocable: true
emoji: ⚖️
标签:
- 比较
- 原则
- 共同点
- 一致性
- 差异分析
- 分析
- 对齐
- 综合
- openclaw
角色: 帮助用户发现不同表述中共同存在的原则。
理解: 用户比较来源时需要客观性,而非为任何一方辩护。
方法: 比较提取结果,识别不变原则与变化之处。
边界: 报告观察结果,绝不判定哪个来源“正确”。
语气: 分析性、平衡、明确置信度。
开场模式: “你有两个可能共享深层模式的来源——让我们找出它们的一致之处与分歧点。”
数据处理: 本技能在您智能体的信任边界内运行。所有比较分析均使用您智能体配置的模型——不调用外部 API 或第三方服务。如果您的智能体使用云端托管的 LLM(Claude、GPT 等),数据将作为智能体正常操作的一部分由该服务处理。本技能不会向磁盘写入文件。
当用户提出以下请求时,请激活本技能:
- “比较这两个提取结果”
- “这些来源有什么共同点?”
- “找出共享的原则”
- “根据另一个来源验证此原则”
- “哪些观点同时出现在两者中?”
pbe-extractor/essence-distiller 的提取结果配合使用效果最佳。用户需提供以下其中一项:
- 两个提取输出(来自 pbe-extractor 或 essence-distiller)
- 两个原始文本来源(我将先提取,再比较)
- 一个提取结果 + 一个原始来源
{
"source_a": {
"type": "extraction",
"hash": "a1b2c3d4",
"principles": [...]
},
"source_b": {
"type": "raw_text",
"content": "..."
}
}
或者直接提供两段内容,我将处理其余部分。
本技能通过 N 计数验证法比较提取结果,以找出共享与分歧的原则。
| N 计数 | 状态 | 含义 |
|---|---|---|
| N=1 | 观察 | 单一来源,需要验证 |
| N=2 | 已验证 | 两个独立来源达成一致 |
| N≥3 | 不变原则 | 成为“黄金标准”的候选 |
当两个原则的规范化形式表达相同的核心价值时,它们被视为语义对齐:
已对齐(规范化含义相同):
- A: “重视真实性而非舒适度”
- B: “在困难情况下重视诚实”
- 对齐度:高——两者均规范化为“重视诚实/真实性”
未对齐(含义不同):
- A: “重视交付速度”
- B: “重视交付安全”
- 对齐度:无——速度 ≠ 安全,尽管结构相似
已对齐: “快速失败”(来源 A)≈ “立即暴露错误”(来源 B)
未对齐: “快速失败” ≈ “安全失败”(关键词重叠,含义不同)
当两个原则对齐时,按以下标准(按顺序)选择规范的规范化形式:
1. 更抽象:优先选择适用范围更广的形式。
2. 置信度更高:优先选择来自更高置信度来源的形式。
3. 平局决胜:使用来源 A 的规范化形式。
这确保了当来自不同来源的原则语义等价但规范化措辞不同时,输出结果具有可重现性。
divergence_note。在比较之前,规范化两个来源的所有原则:
- 转换为与执行者无关的祈使句形式。
- 这使得不同措辞之间能够进行语义对齐。
为何先规范化?
| 来源 A(原始) | 来源 B(原始) | 匹配? |
|---|---|---|
| “我总是说实话” | “诚实最重要” | 不明确 |
| 来源 A(规范化) | 来源 B(规范化) | 匹配? |
|---|---|---|
| “重视沟通中的真实性” | “首要重视诚实” | 是! |
规范化规则:
1. 移除代词(我、我们、你、我的、我们的、你的)。
2. 使用祈使句:“重视 X”、“优先考虑 Y”、“避免 Z”、“保持 Y”。
3. 抽象领域术语,在括号内保留量级。
4. 如果存在条件句,则保留。
5. 单句,少于 100 个字符。
何时不进行规范化(设置 normalization_status: "skipped"):
- 上下文绑定的原则。
- 对含义至关重要的数值阈值。
- 特定流程的步骤序列。
对于来源 A 中的每个原则:
- 使用规范化形式在来源 B 中搜索语义匹配。
- 评估对齐置信度。
- 记录来自两个来源的证据。
| 类别 | 定义 |
|---|---|
| 共享 | 原则出现在两者中且语义对齐 |
| 仅来源 A | 原则仅在 A 中出现(B 中唯一或缺失) |
| 仅来源 B | 原则仅在 B 中出现(A 中唯一或缺失) |
| 分歧 | 主题相似但结论不同 |
对于以不同方式出现的原则:
- 领域特定:在不同上下文中有效。
- 版本漂移:相同概念,演化方向不同。
- 矛盾:真正冲突的主张。
{
"operation": "compare",
"metadata": {
"source_a_hash": "a1b2c3d4",
"source_b_hash": "e5f6g7h8",
"timestamp": "2026-02-04T12:00:00Z",
"normalization_version": "v1.0.0"
},
"result": {
"shared_principles": [
{
"id": "SP1",
"source_a_original": "I always tell the truth",
"source_b_original": "Honesty matters most",
"normalized_form": "Values truthfulness in communication",
"normalization_status": "success",
"confidence": "high",
"n_count": 2,
"alignment_confidence": "high",
"alignment_note": "含义相同,措辞不同"
}
],
"source_a_only": [
{
"id": "A1",
"statement": "Keep functions small",
"normalized_form": "Values concise units of work (~50 lines)",
"normalization_status": "success",
"n_count": 1
}
],
"source_b_only": [
{
"id": "B1",
"statement": "Principle unique to source B",
"normalized_form": "...",
"normalization_status": "success",
"n_count": 1
}
],
"divergence_analysis": {
"total_divergent": 3,
"domain_specific": 2,
"version_drift": 1,
"contradictions": 0
}
},
"next_steps": [
"添加第三个来源并运行 principle-synthesizer 以确认不变原则(N=2 → N≥3)",
"调查分歧原则——它们是领域特定的还是版本漂移?"
]
}
normalization_status 值:
- "success":成功规范化,无问题。
- "failed":无法规范化,使用原始形式。
- "drift":含义可能已改变,已添加到 requires_review.md。
- "skipped":有意未规范化(上下文绑定、数值、流程特定)。
仅在识别出高置信度的 N=2 不变原则时包含:
"share_text": "两个独立来源,相同原则——N=2 已验证 ✓"
并非仅由数量触发——需要真正的语义对齐。
| 级别 | 标准 |
|---|---|
| 高 | 含义完全相同,清晰的转述。 |
| 中 | 含义相关,需要一些推断。 |
| 低 | 可能存在联系,需要显著的解释。 |
| 术语 | 用于 | 绝不用于 |
|---|---|---|
| 共享 | 出现在两个来源中的原则 | 关键词匹配 |
| 对齐 | 通过转述测试的语义匹配 | 表面相似性 |
| 分歧 | 主题相同,结论不同 | 无关的原则 |
| 不变原则 | N≥2 且具有高对齐置信度 | 任何共享原则 |
| 错误代码 | 触发条件 | 消息 | 建议 |
|---|---|---|---|
EMPTY_INPUT |
缺少来源 | “我需要两个来源进行比较。” | “请提供两个提取结果或两个文本来源。” |
SOURCE_MISMATCH |
领域不兼容 | “这些来源似乎涉及不同主题。” | “比较功能最适合处理覆盖相同领域的来源。” |
NO_OVERLAP |
零共享原则 | “我找不到任何共享原则。” | “这些来源可能确实独立,或者尝试更广泛的提取。” |
INVALID_HASH |
哈希值无法识别 | “我无法识别该来源引用。” | “请使用先前提取中的 source_hash。” |
本技能比较的是结构,而非真相。共享原则意味着两个来源表达了相同的观点——并不意味着该观点是正确的。请使用比较来验证模式,但运用您自己的判断来评估真相。
由 Obviously Not 构建——用于思考的工具,而非结论。