一、核心概念
1.1 单文档摘要 vs 多文档归纳
| 维度 | 单文档摘要 | 多文档归纳 |
| 处理对象 | 一份文档 | 多份相关文档 |
| 核心任务 | 压缩信息、提取要点 | 交叉对比、整合关联 |
| 输出性质 | 对原文的忠实缩写 | 跨文档的新知识结构 |
| 关键能力 | 信息筛选 | 一致性识别、冲突发现、模式提取 |
| 典型价值 | 快速了解一篇文书 | 把握一组文档的全貌、趋势和争议 |
1.2 多文档分析的四个层次
Level 1: 单篇理解
分别理解每篇文档的核心内容
Level 2: 共性提取
识别多篇文档共同涉及的主题、观点、事实
Level 3: 差异对比
识别文档之间的观点冲突、事实矛盾、表述差异
Level 4: 洞见生成
基于跨文档的对比分析,生成新的综合性结论
1.3 文档关系类型
| 关系类型 | 特征 | 分析重点 | 示例 |
| 平行关系 | 多份文档处理同一主题的不同方面 | 整合各方面信息,形成全景视图 | 多篇关于同一法律问题的学术论文 |
| 时间序列 | 文档按时间先后排列 | 梳理演变脉络,识别趋势变化 | 同一法规的不同版本、同一案件的系列判决 |
| 对立关系 | 文档代表不同立场的观点 | 客观呈现各方观点,标注冲突点 | 原被告双方的意见书、不同学者的争议观点 |
| 层级关系 | 文档之间存在包含或引用关系 | 梳理层级结构,识别核心与衍生 | 法律、司法解释、指导性案例的层级体系 |
| 补充关系 | 文档之间相互补充,覆盖不同侧面 | 整合互补信息,填补单篇盲区 | 主合同与补充协议、起诉书与证据清单 |