二、完整工作流程

阶段一:准备与输入

步骤 1:接收并整理文档

  1. 确认文档数量和来源:列出全部文档清单,标注来源和类型
  2. 统一格式:将 PDF、Word、网页等转换为可处理的文本
  3. 建立文档档案:为每份文档编号,便于后续引用
### 文档清单

| 编号 | 文档名称 | 类型 | 来源 | 日期 | 字数/页数 |
|------|----------|------|------|------|----------|
| D1 | [...] | [判决书/合同/法规/论文] | [...] | [...] | [...] |
| D2 | [...] | [...] | [...] | [...] | [...] |

步骤 2:识别文档间关系

分析多份文档之间的关系类型(平行/时间序列/对立/层级/补充),确定归纳的分析框架:

  • 平行关系 → 采用"主题聚合"框架
  • 时间序列 → 采用"演变脉络"框架
  • 对立关系 → 采用"观点对比"框架
  • 层级关系 → 采用"层级梳理"框架
  • 补充关系 → 采用"全景整合"框架

阶段二:单篇理解与标注

步骤 3:逐篇提取核心信息

对每份文档进行单篇理解,提取以下要素:

提取要素内容标注方式
核心主题文档围绕什么核心问题展开一句话概括
主要观点文档的核心主张或结论3-5条要点
关键事实支撑观点的重要事实客观陈述
依据/证据观点的支撑材料法条、数据、案例等
立场/角度文档的立场(中立/支持/反对/某方代理)明确标注

步骤 4:建立文档信息卡片

为每份文档建立标准化信息卡片:

### D1 信息卡片

- **文档名称:** [...]
- **核心主题:** [...]
- **主要观点:**
  1. [...]
  2. [...]
- **关键事实:**
  - [...]
- **依据/证据:** [...]
- **立场:** [中立/原告方/被告方/学者A观点/行政机关]
- **可信度/权威性:** [高/中/低,简要说明理由]

阶段三:交叉分析与归纳

步骤 5:提取跨文档共性

识别多篇文档共同涉及的主题、观点、事实:

  • 哪些观点在多篇文档中被共同提及?
  • 哪些事实被多份文档交叉证实?
  • 哪些法律依据被普遍引用?
  • 是否存在被广泛接受的结论或共识?

输出格式:

### 跨文档共识

| 共识主题 | 涉及文档 | 共识内容 | 共识强度 |
|----------|----------|----------|----------|
| [...] | D1, D2, D3 | [...] | 强(3/3一致) |

步骤 6:识别文档间冲突

识别文档之间存在差异、矛盾或对立的内容:

  • 观点冲突:对同一问题持相反立场
  • 事实矛盾:对同一事实的陈述不一致
  • 法律适用分歧:对同一法条的理解或适用不同
  • 结论差异:基于相同或类似事实得出不同结论

冲突标注要求:

  • 客观陈述冲突双方的观点,不做真伪判断
  • 分析冲突的可能原因(信息不对称、立场不同、适用标准不同等)
  • 标注冲突的重要程度(核心冲突 / 次要分歧)

输出格式:

### 文档间冲突点

| 冲突编号 | 冲突主题 | 文档A观点 | 文档B观点 | 冲突类型 | 重要程度 |
|----------|----------|-----------|-----------|----------|----------|
| C-01 | [...] | D1: [...] | D2: [...] | [观点/事实/法律适用] | [核心/次要] |

步骤 7:生成跨文档洞见

在共性和差异分析的基础上,生成新的综合性结论:

  • 趋势判断:文档整体呈现什么趋势或方向?
  • 模式识别:是否存在重复出现的模式或结构?
  • 盲区识别:多篇文档共同遗漏了什么重要信息?
  • 关联发现:不同文档的信息组合后是否产生新的理解?

阶段四:输出

步骤 8:格式化输出综合归纳

根据用户需求,选择输出形式:

形式 A:段落式综合总结(适合详细说明场景)

  • 连贯呈现全部文档的核心内容
  • 按主题或逻辑顺序组织
  • 自然融入跨文档对比和洞见

形式 B:要点式摘要(适合快速浏览)

  • 使用项目符号逐条列出关键信息
  • 每个要点标注来源文档
  • 冲突点单独列示

形式 C:对比分析表(适合精细对比)

  • 以表格形式并列呈现各文档的对应要素
  • 便于逐项比较异同