二、完整工作流程
阶段一:准备与输入
步骤 1:接收并整理文档
- 确认文档数量和来源:列出全部文档清单,标注来源和类型
- 统一格式:将 PDF、Word、网页等转换为可处理的文本
- 建立文档档案:为每份文档编号,便于后续引用
### 文档清单
| 编号 | 文档名称 | 类型 | 来源 | 日期 | 字数/页数 |
|------|----------|------|------|------|----------|
| D1 | [...] | [判决书/合同/法规/论文] | [...] | [...] | [...] |
| D2 | [...] | [...] | [...] | [...] | [...] |
步骤 2:识别文档间关系
分析多份文档之间的关系类型(平行/时间序列/对立/层级/补充),确定归纳的分析框架:
- 平行关系 → 采用"主题聚合"框架
- 时间序列 → 采用"演变脉络"框架
- 对立关系 → 采用"观点对比"框架
- 层级关系 → 采用"层级梳理"框架
- 补充关系 → 采用"全景整合"框架
阶段二:单篇理解与标注
步骤 3:逐篇提取核心信息
对每份文档进行单篇理解,提取以下要素:
| 提取要素 | 内容 | 标注方式 |
|---|---|---|
| 核心主题 | 文档围绕什么核心问题展开 | 一句话概括 |
| 主要观点 | 文档的核心主张或结论 | 3-5条要点 |
| 关键事实 | 支撑观点的重要事实 | 客观陈述 |
| 依据/证据 | 观点的支撑材料 | 法条、数据、案例等 |
| 立场/角度 | 文档的立场(中立/支持/反对/某方代理) | 明确标注 |
步骤 4:建立文档信息卡片
为每份文档建立标准化信息卡片:
### D1 信息卡片
- **文档名称:** [...]
- **核心主题:** [...]
- **主要观点:**
1. [...]
2. [...]
- **关键事实:**
- [...]
- **依据/证据:** [...]
- **立场:** [中立/原告方/被告方/学者A观点/行政机关]
- **可信度/权威性:** [高/中/低,简要说明理由]
阶段三:交叉分析与归纳
步骤 5:提取跨文档共性
识别多篇文档共同涉及的主题、观点、事实:
- 哪些观点在多篇文档中被共同提及?
- 哪些事实被多份文档交叉证实?
- 哪些法律依据被普遍引用?
- 是否存在被广泛接受的结论或共识?
输出格式:
### 跨文档共识
| 共识主题 | 涉及文档 | 共识内容 | 共识强度 |
|----------|----------|----------|----------|
| [...] | D1, D2, D3 | [...] | 强(3/3一致) |
步骤 6:识别文档间冲突
识别文档之间存在差异、矛盾或对立的内容:
- 观点冲突:对同一问题持相反立场
- 事实矛盾:对同一事实的陈述不一致
- 法律适用分歧:对同一法条的理解或适用不同
- 结论差异:基于相同或类似事实得出不同结论
冲突标注要求:
- 客观陈述冲突双方的观点,不做真伪判断
- 分析冲突的可能原因(信息不对称、立场不同、适用标准不同等)
- 标注冲突的重要程度(核心冲突 / 次要分歧)
输出格式:
### 文档间冲突点
| 冲突编号 | 冲突主题 | 文档A观点 | 文档B观点 | 冲突类型 | 重要程度 |
|----------|----------|-----------|-----------|----------|----------|
| C-01 | [...] | D1: [...] | D2: [...] | [观点/事实/法律适用] | [核心/次要] |
步骤 7:生成跨文档洞见
在共性和差异分析的基础上,生成新的综合性结论:
- 趋势判断:文档整体呈现什么趋势或方向?
- 模式识别:是否存在重复出现的模式或结构?
- 盲区识别:多篇文档共同遗漏了什么重要信息?
- 关联发现:不同文档的信息组合后是否产生新的理解?
阶段四:输出
步骤 8:格式化输出综合归纳
根据用户需求,选择输出形式:
形式 A:段落式综合总结(适合详细说明场景)
- 连贯呈现全部文档的核心内容
- 按主题或逻辑顺序组织
- 自然融入跨文档对比和洞见
形式 B:要点式摘要(适合快速浏览)
- 使用项目符号逐条列出关键信息
- 每个要点标注来源文档
- 冲突点单独列示
形式 C:对比分析表(适合精细对比)
- 以表格形式并列呈现各文档的对应要素
- 便于逐项比较异同