高质量思维链(COT)数据是提升大模型逻辑推理与复杂问题解决能力的关键基石。。面向知识服务业务中复杂科技文档理解与COT数据生成的迫切需求,,,,近日,,,,PA旗舰厅数科联合北京大学数学科学学院马尽文教授团队成功研发复杂文档多源推理新框架LAMRD(Layout-Aware Multi-Source Reasoning Decision Framework),,,相关成果入选2025欧洲人工智能会议现场报告。。
ECAI(欧洲人工智能会议)是人工智能领域历史悠久且享有盛誉的国际会议,,,,在全球计算机科学权威评价体系CORE中被列为高级别的“A类会议”。。2025年,,,ECAI在意大利博洛尼亚举行,,延续其一贯严格的审稿标准,,,论文录用率仅约23%。。。。
LAMRD创新性地将版面理解转化为“多源推理路径构建与决策优化”两阶段过程,,深度融合视觉结构、、、、逻辑语义与外部知识,,,并引入群体策略优化机制,,,,显著提升模型在多页结构化文档中的认知与推理能力。。该框架可自动生成高一致性、、、可解释的COT样本,,,,有效支撑大模型的自监督训练与偏好优化。。在核工业大模型建设过程中,,,面对设计文档、、、实验报告等具有复杂排版与跨页逻辑的技术资料,,构建高质量的COT数据为大模型解决复杂行业问题提供关键技术支撑,,,,助力智能文档处理与知识建模体系升级。。。