9月13日,数链科技应邀出席“文心大模型企业应用私享会”,算法负责人石赟代表公司在私享会上作题为《大小模型串联实现合同信息抽取》的案例分享。

同时,在飞桨老师现场布置的大模型检索和关键信息抽取的作业中,数链科技从参会的30多家公司、60多个开发者中脱颖而出,第一个完成了老师布置的模型项目实操,充分体现出了数链科技在科技底层技术及应用领域的创新能力。

640 (6).jpg




众所周知,大宗商品行业市场规模巨大、关系国计民生,通过数字化创新增强供应链安全、效率和控制力,是推动我国大宗商品市场“由大变强”的重要路径。然而传统大宗商品供应链普遍存在交易环节不透明、业务流程不标准两大问题,严重制约了我国大宗商品供应链的高质量发展。其中的业务流程不标准,体现在贸易流程中的合同、发票、货物质量、资金流转、税务等环节往往难以严格按照相关标准和规定执行,导致业务中存在大量线下单据,从而影响制约大宗商品供应链数字化发展。


640 (7).jpg


石赟表示:“大宗商品贸易数字风控交叉验证规则有200多条,但大量非标单据难以数字化,严重制约系统自动化审核能力。此外,当前严重依赖大量人工线下审核,耗时耗力,亟需提升系统自动化审核能力和效率,实现实时高频的风险指标监控。”


640 (8).jpg

如何突破“掣肘”?目前,数链科技基于PP-ChatOCR(一款融合飞桨PP-OCRv4和文心大模型的应用),最终形成了自研的“LLM大模型+OCR技术”,该自研技术通过微调文字识别模型,优化信息提取指令,组合成适当的prompt送入大模型进行预测,实现了多页PDF合同扫描件的关键信息抽取。这种技术手段大大提升了大模型的抽取精度,关键字段高精度识别抽取准确率稳定超98%。在数链科技平台上的核心企业客户,实现了采用合同自动抽取,辅助风控提效80%,节省人力5人。

以数字化科技应用为驱动引领大宗商品供应链变革。下一步,数链科技将通过OCR技术微调文本信息,扩展prompt指令,未来逐步增加以下实际场景下的信息抽取,达到以最低的成本,完成大宗商品领域数字化建设。


640 (9).jpg


本次分享会,有大模型技术专家、大模型应用行业专家、飞桨技术专家、30余家企业负责人和研发工程师共同参加,旨在探讨大模型前沿技术、产业洞察、应用案例和实战开发,共同推动大模型产业应用落地。