数据治理新突破:陕西优百产出两项物料清洗发明专利

2024/08/26      1246 文章来源:

在大数据时代背景下,数据质量成为企业决策与运营效率的关键因素。近日,陕西优百凭借创新的物料数据清洗方法,“一种企业物料数据纠错方法” “物料数据清洗的方法、装置、电子设备及介质”正式进入实质审查阶段,这一成果不仅标志着陕西优百在数据治理领域取得了重要突破,也为企业在物料管理的数字化上提供了更加坚实的能力。助力企业实现数据驱动的决策与管理,提升整体运营效率和市场竞争力。

由于物料数据在企业不同系统中的表述差异导致的数据不一致、错误、冗余等问题,在面对海量且多样化的物料数据进行数据清洗时,通过规则匹配结合人工清洗的方式进行筛选和标准化处理,存在耗费人力成本和时间成本、清洗效率低、清洗结果可解释性差、难以应对企业多样化的物料处理场景、可拓展性差和维护成本高等问题。我们提出了两种解决方法。基于多粒度特征融合的Res-BERT企业物料数据纠错方法和物料数据清洗方法、装置、电子设备及介质。

一、 一种企业物料数据纠错方法

基于多粒度特征融合的Res-BERT企业物料数据纠错方法,该创新技术通过多粒度特征融合、残差BERT网络结构、优化的目标函数设计,可以有效提升企业物料数据纠错的准确率和效率。

该技术的核心亮点在于其多粒度特征融合的能力。通过将字符级和属性级的特征信息相结合,该方法能够更精确地捕捉物料数据中的语义和结构语法信息,从而有效检测并纠正错误数据。这种精准的纠错能力,对于企业而言,意味着在数据处理和分析过程中,错误率大幅降低,数据质量显著提升。



该技术最大的价值在于提升客户业务决策的准确性和运营效率。高质量的数据能够减少因错误信息带来的生产损失、库存积压和供应链中断等问题,从而帮助企业在激烈的市场竞争中占据有利位置。

二、物料数据清洗的方法、装置、电子设备及介质

该物料数据清洗技术通过一系列智能处理步骤,为企业提供了一种高效、精准、可解释的解决方案,提升企业在物料数据管理中的效率和准确性,帮助企业在数据驱动的市场环境中保持竞争优势。通过这一创新技术,企业不仅能提高运营效率,还能确保数据的一致性和可靠性,从而实现更高的商业价值。

该技术的首要步骤是获取标准数据。通过基于预训练的清洗模型,对企业的物料数据进行深度清洗,消除冗余和错误信息,生成高质量的标准物料数据。这一过程有效保障了企业数据的准确性和一致性,为后续的分析和决策奠定了坚实基础。

在标准数据的基础上,系统会自动识别出对应的目标模板物料标识。这一步骤确保了企业在处理复杂多样的物料数据时,能够快速匹配和识别出最适合的模板,大幅度提高了数据处理的效率。

接下来,系统对标准物料数据进行特征属性的分割和识别,提取出与目标模板相关的关键特征属性。通过这一步骤,企业可以深入挖掘数据背后的有用信息,更好地支持业务决策和优化流程。

最后,系统将目标特征属性与目标模板物料标识对应的元数据信息进行匹配,生成解释性结果。为企业提供清晰的数据清洗报告,使数据清洗过程更加透明和可追溯,为后续的审计和数据优化提供了重要依据。

该技术的最大价值在于它大幅提升了数据清洗的自动化和智能化程度。企业在处理大量物料数据时,不再需要依赖繁琐的手动操作,节省了时间和人力成本。同时,生成的解释性结果为用户提供了数据处理过程中的可视化和可理解性,增强了对数据质量的信心。

 插图3.png