|
|
基于多方表格数据关联策略的数据补全可视分析方法
朱海洋, 韩东明, 潘嘉铖, 魏雅婷, 封颖超杰, 翁罗轩, 毛科添, 邢远凯, 闾建树, 万邱成, 陈为
Frontiers of Information Technology & Electronic Engineering. 2024, 25 (3): 398-414.
https://doi.org/10.1631/FITEE.2300480
数据补全是数据治理的一项重要预处理任务,目的是填补不完整的数据。然而,传统的数据补全方法只能通过单张数据表格在一定程度上缓解数据的不完整问题,并未能在补全值的准确性和效率之间达到最佳平衡。本文提出了一种新颖的数据补全可视化分析方法;设计了一套多方表格数据关联策略,采用智能算法识别相似列并在多个表格之间建立列之间的关联关系,然后利用其它表格中的相似数据条目对缺失数据进行初始补全;开发了一个可视分析系统来优化数据补全的候选值。本文中的交互式系统将多方数据补全方法与专家知识相结合,有助于更好地理解数据的关系结构,显著提高了数据补全的准确性和效率,提升了数据治理质量和数据资产内在价值。实验验证和用户调查表明,本文方法支持用户使用领域知识验证判断相关列及相似行。
参考文献 |
补充材料 |
相关文章 |
多维度评价
|
|
|
Erratum to: A visual analysis approach for data imputation via multi-party tabular data correlation strategies
Haiyang ZHU, Dongming HAN, Jiacheng PAN, Yating WEI, Yingchaojie FENG, Luoxuan WENG, Ketian MAO, Yuankai XING, Jianshu LV, Qiucheng WAN, Wei CHEN
Frontiers of Information Technology & Electronic Engineering. 2024, 25 (3): 484-.
https://doi.org/10.1631/FITEE.23e0480
参考文献 |
相关文章 |
多维度评价
|
11篇文章
|