新闻中心

科研动态丨我院2篇论文入选数据库顶级会议ICDE 2022

发布时间:2022-05-19

日前,国际数据库顶级会议38th IEEE International Conference on Data Engineering(ICDE 2022)在马来西亚吉隆坡召开。深圳计算科学研究院科研团队及其合作者的2篇论文成果入选ICDE 2022。


1.《Linking Entities across Relations and Graphs》

1652948667346

摘要:如何将关系数据和图数据进行数据关联,是数据管理领域的一项长期挑战。针对此难点,我院科研团队与合作者开发了名为HER(Heterogeneous Entity Resolution)的并行系统,可在关系型数据库和图数据中进行基于语义连接的实体匹配。经真实数据和合成数据实验验证,HER平均F-度量为0.94,并在大数据库D和大图G具有可扩展性。


2.《Deep and Collective Entity Resolution in Parallel》

1652948686357

摘要:实体识别(Entity Resolution,ER)也称为重复数据删除、实体消解或记录链接,一直以来都是数据治理领域的研究热点。我院科研团队与合作者为Deep and Collective ER设计了基于不动点计算的模型,该模型能在多个关系上递归地推导规则和追逐匹配项,并允许在规则中嵌入ML谓词。为适应海量数据应用场景,科研团队还在该模型基础上开发了数据分区策略和并行算法,保证了使用更多处理器时可减少运行时间。经真实数据集实验验证,该方法可有效提高ER的准确率并具备并行可扩展性。


数读科研成果

截至2022年5月,研究院共发表/录用高水平论文70篇,其中CCF A类59篇;申请专利/PCT共29项,授权发明专利5项。


粤公网安备 44030902003371号