2019年4月13日,深圳计算科学研究院(以下简称“深算院”)在深圳大学揭牌成立,重点研究大数据领域方向的计算科学基础理论,致力打造中国原创的基础软件民族品牌,建设中国的“贝尔实验室”。
5年时间,筚路蓝缕创新路,披荆斩棘谱新篇。深算院从0开始白手起家,构建了大数据计算的基础原创理论和新型计算系统两大平台,面向世界科技前沿和解决国家关键领域“卡脖子”的需求,在大数据领域开展基础理论研究和核心技术攻关,开发了从原创理论到工程实现全自研的崖山数据库系统、采石矶数据质量系统和钓鱼城数据分析系统三款基础软件系统,持续推动技术成果在金融、政务、能源、制造和交通等重点行业的应用创新,真正落实国家“人工智能+”行动,提效新质生产力,全力服务数字中国建设战略。
理论+工程人才汇聚
深算院已建立起500人规模团队,其中研发人员占比近九成,汇聚了一批优秀青年科学家和工程实力媲美硅谷的系统开发人才,包括英国皇家学会院士1人、中国科学院院士2人、深圳市杰出人才1人、海外高层次人才5人、长江学者1人。值得一提的是,首席科学家樊文飞院士于2019年当选为中国科学院外籍院士,2023年当选英国皇家工程院院士,达成六院院士的卓越成就,并在英国皇家学会羊皮簿留下第一个中文签名,是英国皇家学会计算机领域的唯一华裔科学家,也是目前英国皇家学会和英国皇家工程院唯一的两院院士。
基础研究成果卓著
深算院围绕大数据 5V挑战进行布局,深耕数据库系统、数据质量、数据分析等关键技术领域,五年来在SIGMOD、VLDB、ICDE、TODS等国际顶级期刊/会议发表/录用论文102篇(含CCF A类90篇),申请专利/PCT共132项,理论研究成果产出比肩全球任何一支大数据学术团队。深算院奠基性理论科研成果为系统研发提供“N+1”的理论支撑,已达成超过60%原创理论的工程转化,落实到关键技术系统中,为三大基础软件实现技术超越和创新,注入持续的源动力。
系统研发崭露头角
崖山数据库系统(YashanDB)
崖山数据库系统是深算院自主研发设计的新型数据库系统,秉持理论和工程并重的初衷,融入原创的有界计算理论、近似计算理论、并行可扩展理论和跨模融合计算理论,实现国产高端数据库从零到一的全自研突破,经权威机构检测,内核代码自主率100%,具备从理论创新、产品定义、代码实现到质量保障端到端的基础软件工程实现能力,已通过信通院可信数据库测评,入选了2022年数字中国建设峰会“十大硬核科技”榜单。
历经五年的持续迭代与打磨,崖山数据库系统在大规模数据高效处理、单节点事务处理吞吐和高可用能力等关键指标已实现与国际主流数据库并跑,突破并掌握数据库关键技术“制高点”——共享集群技术,成功推出基于国产共享存储集群的金融级高可用解决方案,提供在高端核心场景对国际主流数据库系统1:1平替的能力,实现国产数据库在高端领域“零”的突破。此外,面向大数据与人工智能等未来新场景,YashanDB发挥理论优势,积极探索有界计算、跨模融合计算等前沿大数据库技术的落地和应用,例如基于有界计算理论的数据规模无关查询处理技术突破了传统计算的限制,有效解决了数据规模对算力的依赖问题,有望为大数据处理带来革命性的进步。
采石矶数据质量系统(RockDQ)
采石矶数据质量系统是基于樊文飞院士奠基性数据质量原创理论指导下,完全自主研发的智能数据质量系统,旨在解决数据一致性、时效性、精确性、完整性和实体同一性的问题。
采石矶系统在精度和速度方面国际领先,能够在超大数据量上进行规则自动发现,并有效提升结果判断的准确率,系统执行性能比业界常用的原生Spark SQL快32倍;在规则发现能力、正确性保证修复能力等关键领域领先国外平台系统,速度快25倍,精度提升56%。
采石矶系统经权威机构检测,内核代码自主率100%,实现了自主可控能力突破,目前在金融、数字资产、数字政府、运营商、科研院所等重点领域与头部企业机构开展合作,共同推动行业级的自主可控数据治理方案。
钓鱼城数据分析系统(Fishing Fort)
钓鱼城数据分析系统是基于樊文飞院士开创性的图关联规则理论开发,融合逻辑规则与机器学习,能够在海量、高密度的图谱数据中计算实体之间的关联关系,分析其拓扑结构特征及语义规律,摆脱了对人工分析和算力的高度依赖和局限,高效自动发现数据中存在的客观规律,挖掘数据深度价值,高质量地实现业务应用创新和科学决策。钓鱼城核心为全球独创的逻辑规则与机器学习融合新范式,在国际上没有对标产品,填补行业空白,经权威机构检测,内核代码自主率100%,获得了2022年科技部举办的全国颠覆性技术创新大赛领域赛“优胜奖”以及总决赛“优秀奖”。
目前,钓鱼城系统与主流国产芯片、服务器、操作系统、中间件等研发企业完成兼容性互认,并在智能制造、配方工艺、网络安全、金融风控等方面展示了超越机器学习的强大功能,应用效果显著,具备支撑数据智能化的关键能力,被外界誉为“真正的AI+”。
展望未来,深算院将继续坚持基础研究与系统研发并驾齐驱的创新模式,践行“四个面向”战略方向,集聚力量进行原创性引领性科技攻关,致力于打造自主可控的国产基础软件产品,以“AI+”赋能培育新质生产力,助力数字中国建设战略的实现,努力为国家高水平科技自立自强贡献力量。
文、图/广州日报新花城记者:王纳
广州日报新花城编辑:刘影
[ 责编:邢彬 ]