哈工大郑州研究院自成立以来,深度融入河南省、郑州市高质量发展大局。为激发青年科技人才的创新活力,培育战略性新兴产业增长点,研究院聚焦区域发展需求,积极培育“青年科学家工作室”,遴选支持一批具有前沿视野、技术突破能力和产业转化潜力的青年科研团队。
为加深大家对青年科学家工作室的了解,本系列报道将系统介绍各工作室的研究方向、团队建设、科研成果等情况。同时,竭诚欢迎海内外优秀博士加入各青年科学家工作室,欢迎广大学子报考各工作室老师研究生。
期待更多青年才俊以智慧为笔、以实干为墨,与我们一起书写科技报国、服务地方发展新篇章!
苗东菁青年科学家工作室
一、学术带头人
苗东菁,哈尔滨工业大学教授、博士生导师、CCF优博、ACM SIGMOD CHINA新星,算法顶刊Algorithmica首席客座编辑、国际会议COCOON(CCF B)程序委员会主席,中国计算机学会数据库专委会委员、理论计算机科学专委会委员、哈电集团引进行业领军人才,黑龙江省大数据科学与工程重点实验室副主任,国家级一流本科课程建设课程负责人。
深耕数据科学领域研究,主持国家自然科学基金面上、华为“胡杨林基金”数据库专项等多项国家、企业基础研究项目。作为项目负责人牵头承担黑龙江省重点研发计划重点领域专项——“陆相砂岩油藏人工智能模型关键技术研究”(项目总经费6278万元),为传统能源行业智能化转型提供数据库系统技术、数据治理方面的关键技术支撑。
二、工作室介绍
苗东菁青年科学家工作室扎根大数据时代前沿,依托哈尔滨工业大学海量数据计算研究中心的科研优势,继承大量开创性成果包括“自研我国首个微型计算机集群系统”、“首个集群并行数据库系统”,以及“首个被广泛应用的大型操作系统”。面对数据洪流的挑战,工作室聚焦“数据”这一信息社会核心要素,构建起贯穿
基础理论、系统开发与场景应用的全链条研究体系。其科研布局紧密围绕“三个面向”展开——面向世界科技前沿探索数据计算理论突破,面向经济主战场推动技术成果转化,面向国家重大需求攻克关键核心技术,持续为数字经济时代锻造数据科学领域的尖端科研力量。通过系统化整合基础研究与应用创新,工作室形成了特色鲜明、层次清晰的发展格局。
工作室核心成员包括教授2人、副教授3人、讲师2人,近年来承担多项国家重点研发计划项目、国家自然科学基金重点项目、面上项目、重大产业化项目和各部属课题。另外,青年科学家工作室的学生培养时刻与国际接轨,其中有ACM竞赛金银牌选手、全系拔尖硕博带领。
工作室团队围绕融合大数据分析系统,从理论根基建设、核心技术攻关、系统原型设计和应用成果转化四个阶段开展建设,层层递进,环环紧扣:
①在“理论基础”方面,工作室注重研究大数据分析与计算的复杂性理论以及高效(亚线性)算法的设计方法学。通过深入理解大数据处理的复杂性,制定创新性的算法设计方案,提高分析计算效率,为技术开发提供坚实的理论基础。
②在“核心技术”方面,聚焦多模型存储引擎技术、大数据高效分析与计算技术,以及大规模三维数据高效渲染技术。这些技术的创新与发展将大幅提升数据处理与分析的效率和精度,从而支持更大规模的数据应用场景。同时,在数据存储、分析与计算方法上进行技术革新,确保在实际应用中获得高性能和高可用性。
③在“系统原型”方面,着重研发下一代“超融合”数据库系统,该系统整合存储、大数据分析、计算与可视化交互功能。通过构建这种综合性的系统平台,为多种应用场景提供一体化的数据管理、分析与可视化支持,满足不同行业对数据存储和处理的高效需求。
④在“成果应用转化”方面,针对IT、能源、装备制造和医疗公卫等重点行业,打造不同场景的应用系统。
工作室将始终坚定面向国家重大需求和国民经济主战场,为不同行业的数字化转型提供有力的科学技术支撑。
1.主要研究方向
方向一:下一代超融合数据库系统,包括分布式、多模型、HTAP、压缩态向量化执行、新兴硬件适配、软件结合优化加速等技术研究;
方向二:大数据计算,包括质量管理、分析、挖掘、预测等相关理论、计算复杂性、算法、技术。
2.科研成果
本团队依托哈尔滨工业大学海量数据计算研究中心的学术积淀,及在关键领域构建的完整研究成果:基于机群系统的并行数据库系统、并行数据仓库系统、并行数据挖掘系统,大数据清洗与数据质量管理技术等。其中“机群计算系统”开创了我国当今被广泛应用的云计算系统之先河,其仍在黑龙江省和贵州省地税征缴系统、中国工商银行、国家审计总署等很多其他部门中使用,先后获得国家科技进步二等奖1项、黑龙江省自然科学一等奖1项、教育部科技进步一等奖1项、黑龙江省科技进步一等奖3项、二等奖2项、三等奖2项,在众多国内外学术会议和期刊中获最佳\优秀论文奖,团队青年学者荣获CCF优博、ACM SIGMOD CHINA新星等学术奖励。
本团队在继承研究中心关键技术的基础上深耕下一代数据库系统技术,于数据库顶级会议VLDB 2025上提出了原生图存储引擎“BACH”,在HGTAP负载下,“BACH”的存取性能大大超越当前代表性开源图HTAP系统(如Neo4J、LiveGraph、RocksDB等)。团队进一步将“BACH”与前期自研的文档-关系多模引擎“QUEST”结合,研发图-文档-关系原生多模引擎。在技术创新的同时,团队在理论研究领域亦取得重要突破。聚焦数据质量管理领域及计算复杂性分析领域取得三项核心理论突破,在VLDB2020上提出(1)证明“函数依赖最优子集修复”具有近似比常数远小于2的多项式算法;(2)提出不可近似性三分法定理与视图传播问题紧致的理论下界与精细的结构划分条件;(3)在TCS2023上提出了支持亚线性复杂性刻画的随机访存图灵机模型,现已被Wikipedia随机访存图灵机词条收录。团队理论研究的突破为实际应用奠定了坚实的基础。
三、博士后招聘方向
数据库系统:承担自研多模型数据库内核演进研究工作,包括分布式计算、HTAP技术、数据压缩与向量化执行技术、跨模型查询优化技术、对象数据库引擎、AI4DB、DB4AI。
能源/医疗大数据计算:承担能源/医疗大数据治理、分析、挖掘、预测、大规模三维模型渲染优化等算法、工具、平台研发工作。
大数据计算理论与算法:面向数据库系统与大数据计算问题的复杂性理论、高效算法研究、及其应用落地转化。
四、博士、硕士招生方向
博士招生方向:下一代超融合数据库系统理论与系统技术研究;大数据治理、分析、挖掘、预测、大规模三维模渲染优化等理论与高效算法研究;AI4DB、DB4AI等。
硕士招生方向:国家自然科学基金、华为胡杨林基金、企业创新研发等项目资助下的“数据库系统内核”研发工作、能源/医疗大数据管理分析与可视化算法工具研发工作。工作室数据库系统技术研究及成果转化,涉及“分布式多模型HTAP数据库引擎技术”、“数据库压缩态向量化执行引擎技术”、“大数据一致性理论与算法质量”、“陆相砂岩油藏人工智能模型关键技术研究”等方面。
五、联系方式
苗东菁教授
电话:18045628526
QQ:251969680
Email:miaodongjing@hit.edu.cn
个人主页:https://homepage.hit.edu.cn/miaodongjing
以上信息更新于2025年3月27日
信息来源:党群工作部/人才办公室
责任编辑:梅鹏飞
审核:张懿文