近期,江苏省地质局大数据中心组建了一支由地质专家、数据工程师和AI技术人员组成的跨专业团队,积极开展赋能地学研究的创新实践,把海量地质资料转化为智能决策的“活水源泉”,推动AI与地质业务深度融合,为新时代地质工作注入数字动能。
创新:把杂乱数据炼成找矿罗盘
地质数据由于种类多、来源广、格式杂,制约了智能应用落地。面对动辄上万条记录、上千份报告的数据治理任务,团队成员每天穿梭于不同系统之间,一边与地质专家反复确认技术逻辑,一边调试AI算法流程,确保每一条数据都经得起科学推敲。“地质数据理得清,AI工具才能用得好,宝藏才能探得明。”这句话点明了AI和地质大数据的真谛,也道出了大数据中心的初心使命——数据就是新时代的“新矿藏”,大家都是新时代的“探矿人”。
自从有了AI助手,海量数据高效清洗才有了可能,大量有用数据才易“拨开云雾见天日”。但AI也不是万能的,需要各类专业协同,在一项地质数据驱动找矿工作中,需要各类专业人员参与梳理成矿关键指标、构建智能清洗规则、反复验证结果可靠性等相关工作,从1.5万余组地质数据中提炼有效信息。团队通力合作,将地质经验融入AI处理流程,大幅提升了数据质量,成功将某项数据缺失率由6.8%降至0,产出可直接建模的高质量数据集,为智能成矿分析奠定了坚实的数据基础。
融合:让泛黄图纸跃入数字江河

如果说找矿研究是建高楼,新一轮找矿突破战略行动项目中的纸质地质资料数字化,则是夯基础的关键一环。面对大量手写报告、复杂表格和专业公式,中心团队没有止步于“扫成电子档”。他们清楚:存档不是终点,激活数据价值才是最终目标,一场“从纸到数”的深度转化悄然展开。团队精心筛选5000余页典型地质报告,构建高质量训练样本,用于优化智能识别模型和结构化解析算法。
成员们常常同时推进多个项目,这边刚完成一批档案扫描质检,那边又要调试新的识别参数;既要保证准确率,又要兼顾处理速度。经过反复调试,系统不仅能高精度识别文字,还能自动提取图件、解析表格,把一页页静态文档转化为可查询、可利用的数据集。资料识别准确率从不足七成提升至95%以上,真正实现了从“电子复刻”到“数据再生”的跨越。当第一份包含完整属性字段的数据包成功导入分析平台时,一位老资料员感慨:“这些躺在柜子里几十年的报告,终于能‘开口说话’了”。

这一突破,将纸质地质资料高效转化为结构化、可计算的数据集,不仅支撑全流程智能数字化,更显著提升了地质数据的共享效率与应用深度,为行业提供了从“存档”到“赋能”的可行路径。
探索:让智能之眼长出地质之心
如何让人工智能真正理解地质知识与规律?这是团队长期探索的核心命题。“慧眼识矿”智能识别系统的研发过程,正是这一探索的生动实践。
初期,AI时常把外观相似、颜色相近矿物混淆。团队并没有局限于单纯的技术调参,而是着力推动地质人员与开发人员的深度协作。地质同事在矿物博物馆现场讲解矿物辨别特征,并手把手指导:“立方体的黄铁矿,金属光泽强;颗粒不规则的黄铜矿,色深光暗……”。开发团队据此优化识别模型与逻辑。
在此基础上,团队共同筛选并标注上万张典型矿物图像,训练出自有的高精度矿物识别算法。他们不满足于AI“认得对”,更追求它“说得清”,设计了一套“识别+解释”的协同流程,将自研算法识别出的结果,交到国产大模型手中——不是让它简单重新看图,而是请它“用地质人的语言,讲明白判断的道理”。当系统第一次输出“该矿物呈立方体晶形,具强金属光泽,常见于热液脉中,初步判断为黄铁矿”时,大家相视一笑——路,走对了。那一刻,AI不再是黑箱,而成了能对话、可信赖的“地质新同事”。
通过该协同架构,系统不仅实现了近百种常见矿物的准确识别,更能以地质工作者熟悉的语言阐明判断依据,显著提升了模型对稀有或变种矿物识别结果的可理解性与可信度。经过15种识别模型的系统比选和千余轮迭代优化,该系统成为了“懂地质、会推理”的智能助手。

“慧眼识矿”系统正是深化人工智能、AI大模型等新型要素融合创新的务实成果,体现了以数据整合与智能驱动推进地质工作广领域应用的实践方向。

从理清一条数据,到唤醒一页档案,再到教会AI读懂一块矿物——每一次微小的突破,都是他们日复一日协同作战写下的答案。在这条数字赋能地质的新长征路上,他们坚信:唯有躬身入局,方能智启未来。