[科普]人工智能通过机器学习勘探矿藏
机器学习发现制造电动汽车电池的重要金属矿藏。
2022年6月,6架满载帐篷、食物、卫星互联网设备、无人机、地球物理调查设备、钻探设备的波音737飞机和一队经验丰富的地质学家飞往加拿大魁北克北部一处偏僻、简陋的停机坪。地质学家正在寻找未来清洁能源所需的主要矿物床。尖端的科学计算中融合了老派的逞能冒险,他们看来仿佛同时得到艾伦•图灵和印第安纳•琼斯的帮助。 我们的初创公司KoBold Metals在加拿大这一地区拥有800平方公里的矿产权,这样的面积判断一定程度上基于人工智能系统的预测。根据人工智能,有充分理由相信我们将在地下发现有价值的镍矿和钴矿。在这一接近北极的地区,夏季融雪创造了一个短暂的窗口,可以引入少量设备与人员来验证我们的预测。
地质学家马丁·塔克谢尔(左)和帕特里斯·里奥斯身处加拿大魁北克省努纳维克市郊外,四周都是巨大的石头。人工智能预测模型可在广阔区域内识别有可能开采的矿床。
2018年,在比尔•盖茨领导的突破能源风险投资公司(BEV)和硅谷风险投资公司Andreessen Horowitz的支持下,我们共同创立了KoBold公司,目标是找到发现电动汽车电池所需的重要金属新矿藏的方法,这项需求是巨大的,且在不断增长。
我们尝试将矿藏勘探从人工勘查、判断引导、反复试验的过程变为数据驱动且可扩展的科学。在地下100至2000米深处,找到有开采价值的钴、铜、锂、镍矿床,这比大海捞针还难。
找出潜在可开采矿床的方法之一是使用发射器线圈,它类似于海滩上使用的金属探测器,用于探测地下深处导体的感应电流。
要防止气候变化带来的严重灾难性影响,需要在2050年前实现温室气体净零排放,其中包括用电动汽车取代所有化石燃料驱动的轻型汽车和卡车。这样一来,将需要制造数十亿电动汽车电池。即使在今天,对金属的需求也超过了供给,2022年镍价翻了一番,锂价涨到了之前的5倍,就证明了这一点。为实现全球向电动汽车的转型,我们需要在本世纪中叶发现并开采价值15万亿美元的钴、铜、锂和镍。(我们目前的目标是在2050年前开采价值约3.6万亿美元的此类金属)。
世界各国和地区的领导人都很清楚这一需求。例如,2022年3月,美国总统拜登启动冷战时期的《国防生产法》,利用该法授予总统的权力鼓励国内生产电动汽车电池所需的矿产品。2022年8月,签署生效《通胀削减法案》,其中包括将数十亿美元用于补贴美国和全球金属矿产的开发和运营。
投资者也意识到了供应方面的挑战。2022年2月,KoBold在B轮融资中筹集到1.925亿美元,用于在澳大利亚、加拿大、格陵兰岛、撒哈拉以南非洲和美国获得50余个勘探点。我们计划使用人工智能将新矿床勘探的大部分分散过程进行流线化精简。发现矿床后,我们计划与矿业公司合作进行实际的开采作业,同时再次使用人工智能工具为其高效开采提供建议。
为快速测量大面积区域,KoBold使用一架直升机携带直径35米的发射器线圈探测地表下的导电体,如矿床。KoBold直升机探测的电导率数据可用于生成潜在的地下分布的模型。蓝色代表不导电的火成岩,黄色、橙色和红色圆圈分别表示由最低至高的导电区域。
早在数千年前,人类就注意到含有有用矿物的岩石具有引人注意的外观。例如,硫化镍矿床中的主要矿物硫化铁暴露于空气和雨水中,会产生明显的红锈。风化使硫化铜成为各种颜色鲜艳的矿物质,包括在自由女神像铜绿中发现的明亮绿色矿物。数千年来,这些视觉线索是区分有用矿物、金属与无用岩石的最可靠的方法。
采矿业的勘探成功率(即投资1美元发现的大型矿床数量)几十年来始终在下降。在KoBold,我们有时会谈论“矿业反摩尔定律”(Eroom)。正如其颠倒的名字所暗示的那样,它好似与摩尔定律相反。根据矿业反摩尔定律,过去30年间,每投入1美元资本所发现的矿床数量减少了7/8。(最初的反摩尔定律针对的是新药开发成本的类似趋势。)
从地质学上而言,新发现矿床的减少很大程度上是因为大多数容易发现的矿(比如地表的矿床)都已经被发现。新的矿床将深埋地下,被层层岩石掩盖。
事实上,地球上大多数的矿床仍在等待被发现。形成这些矿石的化学和物理过程是在地下数公里的温度和压力条件下发生的。也就是说,这些矿床并不是在地表形成的;在它们形成很久之后,地壳构造过程将其中的小部分带至地表。这小部分构成了今天开采的大部分矿床。采矿业拥有开采地底深处矿床的设备和技术,问题在于首先要找到这些矿床。
你可能会认为,采矿业会在勘探和研发方面投入巨资以改进勘探方法。但事实并非如此。过去数十年间,大公司越来越少地依赖自身的勘探项目,反而更多地依赖收购其他公司的发现。矿业公司的股东期待的是股息,而非创新。
在KoBold,我们将勘探视为信息问题:发现并分析多种类型的数据,从而揭示我们正在寻找的目标。特别是,在这一信息问题中,获取更多数据类型需要付出高昂的代价。我们的解决方案是将人工智能系统与地球科学专业知识相结合,找出最能减少不确定性的那些信息。
公共领域已存在大量的地球科学信息,但它们是分散的,且呈碎片化。其中一些信息来自政府资助的地质调查,还有一些来自私人公司的调查,政府要求这些公司将其调查结果公之于众。信息分布在数百万个数据集之中,包括显示在不同地点观测到的岩石类型的地质图,对岩石、土壤、岩心、植物和地下水样品中数十种元素的浓度进行的地球化学测量,对引力场、磁场、自然电流和感应电流、地震波和地壳中重元素核衰变辐射的地球物理测量,测量地球表面矿物光谱反射率的卫星图像(包括可见光和红外波段),以及描述实地观测的文本报告。总而言之,数据是海量的。
更重要的是,这些数据集来源广泛,从最先进的质谱测量到手绘在亚麻布上的百年地图,应有尽有。每个数据集都有其用处,若以恰到好处的方式加以组合,将得到强大的完整资料——前提是你能看懂它。
我们的数据系统被称为TerraShed,它对信息进行解析并将其转化为标准形式,使人工和算法都可以访问和搜索这些信息。管理数据并对其进行质量控制只是第一步。然后,我们运用各种算法来指导决策,决定在勘探过程的各个阶段采集哪些数据、了解某个特定矿床是否值得开采,以及矿山本身的建设等。
TerraShed生成的并非简单的“藏宝图”:它不会根据数据吐出“标记地点X”。与之相反,我们有数百个不同的专有模块,指导勘探过程中的每项决策。
我们在魁北克北部的勘探项目提供了一个很好的研究案例。首先,我们用机器学习来预测最有可能在哪里找到蕴藏量足够、值得开采的镍矿。我们使用该区域可用的基础物理数据和地质数据来训练模型,并通过地质学家的专业见解对模型结果进行补充。在魁北克省,这些模型将我们指向距离目前正在运营的矿山不到20公里的地点。
获得了相关的土地权后,我们的地质学家在现场的野外营地工作,对露出地表的岩石进行观察和测量。在我们指定的800多平方公里的土地上,对岩石取样的选择几乎是无限的。然而,时间和金钱却并非如此,在我们的工作地区,地面无积雪的窗口时间不到3个月。
因此,信息挑战变为:如何决定对哪些岩石进行采样?
我们建造了机器勘探器,它包括机器学习模型和历史数据,如该省其他地点以前曾发现的信息。勘探器可帮助我们预测在有限的时间内,应该对哪些岩石进行取样。具体而言,我们寻找的是那些经过长时间地质过程、形成富含镍和钴的岩浆硫化物矿床。
有了预测,野外地质学家就可以开始分散工作。有人前往最有可能产生此类岩浆硫化物的地点;还有人去了预测不确定性最高的地点。与在模型预测确定的地点采集数据相比,在预测不确定性高的地点采集数据更有助于改善下一代模型。
野外小组晚上回到营地后,通过卫星上传当天的数据。我们的数据科学家在全球范围内工作,根据新的数据点重新训练模型,从而产生的新预测,改变整个地区潜在样本地点,指导团队做出下一步去哪里的决策。通过近实时地整合新的野外信息,模型的自适应预测有效地将学习周期从一个季节缩短至一天。
与使用地质图的传统预测相比,我们的模型产生预测的假正率和假负率降低了80%。构建地质图的过程是,先在较少的地点对岩石进行观测,然后使用一套规则和规范,将观测结果扩展至更大的地区。这意味着传统预测在很大程度上是一种推断,更糟糕的是,这会导致无法量化的不确定性。换言之,我们不知道这种地图到底有多精确。相比之下,KoBold的预测模型确实量化了不确定性,这又指导了我们的数据采集工作,因为不确定性最高的岩石往往是最有价值的样本。
于2022年在魁北克省北部进行的一个勘探项目的结果,是我们独特的勘探方法取得成效的一个完美实例。
地质学家戴夫·弗里德曼站在KoBold公司位于加拿大魁北克省努纳维克市的Cape Smith的一排岩心样本后面,样本采集自受关注区域,可验证人工智能的预测。上面的岩心样本KSC22-07中的褐色斑点显示存在岩浆磁黄铁矿。
在人工智能系统结果的指导下,我们的现场团队发现了一大片遍布巨石的区域,地质学家鲁西•马修(Lucie Mathieu)认为这非常反常,且这些巨石并不是构成该地区大部分巨石的典型火成岩。
电磁测量结果显示,这些巨石的导电性异常高,这与我们正在寻找的矿物种类一致,这一结果引起了我们的初步兴趣。我们每日进行时域电磁测量,由一架直升机牵引直径30.5米的发射机线圈采集电磁数据。在测量中,发射机通过线圈发射7.5赫脉冲电流,在地下导电材料中产生感应电流。脉冲发射结束时,接收线圈检测到地下感应电流的衰减,我们可据此建立地下岩石电导率的三维模型。我们正在寻找的矿石的高导电性只是用来区分矿石和其他岩石的若干因素之一。
直升机和地球物理测量设备成本昂贵,在北方,好天气的窗口转瞬即逝,且不可预测。把直升机送到哪里,以及如何在空中覆盖和空间分辨率之间进行权衡,这些都是至关重要的考虑因素。
我们可以利用采集到的数据建立地下矿石可能位置的三维模型,这是一个十分困难的计算问题。简单地说,我们对地表二维平面的感应场进行了有限的测量,试图从中推导出地下三维体积的特性(本例中为电导率)。这里有无数的地下岩石构造,与地面数据一致。
业内的传统做法是建立一个最佳估值模型,拟合大量参数,这很容易超过数据点的数量。如果用n个方程组来解2n个未知数,这个问题没有唯一的解。业内所用的传统方法在众多潜在的解中选择一种,通常会包含与地质过程不一致的假设,且容易产生确认偏差。
为了做得更好,我们对地下预测的不确定性进行量化。与传统的最佳估值模型相比,我们的机器学习模型使用的参数要少得多,而且参数与关键的勘探问题直接相关:存在多少导电体?它们有多深?走向如何?它们的导电性是否与高富矿石的一致?我们模型的输出结果是这些参数的联合概率分布。
最终,采集数据的可用性在于能否在发现可开采矿床的过程中减少不确定性。我们与斯坦福大学Mineral-X计划的合作者共同开发了一种量化增量数据有用性的新方法。2022年3月,我们在《自然资源研究》(Natural Resources Research)上发表了我们称之为“信息功效”的框架,并用它来设计魁北克北部钻探计划和其他勘探计划。
在加拿大魁北克省努纳维克市一处遍布巨石的场地中央,奥黛丽·阿芬戈(左一)和摩根·麦克尼尔正在接收器地面电磁线圈上工作。右图中地球物理技术人员麦克尼尔正在使用超导量子千涉装置(SOUID)进行地面电磁测量,接收地下导电体发出的微弱磁场。
在魁北克的整个夏天里,我们一共钻了10个勘探孔,每个勘探孔距离前一勘探孔均超过1公里。我们将预测模型的结果与地质学家的专业判断相结合,确定每个钻井的位置。每个孔采集到的数据都表明,我们在地下合适的地质环境中找到了导电体,换言之,这可能是可开采的矿床。最终,我们在10个勘探孔中的8个发现了硫化镍矿,这差不多是类似孔距下行业平均水平的10倍。
预测的准确性和特定性也令我们感到满意。例如,在KSC-22-004孔,我们的数据科学家预测导电体位于地下130至170米。下钻时,我们在146米处遇到了高导电性岩石。
在野外季节结束的前几天,我们取得了一项特别发现。这些数据帮助确定了地下地质结构,因此,我们的团队便可在下一个季节(很快就会开始)通过最有效的钻孔来确定矿床的形状和大小。
假设我们在该地区探明的矿藏如希望的那样前途光明,我们就可以前往下一个矿藏,寻找地球电气化所需的另一种关键金属。总体而言,到本世纪中叶,全球至少需要新开发1000座矿山,为生产足够的电动汽车提供足够的关键金属,避免气候变化带来的严重后果。这是一项艰巨的任务,但通过应用KoBold这样的新型人工智能系统,我们也许能够以足够快的速度挖掘出新的机会。
作者:Josh Goldman、Kurt House