谁是浩特?请参考下图

在智能工业与数字化转型的巨浪中,自动驾驶、大语言模型正以势不可挡的姿态重塑人类社会。然而,在远离霓虹灯火的深山戈壁之间,一个承载着全球工业血液、资产规模达数万亿美元的传统行业——矿业工程,长期以来却在与一种极其残酷且隐蔽的自然力量进行着孤独的博弈。
这种力量叫做:地质不确定性(Geological Uncertainty)。
传统的战略矿山规划长期受困于“开采前的信息黑盒”。面对深埋地下、延绵数公里的复杂矿体,即便投入数千万美元进行前期钻探,人类对地下金属品位分布的认知依然如同盲人摸象。为了攻克这一行业百年痛点,浩特(成都)智能科技有限公司(HOT Mining,以下简称“浩特智能”)凭借多年来在智能矿山设计、智慧选矿及复杂系统工程领域的深厚积淀,在行业内首次自主研发并推出了颠覆性的长期采矿调度闭环控制系统——HOT-AIMS(浩特自适应智能矿山调度系统)。
该系统核心搭载了业内首创的自适应SA-POMDP(部分可观测马尔可夫决策过程)序贯决策架构。它摒弃了传统矿业“计划驱动”的被动对冲模式,让采矿时序方案与物料分流策略拥有了像自动驾驶系统般的“主动感知与实时动态演化”能力。实验表明,该架构能够将矿山长期的资产变现净现值(NPV)提升数千万元乃至数亿元,尤其在面对先验模型存在系统性偏差的极端恶劣工况下,最终实现的经济回报相比传统最先进的随机优化方案暴增达36.9%。
这是一场将决策轴、时间轴与信息轴彻底融为一体的矿业数字范式革命。
在露天采矿工程中,长期生产调度(Life-of-Mine Production Scheduling)是驱动整个矿业项目生死存亡的核心决策引擎。它需要回答一个长达数十年、涉及成千上万个三维区块的超级组合优化问题:在什么时候、挖掘哪里的区块?开采出来的物料,究竟应该送往高能耗的选矿厂、堆浸场,还是直接作为废石丢弃到废石场?
这一问题的数学本质,是三维立体空间先序约束(必须先挖上层围岩,才能暴露深层矿体)与下游刚性加工产能上限相互交织的双重非线性耦合优化。
在当前的工业界和主流学术界中,这一决策历程经历了两个主要阶段:
1. 确定性规划(Deterministic Optimization):基于一组由地质工程师通过普通克里金(Kriging)等数学插值方法得到的“平均品位”单一体积模型进行线性规划。这种方法假设未来是百分之百确定的。然而,“平均”是矿业中最大的谎言。在实际开采中,一旦某个台阶的真实品位低于预期,下游选厂就会面临严重的资源饥饿,或者因为吞入大量废石而导致处理能耗暴增、财务现金流瞬间崩溃。
2. 一阶段随机优化(One-shot Stochastic Optimization):利用地质统计学中的序贯高斯模拟(SGS)或多点地质统计学生成数百个平行的地质可能场景,并在这些场景组成的约束矩阵上进行多情景对冲。虽然这在一定程度上缓解了全面溃败的风险,但浩特智能的研究团队指出,它存在一个根本性的、结构性的逻辑缺陷——它将地质不确定性视为一种“被动的约束(Passive Constraint)”。
传统随机优化假设所有长期的开采承诺和分流边界必须在开采前(Ex ante)就一次性计算完毕。即便后续引入了滚动窗口重新优化(Rolling-horizon re-optimization),其本质也只是在现实造成破坏后的“被动修补”,而非在规划之初就将“未来的学习能力和信息感知(Sensing)”内生化地编织进当前的每一项决策决策逻辑中。
采矿本质上是一个高度动态的、序贯的信息显化过程。每一个区块被电铲挖掘并送往化验室或在线品位检测仪时,都会暴露出精确的品位数据。由于空间相关性的存在,这些数据不仅纠正了我们对当前被挖区块的认知,更像一盏明灯,辐射并照亮了周围大片尚未开采区域的地质信念。传统规划在不确定性最大时做出了不可逆的长期时序承诺,从而导致期望NPV与实际物理实现NPV之间存在巨大的“期望-现实差距(Expectation-Reality Gap)”。
浩特智能的解决方案是将整个长期调度逻辑彻底重构为主动学习、自适应控制的策略驱动(Policy-driven)新范式。
为了让调度引擎具备预见未来信息刷新、边挖边修正的能力,浩特智能的核心研发团队攻克了高维状态空间连续更新的数学难题,首次完整地将长期采矿生产调度形式化为部分可观测马尔可夫决策过程(POMDP)。系统将其严格定义为一个包含七大组件的数学模型 langle S, A, O, T, R, Z, gamma /rangle:
在浩特自研的模型中,系统状态 s /in S 被精妙地拆解为两个高度互补的维度:
物理地质组件(静态但未知):代表整个矿山矿床三维空间中真实的、绝对物理客观的金属品位空间场。在几十年开采期内,地底下的真实品位分布是固定不变的,但由于地表覆盖和探测限制,它对决策者而言是高度隐蔽、无法直接全面获知的。
运营生产组件(动态且已知):精确记录当前时间步 t 时,三维空间中哪些区块已经被彻底挖掘并移出系统,以及下游各大智能选矿厂、堆浸车间在当前周期的剩余处理产能。

它在每个周期不仅要指定开采哪一个满足三维空间空间先序关系(Precedence Constraints)的特定表面区块,还要在其出土的瞬间,为其指定物理去向(如高品位硫化选厂、低品位堆浸场、选矿前置XRT智能分选机或尾矿废石场),动作空间受到严格的设备物理吞吐量刚性红线限制。
当动作 a 执行、某个三维区块被挖掘时,浩特智能布置在采场的智能化化验设备或皮带在线品位分析仪会瞬间捕获该区块的真实金属浓度(如 Cu 或 g/t/Au),这构成了观测向量 o /in O。
这里的核心机理在于空间自相关性(Spatial Autocorrelation)。当前挖掘区块的品位 o 不仅代表其自身的财务价值,还能通过地质统计学的空间协方差矩阵,提供其周围数百米范围内未开采区块的条件概率分布修正信息。每一个开采动作,本质上都是一次对地下的“高维主动勘探”。
由于地下地质体是静态的,状态的地质组件在转移时表现为恒等映射;而系统的运营组件转移则是完全确定且不可逆(Deterministic and Irreversible)的——区块一旦被挖掉就永久消失,这导致系统的物理边界和后续的可行决策空间在三维空间拓扑上被永久性地改变。
即时回报直接与项目的整体财务净现值(NPV)挂钩:

如果系统因为由于认知偏差,错误地将高品位矿石送往了废石场(资源流失),或者将纯废石送往了高能耗的选厂(无效空转),回报函数会立刻施加极其严重的经济惩罚。
浩特架构中,观测过程本身在物理化验层面被视为无噪声的完美测量,系统所有的不确定性不源于测量仪器的粗糙,而彻底来源于真实地质状态 s 在初始状态下的部分可观测性(Partial Observability)。
既然真实的地下状态 s 无法直接窥探,浩特决策大脑的核心依据就是信念状态 b_t(s)。它是基于直到当前时间步为止,所有历史开采位置、历史品位化验数据的概率轨迹后,在整个地质实现空间上的条件概率分布。其最优动作值函数 Q^*(b_t, a) 严格服从以下 Bellman 最优方程:

这一方程完美展现了浩特系统远超传统软件的智慧所在:右侧第一项是当前信念下的即时期望经济收益(利用已有信息挣钱);第二项则是积分意义下的未来远期回报——它显式地计算了当前这个动作所带来的信息增益(即通过知道这一块的品位,能把周围看多清),以及这种看清的能力对后续长达数十年所有决策质量的累积提升(信息溢价)。
在传统的计算机科学中,求解连续空间且包含数万个空间连锁变量的 POMDP 问题面临着灾难性的“维数灾难(Curse of Dimensionality)”,直接采用标准的树状蒙特卡洛规划(如 POMCP)会导致内存和算力在一瞬间彻底瘫痪。
浩特智能的研发团队另辟蹊径,创造性地开发出了一条兼顾理论前瞻性与工业级计算可行性的混合系统架构——SA-POMDP。其核心思想可总结为:“信念空间单步前瞻 + 长期尾部固定信念随机对冲”。
整个自适应闭环决策循环在每个生产周期(Decision Epoch)内,以高度流水线化的工业级逻辑运行:
面对采坑内成百上千个表面物理可挖区块,系统利用空间几何拓扑算法和快速经济指标,瞬间筛选出一组最具代表性、涵盖不同开采推进方向的精简候选动作集合 A_{cand} \subseteq A。
SA Oracle(模拟退火值函数神谕机),并行评估(Step 2):
对于集合中的每一个候选动作 a \in A_{cand}:
假想观测与预更新(Step 2a):从当前的地质信念集合 b_t 中抽取场景,模拟该动作可能返回的假想品位观测 o_{sim},并利用该观测将信念预演刷新为假想后延信念 b'_t。
对比所有候选动作,选出能够最大化全局总现值的动作 a^*_t = \arg\max Q(b_t, a) 下发给采场无人电铲或卡车队列执行,物理开采该区块,并捕获传回的真实品位观测 o_t。
利用集成的 ES-MDA(集合平滑多数据同化)引擎,将真实化验出的品位数据 o_t 注入当前信念场景集 b_t 中,平滑修正并动态更新整个三维立体数字孪生矿床模型,生成下一阶段决策的基准信念 b_{t+1},系统自动步入下一个自适应循环。
这一“走一步、看一步、算全局”的闭环反馈控制机制,构成了天然的自校正回路(Self-Correction Loop)。前期的任何近似误差和局部扰动,都会在后续源源不断涌入的真实地质信息中被彻底稀释和吸收,展现出无与伦比的工程弹性和抗噪能力。
HOT-AIMS 系统之所以能够从理论模型完美落地为可在工业现场分钟级运行的商业化软件,得益于浩特智能在以下三大底层“黑科技”实现细节上的极致打磨:
在传统控制工程中,粒子滤波(Particle Filter)常用于更新信念,但在面对拥有数十万网格的地下高维非线性空间品位场时,粒子滤波会发生灾难性的粒子退化与崩溃(Particle Degeneracy and Ensemble Collapse)——即更新到最后,几百个场景中只有一两个场景的权重趋近于1,其余全部死掉,这彻底抹杀了地质统计学的空间多样性。
浩特智能采用了国际最前沿的 ES-MDA(Ensemble Smoother with Multiple Data Assimilation,集合平滑多数据同化) 技术。其核心数学原理是将一次大跨度的条件化贝叶斯更新,均匀且平滑地拆解为 \alpha_p 次添加了人工扰动噪声的微小同化步。
从数学公式上看,场景集合中第 j 个地质场景的物理品位数值向量 \mathbf{m}_j 的更新遵循如下空间互协方差传导:

由于在每个决策节点,系统需要针对所有精选出的候选动作逐一调用长期随机规划优化器,这意味着底层的优化核心(Solver)在几小时内要被高频调用数千次。传统的面向全寿命期一次性求解的通用数学规划求解器(如 CPLEX 或传统的 Standalone SA)在运算速度上根本无法承受。
浩特智能的算法科学家对经典模拟退火算法实施了多项硬核的工程加速改造:
单温度几何降温路径与自适应邻域(Single-Temperature Geometric Cooling):定制了硬性的几何降温线Tnext = β · Tcurrent。同时,在扰动算子设计上,系统会优先扰动那些处于当前开采锥体边缘、对长期现金流贡献最大的关键变量(即所谓的”高敏感边界区块”),大幅压缩了无效的解空间漫游。
为了彻底斩断组合优化分支爆炸的源头,系统建立了一套三级过滤机制:
利用三维空间网格的有向无环图(DAG)关系,只有上方及斜上方围岩已被彻底清空、开采斜坡角度满足岩土力学安全红线的表面网格区块,才有资格进入待选库。
为每个物理可行区块计算两个快速标量:一是当前信念均值下的“即时金钱价值分”;二是其所处空间的“信息空间熵增分”(如果该区块方差极大,说明它是探明周边盲区地质的核心战略支点)。
在综合得分前列的区块中,强制进行空间距离发散性采样,选出 5 到 10 个物理推进方向截然不同的最优质动作组成最终的候选短名单。这一设计完美实现了强化学习中“利用(Exploitation,稳健榨取已知富矿)”与“探索(Exploration,战略性试探未知边界)”的黄金平衡。
为了验证 HOT-AIMS 系统的实际作战能力,浩特智能将其应用于一个工业级的大型复杂铜金矿数字孪生案例中进行拉网式极限测试。
该案例包含一个由数十万个区块组成的三维网格矿床。矿石类型极为复杂,包含硫化矿(Sulfides)、过渡矿(Transition)和氧化矿(Oxides)三大门类。
下游配套了极为复杂的 6 种截然不同的加工与处置流向系统:高能耗高回报的硫化选厂(Sulfide Mill)、硫化堆浸场、过渡矿堆浸场、氧化矿堆浸场,以及两种不同岩性的废石场。其中,硫化选厂和硫化堆浸场设定了极其严格的年度处理产能上限,属于典型的资源与能耗双重刚性约束。
测试基准线(Baseline)设定为当前全球多国头部矿山正在使用的最先进方案——基于多地质场景对冲的单次随机优化规划(One-shot SA)。在测试中,系统从 100 个由地质统计学生成的平行世界中,秘密隐藏了 1 个作为绝对客观真实的“地下实体(Ground Truth)”,其余 99 个作为项目开始时的初始先验信念集。
测试一:统计学一致先验下的资产增值(Base Case)
当初始的 99 个地质场景在整体均值和统计学特征上与隐藏的真实地下体完全一致时,传统方案与浩特 SA-POMDP 架构的财富变现对比如下:

浩特深度财务机理解析:
传统的单次优化由于是在静态的场景集上执行的,其庞大的整数解空间会针对这组场景的数学均值产生严重的过拟合(Overfitting to Scenarios),从而在开采前给出了一个极其乐观、讨好管理层的虚高纸面预期(221.8 M)。然而在真实的开采推进中,由于其计划如同铁板一块,没有任何闭环学习和动态调整的能力,前期的一意孤行导致后期彻底丧失了开采的空间自由度,最终在现实面前遭遇了高达 22.3% 的财务预期坍塌(即业界常见的“投产即变脸”)。
相反,浩特智矿的 SA-POMDP 架构在第一步决策时就具备了高级的智慧:它深知自己未来是可以且必须根据新观测进行动态调整的。因此,它的每一次出击都极其沉稳,绝不盲目赌博。这不仅使得期望与现实惊人地收敛(Gap 仅为 4.6%),更扎扎实实地在物理世界中多变现了840万美元(约5880万元人民币)的真金白银。
测试二:先验模型存在系统性偏差下的极限压力测试
在实际地质工程中,由于前期钻孔稀疏、化验设备校准系统性倾斜或断层识别失误,先验地质模型经常出现系统性的整体高估或低估(例如平均品位整体偏高或偏低 10%)。浩特智能对此进行了极其残酷的生存能力测试。
实验结果令人震撼:在先验偏差达到 pm 10% 的恶劣生存环境下,传统静态规划方案由于其计划的绝对刚性,在开采到中后期时彻底瘫痪,引发了由于矿石品位断崖式下跌导致选厂大面积空转的灾难;而 HOT-AIMS 自适应框架凭借在运行过程中的实时数据同化,在中前期就迅速“嗅探”到了偏差并完成了信念复苏,最终实现的实际 NPV 相比传统静态规划暴增了达 44.6 M(约3.12亿元人民币),财务表现相对净提升幅度高达惊人的 36.9%!
它用完美的数学与数据证明了:自适应控制策略,是抵抗系统性未知地质风险的终极武器。
能有如此惊艳的财务战果,是因为 HOT-AIMS 系统在微观层面的生产运营控制中,展现出了传统调度软件根本不具备的三大核心机理优势:
截止品位(Cut-off Grade)是决定矿石与废石分界线的核心指挥棒。在测试的第 5 至第 10 年,传统静态规划由于遭遇了与预期不符的、大面积低品位过渡矿的反常侵入,导致选厂大吞吐量地吞入不达标物料。这不仅极大地挤占了选厂宝贵且刚性的年度处理产能上限,还造成了巨大的能耗空转损失,产生了严重的“选厂饥饿与低效空转症”。
而浩特系统的决策大脑在运行到第 3 年时,就已经敏锐地从前线源源不断传回的皮带品位化验数据中发现了异常。ES-MDA 引擎随即自动对未开采核心区实施了变差传导修正,调低了整体品位信念。
底层 SA 尾部优化器在感知到这一信念变化后,瞬间在后续的所有时段做出了高明的策略应对——在物理采坑中主动、内生性地调高了送往硫化选厂的品位准入门槛,同时迅速扩大了外围和上层围岩的剥离(剥采比自适应调整)。这一神来之笔成功保护了价值高昂、能耗巨大的核心硫化选厂在整个矿山寿命期内始终维持着高品位、高浓度的满负荷黄金运转状态,实现了资源品位与下游加工能耗的极限匹配。
露天采场是一层一层往下剥离的。传统静态规划为了追求前期的产值指标,往往采用极其激进的方案,过早地向深部富矿区孤军深入,从而在空间拓扑上把两侧和上层的开采台阶卡死,使得整个采坑变成了一个缺乏腾挪空间的狭窄深坑。
而浩特系统的 Bellman 价值函数因为加入了“未来的信息刷新和自由度溢价”,其在前期做决策时,表现得更像一位太极大师。它在前期更倾向于保留更宽阔、更具空间选择弹性的“多台阶露天拓扑柔性结构”。这一拓扑柔性赋予了矿山在后续漫长岁月中,一旦遭遇局部地质灾害、品位断层或国际金属价格暴跌时,拥有随时切换采场分支、调整推进方向或随时调用前置 XRT 智能分选机的物理自由度。留足空间弹性,就是留足财富的退路。
HOT-AIMS 系统绝不是一个孤立的、只存在于办公室电脑里的排产软件。作为一家在智慧选厂和采矿工程领域深耕多年的科技企业,浩特智能将该自适应算法体系与公司旗下的硬件拳头产品——智能 XRT 射线全自动矿石分选机、数字孪生智慧选厂控制平台实施了无缝的一体化无感生态集成。
通过将 AIMS 系统的多流向控制逻辑,与现场 XRT 分选机的实时抛废比例调整算法(实时根据调度大脑算出的截止品位变更剔除门槛)进行亚秒级联调,浩特成功在空间(采场调度)与物理(车间选矿)两个维度构筑了一张密不透风的智能控损网络,将“边挖、边学、边选”的绿色智矿愿景彻底推向了现实。
在当前科技投资界寻找具备极高行业壁垒、广阔商业蓝海以及高确定性资本回报(ROI)标的的当下,浩特智能的这一突破性突破,完美契合了“硬科技创新 + 刚需万亿传统产业升维”的硬核投资逻辑:
极高的跨学科准入壁垒(High Barrier to Entry):该技术的底层成功融合了高深的高维随机控制理论(POMDP)、尖端的地质统计学数据同化算法(ES-MDA)以及极端复杂的组合优化元启发式内核。这种“数学+地质+采矿+软件”的复合跨界壁垒,让普通的纯软件 SaaS 团队或传统的挖矿工程队伍在数年内根本无法复制和超越。
对那些正在为了地下品位对不上、选厂能耗居高不下、尾矿抛废效率低下而焦头烂额的各大矿业集团、设计院及工程伙伴们,浩特智能在此正式发出最为诚挚的合作邀请:
我们带来的不仅仅是一套全新的软件,更是一种将“矿山生命期不确定性”转化为“确定性财富收益”的全新合作范式。浩特智能不仅能为您提供 HOT-AIMS 调度系统软件的深度定制与本地化部署,更能够将这颗强大的“算法大脑”,与您的现场钻探数据、智慧选厂以及浩特自研的高效 XRT 智能分选装备进行全栈式闭环打通。
未来已来,不确定性不再是吞噬财富的黑洞,而是闪烁着数据光芒的矿藏。 浩特智能诚邀全球顶尖投资机构、行业领军矿业集团以及生态合作伙伴携手前行,共同登陆属于智能矿业大航海时代的全新大陆!
密控系统自动实时调整设定密度,进行密度调节,实现无人值守。主要应用于两类重介系统:第一类为浅槽重介系统;第二类为旋流器重介系统。
X
欢迎来到浩沃特!