<  Back to the Polytechnique Montréal portal

Developing New High-Order Sequential Simulation Methods Based on Learning-Oriented Kernels

Lingqing Yao

Ph.D. thesis (2020)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (23MB)
Show abstract
Hide abstract

Abstract

Uncertainty quantification plays a vital role in managing the technical risk of the sustainable exploitation of natural resources. Random field models are utilized to model the natural attributes of interest, within which the attributes at different locations are represented as random variables comprising a joint probability distribution. Spatial statistics, varied with different random field models, mathematically describe the spatial patterns. Stochastic simulation methods generate multiple realizations based on certain random field models to represent the possible outcomes of natural attributes under consideration. They aim to reproduce spatial statistics of the perceived data, thus providing useful tools to quantify the spatial uncertainty of the target attributes. In the context of mining applications, reproducing spatial patterns from the sample data has a significant impact on managing the risks of mine planning decisions. Specifically, the net present value (NPV) regarding a certain mine planning schedule of a mineral deposit depends on the revenue generated by the extraction sequences of the underground materials, as the cash flows are discounted by the mining periods. The extraction sequences of the materials, in turn, are driven by the spatial distributions of metal grades, especially the spatial continuity of enriched metal elements. High-order stochastic simulation methods make no assumption of any specific probability distribution on the random field models, avoiding the limitation of traditional Gaussian random field models. In addition, the methods account for the high-order spatial statistics that characterize the statistical interactions among random attributes at multiple locations and thus have the advantage of reproducing complex spatial patterns. Therefore, this thesis develops new high-order stochastic simulation methods based on a proposed framework of statistical learning and learning-oriented kernels, aiming to advance the theoretical aspects of the stochastic simulation methods, as well as the practical aspects of mining decisions under uncertainty. The general paradigm of sequential simulation is adopted in this thesis to generate realizations from the random field models, which decomposes the joint probability distributions into a sequence of conditional probability distributions. The original high-order simulation method uses the Legendre polynomial expansion series for the approximation of the joint probability distributions of the random fields. The coefficients of the polynomial expansion series are derived from the computation of so-called spatial cumulants, which have to be stored in a tree structure in memory. In addition, some terms from the polynomial series are dropped considering the computational complexity. As a first contribution, a new computational model of high-order simulation is proposed herein,which avoids the explicit computation of spatial cumulants and the storage of the computed results. A unified function is derived as the equivalency form to the Legendre polynomial expansion series without dropping out any terms, while simplifying the computations to polynomial time. The proposed simulation method leads to a recursive algorithm of deriving the conditional probability distribution. As a second contribution, a new kernel function, the so-termed spatial Legendre moment kernel, is proposed to embed high-order spatial statistics of the original data into the new kernel space. A statistical learning framework is proposed to learn the target probability distribution of the random field by matching the expected high-order spatial statistics with regard to the target distribution to the observed high-order spatial statistics of the available data through a kernelized algorithm. The new statistical learning framework for high-order simulation has the generalization capacity to mitigate the statistical conflicts between the sample data and the training image, as confirmed by the case studies with a synthetic data set. Case study at a three-dimensional gold deposit shows the practical aspects of the proposed method in a real-life mine, demonstrating the reproduction of high-order spatial statistics from the drill-hole sample data. To avoid the impact of potential statistical conflicts with the sample data by using a training image, a training-image free high-order simulation method is developed based on the above statistical learning framework. A new concept of aggregated kernel statistics is proposed to enable sparse data learning. The data events, as the conditioning data, correspond to the attribute values associated with the so-called spatial templates of various geometric configurations. The aggregated kernel statistics combine the ensemble of the elements in different kernel subspaces for statistical inference, efficiently utilizing the incomplete information from the replicates, which partially match to the spatial template of a given data event. The case study shows an effective reproduction of the high-order spatial statistics of the sample data without using the TI. Our last contribution aims to achieve the target probability distributions of the random field models by learning high-order spatial information from different sources at multiple scales. Specifically, the aggregated kernel statistics is proposed to incorporate the high-order spatial statistics at coarse-scale from the sample data and to complement the high-order spatial statistics at fine-scale from the TI. In addition, a software is developed and described to facilitate the applications. Case studies with a synthetic data set and at a gold deposit are conducted respectively to test the method and the developed program.

Résumé

La quantification de l'incertitude joue un rôle essentiel dans la gestion du risque technique de l'exploitation durable des ressources naturelles. Les modèles de champs aléatoires sont utilisés pour modéliser les attributs naturels d'intérêt, parmi lesquels les attributs à différents endroits sont représentés comme des variables aléatoires comprenant une distribution de probabilité conjointe. Les statistiques spatiales, qui varient selon différents modèles de champs aléatoires, décrivent mathématiquement les structures spatiales. Les méthodes de simulation stochastique génèrent des réalisations multiples basées sur certains modèles de champs aléatoires afin de représenter les résultats possibles des attributs naturels considérés. Elles visent à reproduire les statistiques spatiales des données perçues, fournissant ainsi des outils utiles pour quantifier l'incertitude spatiale des attributs cibles. Dans le contexte des applications minières, la reproduction de structures spatiales, à partir des donnéeséchantillons, a un impact significatif sur la gestion des risques liés aux décisions de planification minière. Plus précisément, la valeur actualisée nette (VAN) d'un gisement minéral, compte tenu d'un calendrier de planification minière donné, dépend des revenus générés par les séquences d'extraction des matériaux souterrains, les flux de trésorerie étant actualisés en fonction des périodes d'exploitation. Les séquences d'extraction des matériaux, à leur tour, sont déterminées par la distribution spatiale des teneurs en métaux, en particulier la continuité spatiale des éléments métalliques enrichis. Les méthodes de simulation stochastique d'ordre élevé ne présupposent aucune distribution de probabilité spécifique sur les modèles de champs aléatoires, évitant ainsi les limites des modèles de champs aléatoires gaussiens traditionnels. De plus, ces méthodes tiennent compte des statistiques spatiales d'ordre élevé qui caractérisent les interactions statistiques entre les attributs aléatoires en de multiples endroits et elles ont donc l'avantage de reproduire des structures spatiales complexes. Par conséquent, cette thèse développe de nouvelles méthodes de simulation stochastique d'ordre élevé basées sur un cadre proposé d'apprentissage statistique et de noyaux orientés sur l'apprentissage, visant à faire progresser les aspects théoriques des méthodes de simulation stochastique ainsi que les aspects pratiques des décisions minières sous incertitude. Le paradigme général de la simulation séquentielle est adopté dans cette thèse afin de générer des réalisations à partir de modèles de champs aléatoires, ce qui décompose les distributions de probabilités conjointes en une séquence de distributions de probabilités conditionnelles. La méthode originale de simulation d'ordre élevé utilise la série d'expansions du polynôme de Legendre pour l'approximation des distributions de probabilités conjointes des champs aléatoires. Les coefficients de la série d'expansion du polynôme sont dérivés du calcul de ce que l'on appelle les cumulants spatiaux qui doivent être stockés dans une structure arborescente en mémoire et certains termes de la série du polynôme sont abandonnés compte tenu de la complexité du calcul. À titre de première contribution, un nouveau modèle de calcul de simulation d'ordre élevé est ici proposé, évitant le calcul explicite des cumulants spatiaux et le stockage des résultats calculés. Une fonction unifiée est dérivée comme une forme d'équivalence à la série d'expansions du polynôme de Legendre sans abandonner aucun terme, tout en simplifiant les calculs en temps polynomial. La méthode de simulation proposée conduit à un algorithme récursif de dérivation de la distribution de probabilités conditionnelles. À titre de deuxième contribution, une nouvelle fonction du noyau, ce qu'on appelle le noyau spatial du moment de Legendre, est proposée pour intégrer des statistiques spatiales d'ordre élevé des données originales dans le nouvel espace du noyau. Un cadre d'apprentissage statistique est proposé pour découvrir la distribution de probabilité cible du champ aléatoire en la faisant correspondre aux statistiques spatiales d'ordre élevé observées dans les données disponibles grâce à un algorithme à noyau. Le nouveau cadre d'apprentissage statistique pour la simulation d'ordre élevé a la capacité de généralisation nécessaire pour atténuer les conflits statistiques entre les données-échantillons et l'image d'entraînement, comme le confirment les études de cas avec des données synthétiques. Un gisement d'or tridimensionnel est réalisé pour montrer ses aspects pratiques dans une mine réelle, en démontrant la reproduction de statistiques spatiales d'ordre élevé à partir des données-échantillons de forage. Pour éviter l'impact d'éventuels conflits statistiques avec les données-échantillons en utilisant une image d'entraînement, une méthode de simulation d'ordre élevé sans image d'entraînement est développée en se basant sur le cadre d'apprentissage statistique ci-dessus. Une nouvelle approche d'agrégation de noyaux est proposée afin de permettre la découverte de données éparses. Les événements de données, comme les données de conditionnement, correspondent aux valeurs d'attribut associées aux modèles spatiaux de diverses configurations géométriques. L'agrégation de noyaux combine l'ensemble des éléments dans différents sousespaces du noyau pour l'inférence statistique, en utilisant efficacement les informations incomplètes des répliques qui correspondent partiellement au modèle spatial d'un événement de données spécifique. L'étude de cas montre une bonne reproduction des statistiques spatiales d'ordre élevé des données-échantillons sans utiliser les images d'entraînement. Notre dernière contribution vise à atteindre la distribution de probabilité cible des modèles de champs aléatoires en apprenant des informations spatiales d'ordre élevé provenant de différentes sources à différentes échelles. Plus précisément, l'agrégation de noyaux est proposée pour incorporer les statistiques spatiales d'ordre élevé à une échelle grossière à partir des données-échantillons et pour compléter les statistiques spatiales d'ordre élevé à petite échelle à partir de l'image d'entraînement. De plus, un logiciel est développé et décrit pour faciliter les applications. Des études de cas, dans un gisement d'or et avec un ensemble de données synthétique, sont menées respectivement afin de tester la méthode et le programme développé.

Department: Department of Mathematics and Industrial Engineering
Program: Doctorat en génie industriel
Academic/Research Directors: Michel Gamache and Roussos G. Dimitrakopoulos
PolyPublie URL: https://publications.polymtl.ca/5342/
Institution: Polytechnique Montréal
Date Deposited: 20 Oct 2020 11:58
Last Modified: 08 Apr 2024 09:20
Cite in APA 7: Yao, L. (2020). Developing New High-Order Sequential Simulation Methods Based on Learning-Oriented Kernels [Ph.D. thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5342/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item