Back to news and insights
Article

Data Analytics: A Secret Weapon in Complex Arbitrations

March 16, 2026

As featured in Décideurs Juridiques — available below in English and French.


Data analysis is often the difference between a successful outcome and a missed opportunity in high-value and complex international arbitrations. For the disputing parties, it can reveal hidden fact patterns that even the most experienced legal teams might overlook. For the arbitral tribunal, it makes their decisions more informed. In any event, it is crucial for an expert to balance the narrative argued by its client (party to the arbitration) and its role to provide objective and forensically sound analyses to the arbitral tribunal.

Data requires comprehensive collection, cleaning, and quality assessments that include completeness checks. A thorough scoping of the relevant data (e.g., geographies, business units, period of time), storage requirements, and technical specificities are necessary to formulate precise data requests that ensure all relevant information is captured accurately. This will in turn allow for the use of data analysis to strengthen contractual claims in arbitration matters.

One of the main challenges, however, is that legal counsel often realize late in the proceedings that they do not have the right capabilities and skill to leverage the collected data. By that time, it is often too late in the proceedings or too complex to adjust any prior data requests or formulate new ones. Legal counsel therefore runs the risk of missing crucial facts due to incomplete or poor-quality data.

The use of data analytics experts allows you to overcome these challenges and gain efficiencies in the data analysis process.

Two Categories of Data  

While data can take many forms, it is typically divided into two main categories:

  1. Structured data: Data with a predefined, organized format, most often in the form of tables (e.g., spreadsheets), which can be stored and managed in databases (e.g., SQL databases). This is particularly true of a company's accounting or sales data and customer relationship systems. Structured data is usually easy to organize.
  2. Unstructured data: Data that is not in a standardized, predefined format, often textual or multimedia, which requires special tools to analyze. This includes emails, Word, PDF or PowerPoint documents, photos and recordings, etc.

There are various ways in which data analytics can serve as a powerful tool when dealing with both structured and unstructured data, although each data type may require specific analytical approaches.

Different Data Analytics Approaches to Support Arbitrations

a) Making Sense of Disparate Data Sets

One way data analytics can serve as a powerful tool is the linking of disparate data sets from various sources, such as financial records and operational data.

International arbitrations involving long-standing contractual relationships often present significant challenges for counsel and associated experts. Understanding and scoping all the issues at stake, as well as accessing and piecing together the facts of the case, can be a lengthy and complicated process. This becomes even more challenging when the available data is incomplete, of bad quality, or comes from various systems including legacy or obsolete ones.

An example of how these challenges can be overcome is a recent case where FRA assisted a State (respondent) in an ICSID arbitration relating to a concession agreement providing for the installation of gas connections by a private company (claimant). Counsel for the State argued, inter alia, that claimant had overbilled for gas connections that had not been installed. Our data experts, who had not been involved in the data requests or document disclosures, received a batch of 400k structured and unstructured documents in multiple languages.  

The challenge was to (i) assess the extent to which the voluminous and disparate data sets provided were congruent to the terms and conditions of the concession agreement, and (ii) whether there were any data gaps or red flags indicating illegal activities.

A comprehensive completeness assessment was not feasible due to procedural time constraints and FRA’s late entry into the proceedings, as we were not involved in the initial data scoping or collection exercises. Nevertheless, we adopted a risk-based and iterative validation approach and performed a targeted completeness check on high-risk areas. This allowed us to identify potential gaps and mitigate the impact of missing initial scoping by focusing on materiality and corroborative evidence.

A targeted sample of documents was then selected for detailed review in Relativity, where our experts reconstructed information across contracts, Excel files, invoices, and supporting contextual documents. This included systematically cross-referencing customer identifiers with invoice patterns and cash-flow cycles, enabling us to piece together coherent workflows despite the fragmented data landscape.

The data analysis revealed that when equating the respondent’s claim with the cash flow, the claimant had invoiced for a significant amount of gas connections which, at the date of the invoice, were not completed. It also revealed that several clients did not exist in the customer database. However, these findings did not support the respondent’s claim because the advance invoice claims were a means to finance the subsequent gas installations.

Ultimately, even though the data sets were disparate, incomplete, spanning over 20 years, and in multiple languages, FRA’s data experts were able to make sense of them in a manner that informed and ultimately challenged the initial position of legal counsel.

b) Using Machine Learning to Extract Structured Data from Unstructured Data

Artificial Intelligence (AI) and Machine Learning (ML) are key transformative tools in the field of data analysis, particularly through their capacity to extract and make sense of structured data from vast amounts of unstructured information. In the context of international arbitration, unstructured data often includes piles of documents that have been amassed over a long period of time such as contracts, legal briefs, emails, financial statements, and transcripts. By leveraging AI and ML techniques, forensic accountants can efficiently organize and analyze this data.

For instance, text classification allows forensic accountants to automatically categorize documents into predefined classes and classify them into categories such as invoices, financial reports, or correspondence. This categorization not only saves time but also ensures that critical documents are readily accessible, facilitating a more streamlined review process.

Named Entity Recognition (NER) is another valuable ML and Natural Language Processing (NLP) tool that forensic accountants leverage to extract key “entities” from unstructured text. NER can identify and classify important elements such as company names, dates, locations, organizations, monetary amounts, and transaction details within documents. The extracted information is essential for creating comprehensive financial analyses and timelines that are critical in arbitration cases. For instance, NER can help track the flow of funds by automatically mapping payors, payees, dates, and amounts across emails, contracts, and invoices; flag suspicious transactions by detecting unusual counterparties, inconsistent descriptions or abrupt changes in amounts or timing; and uncover potential financial discrepancies by highlighting mismatches between stated amounts and recorded payments, revealing gaps in transaction sequences, or identifying duplicate or missing entries across large volumes of documentation.

c) Reduce Quantum Claims  

Another way data analytics serve international arbitration proceedings is the analysis of quantum claims that have sprung out of long-term litigious contracts.

FRA has supported a defendant, signatory to a long-term contract, in which the opposing party claimed that the defendant failed to provide the agreed upon amount of product under the contract. The data provided were comprised in large and disparate data sets in which voyages, revenues, and expenses covering a decade were documented.

To assess the claim, several data analysis techniques were employed.

  1. First, both the structured and unstructured data were collected and processed to ensure its completeness.  
  2. Second, a temporal analysis of cargoes and revenues over the claim period enabled visualization of the products delivered and revenues generated from the contract.  
  3. Finally, an assessment of the opposing party’s claim model was carried out through tests to verify the allegations.

In the case above, FRA’s data analytics experts were able to reduce the opposing party’s claim from USD 2 billion to USD 100 million.


L’analyse de données (« data analysis ») est souvent la différence entre un résultat favorable et une opportunité manquée dans des arbitrages internationaux complexes et à enjeux élevés. Pour les parties d’un litige, elle peut révéler des éléments factuels cachés que même les équipes juridiques les plus expérimentées pourraient négliger. Pour un tribunal arbitral, elle permet de fonder les décisions sur des éléments mieux informés. Dans tous les cas, au cours d’un arbitrage, il est essentiel pour un expert de trouver l’équilibre entre le récit défendu par son client et son rôle consistant à fournir au tribunal des analyses objectives et fiables.

Les données requièrent en général une collecte exhaustive, un nettoyage rigoureux et des évaluations de qualité qui incluent des tests d’exhaustivité. Une définition précise (i) du périmètre des données pertinentes (par exemple zones géographiques, uni‑ tés opérationnelles, période concernée), (ii) des besoins de stockage et (iii) des spécificités techniques est indispensable pour formuler des demandes de données exactes permettant de capturer toutes les informations nécessaires. Cela permet ensuite d’utiliser l’analyse des données pour rendre les prétentions contractuelles plus pertinentes et convaincantes dans les arbitrages.

En revanche, l’un des principaux défis survient lorsque les conseils juridiques réalisent tardivement qu’ils ne disposent ni des compétences ni des outils nécessaires pour exploiter les données collectées. À ce stade de la procédure, il est souvent trop tard ou trop complexe pour modifier les demandes de données antérieures ou d’en formuler de nouvelles. Les conseils risquent alors de passer à côté d’éléments déterminants en raison de données incomplètes ou de mauvaise qualité.

La data analytics est souvent la différence entre un résultat favorable et une opportunité manquée.

Le recours à des experts en data analytics permet donc de surmonter ces défis et d’améliorer l’efficacité de l’exploitation de données.

Deux catégories de données

En data analytics, les données peuvent être classées de plusieurs façons, mais se divisent généralement en deux grandes catégories :

Données structurées : données dotées d’un format prédéfini et d’une organisation claire, le plus souvent sous forme de tableaux (par exemple, fichier Excel), pouvant être stockées dans des bases de données (comme des bases SQL). Cela concerne notamment les données comptables, commerciales ou issues des systèmes de gestion des clients ou fournisseurs. Les données structurées sont généralement faciles à analyser.

Données non structurées : informations dépourvues de format standardisé, souvent textuelles ou multimédias, et nécessitant des outils spécialisés pour être analysées. Cela inclut les e‑mails, documents Word, PDF ou PowerPoint, photos, enregistrements, etc.

La data analytics peut jouer un rôle essentiel avec ces deux types de données, même si chacun peut nécessiter des approches spécifiques selon les circonstances du dossier.

Différentes approches d’analyse de données pour soutenir les arbitrages

a) Donner du sens aux données disparates

Une façon puissante d’employer la data analytics consiste à relier des ensembles de données hétérogènes provenant de sources diverses, comme des enregistrements financiers et des données opérationnelles.

Les arbitrages impliquant des relations contractuelles de longue durée posent souvent des défis importants aux conseils et aux experts. Comprendre et définir précisément les enjeux, accéder aux données et reconstituer les faits peut être un processus long et complexe. La difficulté est accrue lorsque les données disponibles sont incomplètes, de mauvaise qualité ou issues de systèmes anciens ou obsolètes. Un exemple illustratif est un dossier récent dans lequel FRA a assisté un État (défendeur) dans un arbitrage CIRDI relatif à un contrat de concession portant sur l’installation de raccordements au gaz par une société privée (demanderesse). Les conseils de l’État faisaient valoir notamment que la demanderesse avait surfacturé des raccordements qui n’avaient pas été installés. Nos experts, qui n’avaient pas participé aux demandes initiales de données ni aux productions de documents, ont reçu un corpus de 400000 documents structurés et non structurés, dans plusieurs langues. Le défi consistait à (i) évaluer dans quelle me‑ sure ces données volumineuses et disparates étaient cohérentes avec les termes du contrat de concession, et (ii) déterminer l’existence de lacunes ou d’anomalies pouvant révéler des activités illicites.

Une analyse exhaustive de complétude n’était pas possible en raison des contraintes procédurales et de l’arrivée tardive de FRA dans la procédure. Nos experts ont néanmoins adopté une approche de validation itérative et fondée sur les risques, et ont réalisé une vérification ci‑ blée de complétude dans les zones les plus sensibles. Cela nous a permis d’identifier des lacunes potentielles et de réduire l’impact de l’absence d’analyse initiale de périmètre en nous concentrant sur la matérialité et sur des éléments corroborants.

Un échantillon ciblé de documents a en‑ suite été examiné en détail dans Relativity, où nos experts ont reconstitué des informations croisées entre contrats, fichiers Excel, factures et documents contextuels. Cela incluait la vérification systématique des identifiants clients, des schémas de facturation et des cycles de trésorerie, ce qui a permis de reconstituer des chaînes logiques malgré la fragmentation des données.

L’analyse des données a révélé qu’en rapprochant la demande du défendeur avec les flux de trésorerie, la demanderesse avait facturé un nombre significatif de raccordements qui, à la date de facturation, n’étaient pas encore réalisés. Elle a aussi révélé que plusieurs clients n’existaient pas dans la base clients. Toutefois, ces constats ne corroboraient pas la thèse du défendeur, car les facturations anticipées servaient à financer les installations ultérieures.

Même si les données étaient disparates, incomplètes, couvrant plus de vingt ans et rédigées dans plusieurs langues, les experts de FRA ont pu en extraire un sens permettant de préciser et parfois de remettre en question la position juridique initiale de notre client.

b) Réduire les demandes de quantum

La data analytics peut également être utile dans l’évaluation des demandes de quantum issues de contrats long terme litigieux.

FRA a assisté un défendeur, partie à un contrat de longue durée, dans un dossier où la partie adverse prétendait que le défendeur n’avait pas livré les volumes de produits contractuellement prévus. Les données fournies étaient vo‑ lumineuses et disparates, documentant voyages, revenus et dépenses sur une décennie.

Pour analyser la demande, plusieurs techniques ont été employées :

  • collecte et traitement des données structurées et non structurées pour vérifier leur complétude ;
  • analyse temporelle des cargaisons et revenus sur la période de réclamation pour visualiser les livraisons et les revenus; et
  • évaluation du modèle de réclamation de la partie adverse grâce à des tests de cohérence.

Dans ce dossier, les analyses de FRA ont pu réduire la demande de la partie adverse de 2 milliards USD à 100 millions USD.

LES POINTS CLÉS

  • Les données structurées – par exemple les registres financiers ou commerciaux – se prêtent à une analyse plus directe que les données non structurées, comme les courriels, qui requièrent des outils spécialisés pour être exploitées.
  • L’analyse de données peut aider les parties et les tribunaux à accéder à des éléments factuels qui pourraient être négligés, fournissant ainsi une base pour des décisions éclairées.
  • En analysant des données volumineuses et disparates sur de longues périodes, les experts peuvent tester la cohérence des prétentions des parties et réduire considérablement les montants contestés.
No items found.
Article

Safeguarding Corporate Integrity in the Age of Generative AI

March 16, 2026
News

Lexology Index Client Choice 2026: FRA Senior Leaders Recognized

February 3, 2026
News

Crypto Investigations Director Meredith Fitzpatrick Promoted to Partnership

January 14, 2026
News

Q&A with FRA Partner Charlie Patrick and Lexology Index

January 14, 2026