Chi vede e cosa vede: rilevamento della piattaforma di sorveglianza di Palantir

 

Palantir è tra le società di sorveglianza più riservate e poco studiate a livello globale. L’azienda fornisce soluzioni informatiche per l’integrazione e il tracciamento dei dati a polizia e agenzie governative, organizzazioni umanitarie e aziende. Per chiarire e conoscere meglio le pratiche di sorveglianza opaca di Palantir, iniziamo delineando la storia aziendale e la rete contrattuale di Palantir, seguiti da una spiegazione dei termini chiave associati all’area tecnologica di Palantir e da una descrizione dell’ecosistema della piattaforma dell’azienda. Riassumiamo quindi gli attuali studi sul ruolo continuativo di Palantir nelle operazioni di polizia, intelligence e sicurezza. Il nostro contributo e la nostra analisi principali sono una modellazione tematica computazionale dei brevetti di sorveglianza di Palantir (n  = 155), compresi i loro argomenti e temi. Concludiamo discutendo il concetto di infrastruttura per comprendere Palantir come piattaforma di sorveglianza, dove teorizziamo standard informativi come i metadati amministrativi come fenomeni per strutturare i mondi sociali dentro e attraverso l’accesso alle informazioni digitali.

Palantir è tra le società di sorveglianza più riservate e poco studiate a livello globale (Harris 2017 ). L’azienda fornisce soluzioni informatiche (IT) per l’integrazione e il tracciamento dei dati a polizia e agenzie governative, organizzazioni umanitarie e aziende. Una manciata di studi qualitativi hanno esaminato l’uso della piattaforma Palantir nelle operazioni sul campo di polizia attraverso etnografie (Brayne 2017 , 2020 ), casi di studio giuridici (Ferguson 2017 ) e analisi critiche e retoriche di marketing, rapporti e letteratura rivolta al pubblico relativi a Palantir che descrivono i prodotti e i servizi software di Palantir (Knight and Gekker 2020 ; Munn  2017 , 2019 ). Sebbene questi studi qualitativi siano preziosi per offrire spunti interpretativi unici su Palantir, così come lo sono le descrizioni speculative delle capacità di sorveglianza di Palantir nei resoconti della stampa, molta meno attenzione si è concentrata sulle potenziali opportunità offerte dalle analisi quantitative su larga scala delle pubblicazioni di Palantir e sui modi in cui Palantir pianifica, immagina e parla delle sue capacità di sorveglianza all’interno dei documenti primari che pubblica.

https://www.asterios.it/catalogo/il-capitale-sorvegliante

Per chiarire e conoscere meglio le pratiche di sorveglianza opaca di Palantir, iniziamo delineando la storia aziendale e la rete contrattuale di Palantir, seguiti da una spiegazione dei termini chiave associati all’area tecnologica di Palantir e da una descrizione dell’ecosistema della piattaforma dell’azienda. Riassumiamo quindi gli attuali studi sul ruolo continuativo di Palantir nelle operazioni di polizia, intelligence e sicurezza. Il nostro contributo e la nostra analisi principale riguardano la modellizzazione tematica computazionale (Abood e Feltenberger 2018 ; Choi e Canzone 2018 ; Hu, Fang e Liang 2014 ; Venugopalan e Rai 2015 ; Yun e Geum 2020 ) dei brevetti di sorveglianza di Palantir, compresi i loro argomenti e temi. Questo approccio segue la letteratura recente che utilizza i brevetti come dati primari per la ricerca sulle capacità tecnologiche documentate delle società di media e delle aziende IT opache (Bucher 2020 ; Cochoy e Soutjis 2020 ; Delfanti e Frey 2020 ; Jethani 2020 ; Owen 2018 ; Parisi 2019 ; Shapiro 2020 ; Tini 2020 ).

Concludiamo discutendo il concetto di infrastruttura (Bowker et al. 2010 ; Bowker e Stella 2000 ; Karasti e Blomberg 2018 ; Dantec e Di Salvo 2013 ) per comprendere Palantir come una piattaforma di sorveglianza, dove teorizziamo standard informativi per es. i metadati amministrativi come fenomeni per strutturare mondi sociali dentro e attraverso l’accesso alle informazioni digitali.

Palantir è un’organizzazione controversa, secondo diversi rapporti. Negli ultimi anni la stampa ha documentato i collegamenti di Palantir con le operazioni di sorveglianza della National Security Agency (NSA) degli Stati Uniti attraverso le rivelazioni di Edward Snowden (Biddle 2017 ). Secondo Amnesty International, Palantir è stata accusata di violazioni dei diritti umani “prendendo di mira genitori e tutori di minori migranti non accompagnati” (Bell e Kleinman 2020 ). Altri hanno rimproverato gli approcci non etici di Palantir e le conseguenti carenze nella condotta aziendale responsabile (Posner 2019 ). Tuttavia, Palantir ha recentemente ricevuto una valutazione di 20 miliardi di dollari (Sen et al. 2020 ) ed esistono solo pochi studi accademici sulle aspirazioni organizzative e sulle capacità di sorveglianza dell’azienda (Brayne 2017, 2020; Ferguson 2017 ; Cavaliere e Gekker 2020 ; Munn2017 ,2019 ). In questo articolo, contribuiamo a questa borsa di studio fornendo una documentazione di prima mano dei contratti e della piattaforma di sorveglianza di Palantir, supportata dall’analisi computazionale dei suoi brevetti pubblicati, offrendo così informazioni su come Palantir documenta le sue ampie capacità di sorveglianza. Ci basiamo sugli studi classici di economia politica delle informazioni personali e delle attività di sorveglianza dei dati delle imprese commerciali (Agre 1997 ; Andrejevic 2007 ; Clarke 1994 ; Gandy 1993 ) con lavori contemporanei nel campo degli studi sulla sorveglianza, sulle infrastrutture e sulle piattaforme (Monahan e Murakami Wood 2018 ; Plantin et al. 2018 ), concettualizzando Palantir come una piattaforma di sorveglianza che diverse agenzie assumono per documentare, tracciare e controllare i dati sulle persone.


Che sorpresa! Il governo britannico affida la gestione dei dati dei pazienti del servizio sanitario nazionale alla Palantir, società di spyware statunitense collegata alla CIA


Informazioni su Palantir

Palantir (il nome deriva dalle pietre vedenti simili a sfere di cristallo del Signore degli Anelli, che potevano essere usate per comunicare e conoscere il passato e il futuro) è stata fondata nel 2003 da Peter Thiel, Nathan Gettings, Joe Lonsdale, Stephen Cohen e Alex Karp. Inizialmente con sede a Palo Alto, in California, la sede centrale dell’azienda è stata poi trasferita a Denver, in Colorado. Nei suoi primi anni, Palantir ha ricevuto finanziamenti iniziali dal braccio di venture capital della Central Intelligence Agency (CIA) degli Stati Uniti, In-Q-Tel. Nel 2020, la società ha debuttato alla Borsa di New York (NYSE) con il ticker PLTR tramite una quotazione diretta, ponendo fine a una serie di 16 anni di partecipazioni private e segreto finanziario (Gregg e MacMillan 2020 ). Tra i clienti più noti di Palantir figurano i dipartimenti di polizia statunitensi accusati di utilizzare le tecnologie di polizia predittiva e di riconoscimento facciale di Palantir per la profilazione razziale (Hvistendahl 2021 ) e agenzie di sicurezza statunitensi come il Federal Bureau of Investigation (FBI) e l’Immigration and Customs Enforcement (ICE), i cui rapporti affermano che Palantir assiste nel tracciamento digitale degli immigrati privi di documenti, compresi i bambini, per la deportazione. Ad esempio, un raid sul posto di lavoro di 680 lavoratori migranti nel Mississippi il 7 agosto 2019 è stato “effettuato dall’unità dell’ICE che utilizza il software Palantir per indagare su potenziali obiettivi e raccogliere prove contro di loro” (MacMillan e Dwoskin 2019). Inoltre, si dice che Palantir abbia avuto, già nel 2012, un “ruolo in un sistema doganale di vasta portata”, a seguito dei documenti di formazione della US Customs and Border Protection ottenuti dall’Electronic Privacy Information Center (Woodman 2016 ).

Oltre alle agenzie di polizia e di sicurezza statunitensi, i clienti di Palantir includono società finanziarie come JPMorgan Chase (Waldman, Chapman e Robertson 2018 ) e organizzazioni umanitarie come il Programma alimentare mondiale (WFP), il ramo di assistenza alimentare delle Nazioni Unite, che Palantir ha assistito nella distribuzione di forniture alimentari durante la pandemia di COVID-19 (Parker 2019 ). Il WFP ha ricevuto critiche per la sua collaborazione con Palantir; infatti, diversi partner della Palantir hanno anche affrontato campagne di pressione pubblica per dissociarsi dalla società a causa delle controverse attività di sorveglianza della società legate alla polizia e all’immigrazione (Sherman 2020 ). Il WFP alla fine ha chiarito che la sua partnership non includerebbe la fornitura di dati a Palantir e che nemmeno Palantir avrebbe fornito dati al WFP (Porcari 2019 ). Allo stesso modo Palantir ha dovuto affrontare resistenze da parte dei suoi dipendenti, che vanno dalle petizioni alle dimissioni per il suo lavoro con l’ICE (Chafkin 2021 ). Come il Dipartimento di Polizia di New York (NYPD), altre organizzazioni hanno dovuto affrontare problemi nel tentativo di proteggere i propri dati analitici dopo aver terminato i contratti con Palantir (Alden 2017 ; Irani e Whitney 2020 ). Palantir è anche litigiosa e contraddittoria con i propri clienti; nel 2016, l’azienda ha vinto una causa contro il suo cliente, il Pentagono, per un lucroso contratto militare del valore di 206 milioni di dollari (Davenport 2016 ).

Palantir vuole che il suo software diventi lo strumento di sorveglianza principale delle forze dell’ordine statunitensi e delle agenzie di sicurezza governative. Nella dichiarazione di registrazione di Palantir presso la Securities and Exchange Commission (SEC) degli Stati Uniti, la società ha dichiarato che il suo obiettivo era quello di “diventare il sistema operativo predefinito per i dati in tutto il governo degli Stati Uniti” (Palantir 2020a , 7), aggiungendo che le sue tecnologie sono impiegate “in 36 settori e in più di 150 paesi” (2). Questi obiettivi sono criticati da alcuni nel governo degli Stati Uniti, tra cui la rappresentante del 14° distretto congressuale di New York, Alexandria Ocasio-Cortez, che ha chiesto alla SEC di indagare su Palantir prima del suo debutto al NYSE per segretezza e violazioni dei diritti umani (Hatmaker 2020 ). Nonostante l’esitazione di alcuni legislatori statunitensi, solo nel governo degli Stati Uniti, la nostra ricerca del Federal Procurement Data System ha rivelato 940 contratti Palantir con varie entità di intelligence e sicurezza per un totale di 470 pagine e oltre 1,5 miliardi di dollari dal 2007 al 2021, inclusi 123 contratti con il FBI (76 milioni di dollari), 90 con lo Special Operations Command (305 milioni di dollari) e 81 con l’ICE (172 milioni di dollari), tra gli altri in tutto il governo degli Stati Uniti. I contratti riguardano prodotti e servizi di sorveglianza relativi a reti digitali, hardware/software, telecomunicazioni, strategia e architettura IT, trasmissioni e sviluppo di sistemi per l’intelligence e la sicurezza. Un elenco di questi contratti Palantir con enti governativi statunitensi è disponibile nelle nostre appendici e le copie sono disponibili nel nostro deposito dati. Il gruppo di attivisti politici Latinx Mijente (2019 ) (mijente.net) ha esaminato per la prima volta questi contratti e ha fornito una panoramica politico-economica del supporto tecnologico di Palantir all’ICE in un rapporto intitolato The War Against Immigrants: Trump’s Tech Tools Powered by Palantir .

Come accennato in precedenza, gli strumenti di integrazione dei dati di Palantir per i governi federali non si limitano al controllo delle frontiere. I servizi sanitari, i sistemi di approvvigionamento e le organizzazioni per la sicurezza alimentare e farmaceutica utilizzano la piattaforma di sorveglianza dell’azienda, sebbene la maggior parte dei contratti e delle partnership di Palantir, soprattutto nella sua storia iniziale, siano stati con organizzazioni coinvolte nella sicurezza, nell’intelligence e nella difesa. Palantir ha recentemente vinto o rinnovato diversi contratti federali statunitensi con i Centri per il controllo e la prevenzione delle malattie (CDC) e la Food and Drug Administration (FDA) per il monitoraggio dei dati COVID-19, la valutazione dei farmaci e il monitoraggio delle catene di approvvigionamento di materiali come disinfettanti e vaccini. Si dice che queste attività abbiano aumentato il prezzo delle sue azioni (ad esempio, O’Donnell 2020 ). L’elenco dei clienti di Palantir è recentemente cresciuto fino a includere il Servizio Sanitario Nazionale (NHS) del Regno Unito, e l’azienda continua ad espandersi a livello globale (Balakrishnan et al. 2020 ), tra gli altri, attraverso contratti rinnovati con la Royal Navy del Regno Unito (Gordon 2021a ). Questa crescita avviene nonostante le campagne pubbliche come “No Palantir in Our NHS”, che cercano di porre fine alla partnership di Palantir con il governo britannico (Shead 2021 ). Come la pressione pubblica diretta al WFP, tali campagne si basano in parte su rapporti sul lavoro della Palantir nel campo della polizia e dell’immigrazione, su rare interviste con la leadership aziendale (Steinberger 2020 ) e documenti trapelati su come il software Palantir “ha contribuito a espandere e accelerare la rete di spionaggio globale della NSA” contribuendo a “uno degli strumenti più espansivi e potenzialmente intrusivi nell’arsenale della NSA” (Biddle 2017 ).

La clientela di Palantir comprende anche servizi di pubblica utilità e multinazionali. Nella prima metà del 2021, Palantir ha emesso regolarmente comunicati stampa tramite Business Wire per annunciare contratti con la Pacific Gas and Electric Company della California per la sorveglianza elettronica e la gestione delle risorse; la più grande società di media dell’America Latina, Grupo Globo, per l’integrazione dei dati nelle sue operazioni digitali; una delle aziende IT più importanti del Giappone, Fujitsu Limited, per l’integrazione di set di dati in ambienti di dati sensibili; la compagnia britannica di petrolio e gas, BP, per la ricerca e l’estrazione di giacimenti petroliferi; e una delle più grandi società minerarie del mondo, Rio Tinto, per l’integrazione di dati grezzi provenienti da più fonti. L’azienda ha recentemente iniziato a supportare startup che spaziano dalla “sanità alla robotica, al software e al fintech” (Gordon 2021b ). I documenti depositati dalla Palantir presso la SEC descrivono l’espansione della sua attività dal 2008 al 2019 in numerose entità governative e commerciali, inclusi mercati di capitali, compagnie aeree e conglomerati industriali (Palantir 2020a , 161). Questi contratti e comunicati stampa mostrano un quadro a livello macro di un’azienda coinvolta nella produzione di software di integrazione e visualizzazione dei dati per consentire ai clienti di modellare e sorvegliare i propri dati, come se Palantir aspirasse a essere un Google per le organizzazioni che apprezzano la segretezza (Harris 2017 ) – le due società sono state infatti descritte come “due facce della stessa medaglia” (Oremus 2020 ), anche se alcuni mettono in dubbio il valore finale di Palantir e la capacità di scalare fino a raggiungere aziende del calibro di Google (Weinberger 2020 ).

Metadati, ontologie e tecnologie semantiche

I clienti utilizzano la piattaforma di sorveglianza di Palantir per triangolare i dati per produrre “conoscenza” e “prevedere” eventi, e tali processi sfruttano i metadati, le ontologie e le tecnologie semantiche della scienza dell’informazione. I “metadati” sono “dati sui dati” (Zeng e Qin 2016 ) e consentono a persone e macchine di aggiungere contesto ai dati primari, inclusi timestamp, geolocalizzazione e paternità. Le tracce di dati digitali prodotte dalle macchine spesso contengono metadati e gli studiosi hanno a lungo descritto l’ampia varietà di usi dei metadati (Baca 2016 ; Iliadis et al. 2021 ), che includono l’etichettatura di oggetti unici (ad esempio, persone, luoghi, cose), proprietà (ad esempio, colori, altezza, peso) e le loro relazioni (ad esempio, familiare, organizzativo, fisico), il tutto per scopi diversi (ad esempio, descrittivo, strutturali, amministrative). I metadati possono anche collegare diversi tipi di dati (ad esempio formati, posizioni, domini), producendo così un ponte tra altri due o più punti dati.

I metadati sono quindi utili per identificare tracce digitali e collegare dati ampiamente divergenti che altrimenti sarebbero rimasti non interoperabili (Fidler e Acker 2017 ; Mayernik e Acker 2018 ). La standardizzazione di questi metadati per tali scopi di collegamento in progetti più ampi richiede ciò che la scienza dell’informazione conosce come “ontologia”, ovvero un insieme altamente regolamentato di regole formali di metadati, termini, valori e relazioni con cui diversi gruppi di persone o macchine possono serializzare, etichettare e modellare i loro dati (Pomerantz 2015 ). Lo scopo di un’ontologia è mantenere la coerenza dei metadati nel tempo e tra utenti (o organizzazioni), garantendo così che dati divergenti possano essere coerenti durante la navigazione e il consumo. Le ontologie realizzate dai metadati vengono istanziate (serializzate e visualizzate) in parti di codice e software (ad esempio, in sintassi standardizzate, dashboard, pagine di analisi) e queste parti di codice/software sono tipicamente note come “tecnologie semantiche” che servono agli utenti per curare, sfogliare, condividere e perfezionare ulteriormente le proprie attività di organizzazione dei dati (Fürber 2016 ).

Secondo i ricercatori interni delle società Internet, tali tecnologie organizzative sono impiegate nel backend da aziende come Google, Microsoft, Amazon e Facebook per assistere nell’etichettatura e nella modellazione delle loro vaste e diversificate quantità di archivi di dati (ad esempio, dati sui loro utenti e prodotti) e questo presumibilmente consente loro di ricavare “conoscenza” dai loro dati triangolati (vedi Noy et al. 2019 per un articolo sui “grafici della conoscenza” di cui sono coautori dipendenti di Google, Microsoft e Facebook, tra gli altri). Le tecnologie semantiche svolgono anche un ruolo chiave dietro le quinte nei media algoritmici e fungono da sistemi di supporto organizzativo per gli algoritmi che forniscono contenuti. Secondo i ricercatori di Google, gli algoritmi sono solo una piccola parte delle operazioni di un complesso sistema multimediale digitale e sono supportati da infrastrutture digitali che devono essere rifattorizzate (aggiornate e mantenute), comprese tecniche per modellare, interrogare e gestire le grandi quantità di dati che sono prodotti dal machine learning. Un eccessivo affidamento su sistemi di apprendimento automatico “efficienti” può quindi inviare un “onere” di costi finanziari e tecnici “a valle” quando non vengono considerati accanto alle modifiche potenzialmente necessarie dei relativi software di organizzazione dei dati come metadati, ontologie e tecnologie semantiche. Questo onere a valle nei sistemi software è tradizionalmente denominato debito tecnico (Cunningham 1992 ; Marrone et al. 2010 ; Marinaio e Guo 2011 ; Kruchten, Nord e Ozkaya 2012 ; Tom, Aurum e Vidgen 2013 ), vale a dire i costi finanziari e tecnici aggiuntivi che si sostengono quando una tecnologia (ad esempio, l’apprendimento automatico) viene impiegata frettolosamente a causa di un’efficienza percepita senza considerare i suoi effetti sulla connessione di tecnologie e infrastrutture (ad esempio, tecnologie semantiche). Pertanto, può esserci una grande quantità di debito tecnico nascosto nei sistemi di apprendimento automatico di grandi aziende e organizzazioni (Bender et al.2021 ; Sculley et al.2015 ). La figura 1 rappresenta una quantità relativamente piccola di codice algoritmico (la scatola nera al centro) e della necessaria infrastruttura digitale circostante per tali sistemi su larga scala, tra cui si trovano diverse aree in cui metadati, ontologie e tecnologie semantiche per la modellazione e il tracciamento le quali giocano un ruolo chiave, compresa l’analisi e la gestione dei dati. Tutto ciò per dire che Palantir è specializzata in settori in cui la modellazione dei dati di background e l’integrazione tra diversi set di dati e organizzazioni sono aree chiave di interesse.

Figura 1. Debito tecnico nascosto nei sistemi di apprendimento automatico (Sculley et al.2015 ).

Figura 1. Debito tecnico nascosto nei sistemi di apprendimento automatico (Sculley et al. Citation2015).

Tali tecnologie per l’etichettatura, l’organizzazione e il tracciamento dei dati sono un’estensione dei primi sistemi di ingegneria ontologica e di rappresentazione della conoscenza (Abbas 2010 ; Glushko 2013 ; Kejriwal, Knoblock e Szekely 2021 ; Kendall e McGuiness 2019 ; McComb 2004 ) e hanno anche una storia lunga e complessa legata agli standard dei metadati web, alle infrastrutture e ai sistemi di governance (DeNardis 2014 ; Domingue, Dieter e Hendler 2011 ) a partire dall’iniziativa del web semantico dell’inventore del web Sir Tim Berners-Lee e dal World Wide Web Consortium (W3C), una delle principali organizzazioni internazionali di standardizzazione del web (Berners-Lee 1999 ; Berners-Lee, Hendler e Lassila 2001 ) sviluppando risorse del web semantico. Laddove Berners-Lee originariamente immaginava che il web semantico e il W3C offrissero trasparenza e interoperabilità per i dati attraverso un web aperto, democratico e decentralizzato, oggi tali strumenti vengono utilizzati o imitati per scopi proprietari dalle grandi società Internet (Hitzler 2021 ) e nella gestione dei dati aziendali più in generale, invertendo così la proposta originale del web semantico. Invece di una rete aperta, ciò che probabilmente ne è risultato è una rete chiusa e fratturata che consiste sempre più in strumenti di modellazione proprietari (invece che aperti e pubblici), piattaforme chiuse e giardini recintati (Zittrain 2008 ).

Si dice che Palantir utilizzi queste e le relative tecnologie di modellazione dei dati per la sorveglianza e il processo decisionale preventivo; per inserirlo in Agre (1994 ), che criticava la propensione dei ricercatori sull’intelligenza artificiale, è “esplicitamente alla ricerca di sistemi ontologici che consentano a un computer di rappresentare in modo pulito e accurato un’ampia gamma di conoscenze umane, comprese… le attività umane e le organizzazioni sociali” (108). Seguendo quello di Gandy (1989 ) analisi classica, consideriamo tale sorveglianza come “diretta a prevenire o evitare perdite o lesioni, piuttosto che a individuare crimini che si sono già verificati” (64). Palantir vuole che i suoi sistemi estraggano “conoscenza” e “prevedano” eventi riguardanti le persone (Robertson et al. 2017 ); vi è quindi la necessità di sapere di più su come Palantir descrive queste capacità di prelazione, o cosa Massumi (2015 ) si riferisce a una logica operativa del potere “che combina un’ontologia con un’epistemologia in modo tale da delinearsi come una tendenza autopropulsiva” (5). Amore (2009 ) fornisce una prima analisi di tali tecnologie predittive e, in ultima analisi, speculative nel contesto della “guerra al terrorismo” statunitense post-11 settembre, che sono variamente descritte come “linee di vista preventive… che visualizzano futuri sconosciuti” (17), la “visualizzazione preventiva di una persona sconosciuta” e “processo decisionale preventivo” (22). Seguendo Amoore (2009 ), il nostro articolo analizza le tecnologie Palantir che prendono di mira persone sconosciute “una questione sia di posizionamento nel mirino (puntare e identificare) sia di visualizzare attraverso una linea di vista proiettata (anticipare, rendere attuabile)” (24). Il presente studio rivolge inoltre lo sguardo preventivo su Palantir e cerca di visualizzare le sue opportunità tecnologiche attraverso l’analisi dei brevetti e l’estrazione di argomenti. Seguiamo quindi contemporaneamente le recenti richieste di dati critici e studi su Internet (Acker e Donovan 2019 ; Iliadis e Russo 2016 ) e ricerche investigative empiriche su aziende IT (Carter, Acker e Sholler 2021 ) per comprendere le piattaforme di sorveglianza come Palantir, che consideriamo complementari ma distinte dalla sorveglianza delle piattaforme delle società di social media (Murakami Wood e Monahan 2019 ; Turow e Couldry 2018 ). Il nostro articolo vede Palantir come una piattaforma di sorveglianza in cui l’obiettivo principale sono i servizi di sorveglianza e l’analisi decisionale preventiva per facilitare il tracciamento di persone e cose sia all’interno che all’esterno degli Stati Uniti. Come materia (2018 ) identifica in una discussione sul confine degli Stati Uniti, “l’incapacità di vedere ed essere visti è centrale nella crisi politica americana”. Palantir gioca quindi un ruolo sempre più centrale in queste politiche di visualizzazione.

La piattaforma di sorveglianza di Palantir

La stampa precedentemente citata descrive spesso Palantir come fornitore di servizi di raccolta e integrazione dei dati a supporto dell’analisi delle decisioni preventive. Tuttavia, tali rapporti raramente forniscono dettagli di prima mano o provenienti da fonti primarie su come dovrebbe funzionare la tecnologia. Comunemente, descrivono Palantir come un modo per collegare oggetti digitali in diversi database. L’azienda offre questo collegamento dati-oggetto come una sorta di “Software as a Service” (SaaS), affittandosi agli acquirenti che necessitano di assistenza per l’integrazione di dati provenienti da fonti eterogenee (ad esempio, i silos di dati potrebbero includere un database di rapporti di arresto, un altro database delle ricevute delle carte di credito), posizionandosi così come fornitore di servizi della piattaforma.

Tuttavia, sembra che Palantir non sia SaaS in senso stretto. L’azienda spesso invia quelli che definisce “ingegneri software avanzati” (Rocha 2019 ) ai propri clienti e agli apparecchi on-premise. Questi ingegneri in servizio sviluppano software personalizzato “on-premise” e assistono nell’integrazione dei dati, pratiche che in qualche modo elidono l’etichetta SaaS grazie alle competenze ingegneristiche integrate sul posto. Tuttavia Palantir si propone anche come “Data as a Service” (Gordon 2021c ), mantenendo la propria immagine prettamente di “servizio digitale” nonostante la presenza fisica del personale che può gestire brevemente i prodotti e l’orchestrazione dei dati per i clienti dopo la vendita. Seguendo l’Occidente (2019 ) sui nuovi servizi di sorveglianza offerti da Amazon, riteniamo che un termine più accurato sarebbe “Surveillance as a Service” a causa dei contratti, dei comunicati stampa e (come vedremo) dei brevetti di Palantir. Questi ingegneri in servizio offrono ai ricercatori dei media e della comunicazione l’opportunità di studiare le dimensioni organizzative, interpersonali e di piccolo gruppo dei dipendenti della sorveglianza, anche attraverso le linee di ricerca Gates e Magnet (2007 ) che descrivono nella loro introduzione al numero speciale “Surveillance and Communication” di The Communication Review, gli approcci critici alla tecnologia della comunicazione descritti in Bakardjieva e Gehl (2017 ) e Gehl (2015 ) sugli ingegneri dei dati.

Secondo il materiale scritto dai suoi ingegneri interni, Palantir promuove pubblicamente tre piattaforme: Gotham, Foundry e Apollo, che costituiscono il suo ecosistema di piattaforme di sorveglianza (figura 2). Gotham è la principale interfaccia della piattaforma rivolta al pubblico che i clienti Palantir utilizzano per navigare tra i loro oggetti dati; una precedente descrizione di Gotham, che è stata rimossa dal sito web di Palantir ma rimane recuperabile tramite la Wayback Machine dell’Internet Archive, descrive Gotham come “una suite di applicazioni integrate per l’analisi semantica, temporale, geospaziale e del testo completo da cui gli utenti possono ricavare significato dal patrimonio di dati della loro organizzazione” (Palantir2021a ). Foundry si trova “sopra” Gotham ed è il “SaaS cloud-native con un’architettura a microservizi” (Krishnaswamy, Minor e Fink 2020 ). I clienti Palantir possono sperimentare e testare decisioni preventive basate sui propri dati in un ambiente cloud sicuro per partizionare programmi separati. Apollo è il sistema di distribuzione continua che serve Foundry e Gotham, fornendo aggiornamenti e alimentando il software utilizzato dai clienti di Palantir; è l'”infrastruttura di automazione e distribuzione” per cloud pubblici e privati ​​e hardware on-site (Krishnaswamy, Minor e Fink 2020 ). Queste tre piattaforme sono i prodotti e i servizi principali forniti dall’azienda e rappresentano una visione dell’azienda di meso livello (nella maggior parte di quanto segue, utilizziamo «Palantir» quando ci riferiamo all’azienda e a questa suite di tecnologie che costituiscono la sua piattaforma di sorveglianza ). La figura 3 mostra le immagini delle piattaforme Palantir che abbiamo estratto dal deposito SEC di Palantir (Palantir 2020a , 134–152).

Figura 2. Ecosistema della piattaforma di sorveglianza di Palantir (Krishnaswamy, Minor e Fink 2020 ).

Figura 2. Ecosistema della piattaforma di sorveglianza di Palantir (Krishnaswamy, Minor e Fink Citation2020).

Figura 3. Immagini delle piattaforme Palantir dal deposito SEC di Palantir (Palantir 2020a , 134–152).

Figura 3. Immagini delle piattaforme di Palantir dal deposito SEC di Palantir (Palantir Citation2020a, 134–152).

Palantir utilizza il linguaggio dell'”ontologia” (comunemente presente nella scienza dell’informazione, come discusso sopra) per descrivere i suoi flussi di dati altamente modellati, la rete di dati e l’interoperabilità dei dati su ciascuna piattaforma; ad esempio, il suo sito web attualmente afferma che la tecnologia Palantir offre “uno strato semantico a livello aziendale che traduce efficacemente i dati grezzi in un linguaggio riconoscibile per gli utenti finali” e “fornisce questo strato semantico attraverso il suo modello di dati unico, o ‘ontologia’” (Palantir 2021b ). Mentre Gotham, Foundry e Apollo sono la suite di piattaforme che operano nell’ecosistema Palantir, i dati che vengono etichettati semanticamente con metadati e visualizzati in quell’ecosistema sono descritti da Palantir come una “ontologia dinamica” (Sudo Null 2019 riproduce i contenuti relativi all’ontologia dinamica da un video ormai non disponibile e privato in Palantir 2012 ) di dati rappresentati graficamente con oggetti, proprietà e relazioni personalizzati per ciascun cliente (e almeno in alcuni casi, inizializzati dagli ingegneri software all’avanguardia di Palantir). Questo tipo di livello ontologico (sostanzialmente, costruendo descrizioni tramite metadati “sopra” o “avvolgendo” i dati primari) aggiunge una semantica coesa che aiuta a creare contesto e significato per gli utenti di Palantir, consentendo loro di sfogliare set di dati precedentemente separati dopo che sono diventati ontologicamente triangolati.

Fughe di documenti aziendali descrivono l’ontologia Palantir, compresi quelli della società di sicurezza informatica HBGary. Le e-mail interne di Palantir rilasciate da Wikileaks (2016) con il titolo “The HBGary Emails” fanno riferimento a questa ontologia di Palantir e la società continua a descrivere vagamente l’ontologia sul suo sito web. Le diapositive contenute nelle e-mail di Wikileaks mostrano le presentazioni interne di Palantir che delineano la sua ontologia dinamica e la descrizione di oggetti dati, collegamento dati-oggetto, relazioni, proprietà e origini dati nella modellazione dei metadati (Figura 4). Tali esempi sono la documentazione di fonte primaria più vicina disponibile dell’infrastruttura informativa di livello micro di Palantir, accanto a resoconti e immagini rari e pubblicati della sua interfaccia della piattaforma Gotham di livello meso. Sebbene utile, quest’ultimo ha una portata limitata a domini specifici o non fornisce una comprensione completa di come Palantir stessa descrive tecnicamente e immagina come il suo software verrà utilizzato per l’integrazione dei dati da parte dei clienti di tutti i settori. Cosa, ad esempio, Palantir afferma o immagina che ricoprirà il ruolo di questi oggetti dati, relazioni e proprietà nella modellazione dei metadati? Se il valore del software di sorveglianza di Palantir sta nella modellazione digitale delle entità attraverso un’ontologia, come ha descritto l’azienda stessa questo processo tecnico e a quale scopo? Palantir ha preso le distanze dall’immagine di una società di sorveglianza che aiuta a rintracciare persone come lavoratori e immigrati.

Figura 4. Diapositiva Palantir che descrive il modello di ontologia dinamica (Wikileaks 2016 ).

Figura 4. Diapositiva Palantir che descrive il modello di ontologia dinamica (Wikileaks Citation2016).

Cerchiamo di andare oltre l’offuscamento che Palantir ha favorito riguardo ai suoi obiettivi e di conoscere meglio l’azienda fornendo prove della documentazione interna riguardante le sue capacità tecniche e le pratiche volte alla modellazione dei dati e a facilitare il processo decisionale preventivo per i suoi clienti. Attraverso una modellazione tematica computazionale (Abood e Feltenberger 2018 ; Choi e Canzone 2018 ; Hu, Fang e Liang 2014 ; Venugopalan e Rai 2015 ; Yun e Geum 2020 ) e l’elaborazione del linguaggio naturale dei brevetti Palantir, ci proponiamo di rispondere alle seguenti due domande di ricerca:

RQ1: Dall’inizio delle domande di brevetto di Palantir, quali tipi di argomenti contengono i brevetti e come sono tematicamente correlati e definiti tali argomenti?

RQ2: Cosa ci dicono gli argomenti e i temi relativi ai brevetti di Palantir sulle aspirazioni, le immaginazioni e le capacità tecniche della piattaforma di sorveglianza?

Borsa di studio su Palantir

Gli studiosi hanno analizzato Palantir da prospettive che includono etnografie dei prodotti dell’azienda tecnologica utilizzati nelle operazioni sul campo fino a revisioni critiche delle politiche associate e dei materiali di reporting. Tra i primi studi alla ricerca su Palantir, Brayne (2017 , 2020 ) offre un’etnografia completa dell’uso dell’interfaccia della piattaforma Gotham di Palantir da parte del Dipartimento di Polizia di Los Angeles (LAPD) e rileva che “non c’è praticamente alcuna ricerca pubblica disponibile su Palantir, e le rappresentazioni dei media sono frustrantemente vaghe” (2020, 37). Attraverso interviste e foto, Brayne fornisce un resoconto dettagliato di come Gotham viene utilizzata sul campo dalle agenzie di polizia per indagare, prevedere, sorvegliare e pattugliare il crimine. Secondo le interviste di Brayne agli agenti, la piattaforma Palantir ha aiutato la polizia di Los Angeles a combinare diversi set di dati isolati, consentendo agli agenti di condurre rapidamente query complete. Inoltre, Brayne descrive una dimostrazione di uno degli ingegneri della Palantir inviati per assistere la polizia di Los Angeles. Il dipendente Palantir che avvia lo scenario di ricerca campione per Brayne lo descrive come un esempio di “sorveglianza a strascico” in cui database precedentemente separati (contenenti elementi di dati preesistenti come casellari giudiziari, numeri di licenza, ecc.) vengono collegati, rendendo così più facili le ricerche. Brayne nota inoltre che il sistema di Palantir si trova “sopra” i sistemi della polizia di Los Angeles e che Palantir non possiede i dati e fornisce invece un’interfaccia per il collegamento dati-oggetto.

In un altro lavoro che descrive Palantir e la polizia, Ferguson (2017 ) discute l’ascesa dei big data e offre approfondimenti giuridici da diversi casi di studio nella polizia predittiva. Il lavoro commenta il software di Palantir che integra, analizza e condivide dati provenienti da diverse fonti delle forze dell’ordine. Ferguson descrive l’utilizzo del Palantir da parte del Dipartimento di Polizia di New Orleans (NOPD) dopo aver ricevuto l’approvazione del sindaco di New Orleans per identificare le principali cause di criminalità violenta. Il NOPD si è affidato a Palantir per identificare le relazioni nascoste tra i sistemi di dati legacy e integrare queste informazioni in tutti i settori, compresi i registri della polizia e i dati delle città relativi alle infrastrutture, ai servizi sanitari, ecc. Dopo l’integrazione dei dati, Palantir ha identificato preventivamente circa 3000 individui di New Orleans che erano a rischio di morire di omicidio (Ferguson2017 ). Ferguson rileva inoltre che, sulla base dei set di dati, i servizi di emergenza hanno cercato ulteriori misure preventive; i vigili del fuoco di New Orleans hanno modificato la propria presenza attorno alle scuole, il dipartimento della sanità si è concentrato sulle scuole ad alto rischio, ecc., decisioni che sono state tutte informate dagli stessi dati che Palantir ha integrato da diversi sistemi di dati legacy a livello cittadino.

Altri studiosi dei media hanno analizzato l’IT di Palantir attraverso metodi critici e retorici. Cavaliere e Gekker (2020 ), facendo eco a Brayne (2020), notano che “i prodotti software dell’azienda hanno ricevuto una critica accademica limitata da una prospettiva sociologica o umanistica” (236) – aggiungiamo che questo è vero anche per quanto riguarda gli studi quantitativi. Cavaliere e Gekker (2020 ) analizzano testualmente un documento politico del governo sul sistema di database relazionale utilizzato dall’ICE per tracciare l’immigrazione federale, mentre Munn (2017 ,2019 ) esamina in modo critico e filosofico la documentazione video delle presentazioni pubbliche di Palantir sull’interfaccia Gotham sull’account YouTube ufficiale dell’azienda (questi video sono attualmente contrassegnati come non disponibili e impostati come privati). Il nostro articolo affronta quindi le preoccupazioni sollevate da Brayne (2020) e Knight e Gekker (2020 ), ulteriormente sottolineato da Munn (2017, 2019), in merito alla mancanza di studi di ricerca investigativa sui prodotti e sui risultati di Palantir, utilizzando la modellazione tematica di un ampio insieme di dati ufficiali Palantir.

Opere concettuali dal punto di vista degli studi di sorveglianza (Lione 2007 ; Monahan e Murakami Wood 2018 ) hanno teorizzato la nozione di polizia predittiva e hanno occasionalmente fatto riferimento a Palantir come un esempio a causa dell’uso della piattaforma di sorveglianza di Palantir da parte della polizia e delle agenzie di sicurezza. Il numero speciale di Surveillance & Society “Platform Surveillance” (Murakami Wood e Monahan 2019 ) contiene diversi documenti che affrontano la polizia predittiva; Cancelli (2019 ) teorizza la polizia come una piattaforma digitale; Wilson (2019 ) concettualizza il modo in cui la polizia tramite piattaforma utilizza i dati per aumentare la flessibilità delle organizzazioni di polizia; Egbert (2019 ) teorizza ulteriormente la polizia predittiva e la piattaforma del lavoro di polizia, e Ritchie (2020 ) esamina la sorveglianza statale passiva e le infrastrutture attive di razzializzazione. Ciascuno degli studi di cui sopra teorizza l’attività di polizia, la sorveglianza e la sicurezza attraverso la lente delle tipologie di tecnologie predittive di Palantir. In effetti, uno dei brevetti che abbiamo trovato nella nostra ricerca sui brevetti di Palantir è intitolato “Crime Risk Forecasting”, che descrive come gli utenti possono “valutare in modo più efficace sia il livello di aumento della minaccia criminale sia la sua potenziale durata… quindi sfruttare le informazioni trasmesse dalle previsioni per adottare un approccio più proattivo nei confronti delle forze dell’ordine” (Robertson et al.2017 ). La Figura 5 contiene un’immagine tratta dal brevetto di Palantir sulla previsione del rischio di criminalità (polizia predittiva) che mostra uno scenario campione di previsione del crimine che include informazioni su un individuo (“PERSONA #1”), il crimine commesso (“PREDIZIONE: FURTO”), una mappa della posizione (“Londra”) e data con l’ora del giorno (“12-06-2014 POMERIGGIO”) e visualizza ulteriori opzioni per ordinare crimini e persone in base all’ora del giorno.

Figura 5. Immagine dal brevetto di polizia predittiva di Palantir (Robertson et al.2017 ).

Figura 5. Immagine dal brevetto di polizia predittiva di Palantir (Robertson et al. Citation2017).

I brevetti come fonte di dati

I brevetti documentano la proprietà intellettuale delle invenzioni e delimitano i diritti dei proprietari o degli inventori di realizzare, utilizzare o vendere un’invenzione. In genere, i brevetti descrivono il contesto, il contenuto e i processi che rendono uniche le invenzioni, come devono essere utilizzate, chi è l’utente previsto o il caso d’uso, lo stato attuale dell’arte e in che modo l’invenzione è particolarmente innovativa. Riconosciamo che i brevetti sono occasionalmente ampi e speculativi e talvolta vengono utilizzati esclusivamente per pubblicizzare il futuro previsto (Liao e Iliadis 2021 ) e procedimenti giudiziari tanto quanto indicano dimostrate innovazioni tecnologiche. Tuttavia, in base alla nostra ricerca, possiamo attestare la profondità, l’ampiezza e il significato dei brevetti depositati da Palantir. La lunghezza media dei brevetti esaminati era di 33 pagine. Ciascuno conteneva tipicamente centinaia di citazioni, spesso dieci o più immagini e dettagli espliciti e perfezionati delle specifiche tecniche. Per esempio, la Figura 6 è una sezione di sintassi di esempio di un tipico brevetto Palantir (Ducott et al.2016 ), compreso il livello di dettaglio che spesso fornisce descrizioni estese delle funzionalità, esempi di codici, scenari applicativi, ecc.

Figura 6. Sezione sintattica di un tipico brevetto Palantir (Ducott et al. 2016 ).

Figura 6. Sezione sintassi di un tipico brevetto Palantir (Ducott et al. Citation2016).

La Figura 6 include una descrizione dei metadati e della sintassi ontologica relativa alla categorizzazione di una “Persona” come un “Dipendente” o un “Appaltatore” per l’analisi incrociata e la replica tra database eterogenei, comprese le informazioni sulle relazioni “genitore” e “figlio”. La Figura 7 fornisce un’altra immagine campione tratta da un brevetto Palantir (Ryan et al. 2017 ) che descrive le visualizzazioni sensibili al contesto in una visualizzazione dell’interfaccia della sua piattaforma di sorveglianza, incluso il modo in cui gli utenti possono interagire con i dati triangolati di Palantir in un’indagine. Il brevetto presenta uno scenario ipotetico che include informazioni su sei persone associate, comprese informazioni identificative su “pagamenti”, “trasferimenti di denaro” e “telefonate” cellulari tra individui, nonché informazioni identificative su “stesso indirizzo” e “stesso volo”, ulteriormente integrato da un lettore, una mappa e una bacheca. Il nostro corpus ha esaminato centinaia di immagini che mostravano serializzazioni e sintassi di Palantir, diagrammi e visualizzazioni della sua piattaforma di sorveglianza su prodotti frontend e infrastrutture backend, nonché rappresentazioni astratte degli esercizi di analisi dei dati di Palantir.

Figura 7. Immagine di esempio che mostra la triangolazione dei dati delle attività delle persone (Ryan et al. 2017 ).

Figura 7. Immagine di esempio che mostra la triangolazione dei dati delle attività delle persone (Ryan et al. Citation2017).

I brevetti vengono spesso introdotti come prova nelle aule di tribunale e nelle controversie sulla proprietà intellettuale, tuttavia riconosciamo che potrebbero non essere isomorfi con le capacità tecniche esistenti delle organizzazioni che li depositano. Intendiamo questi brevetti come il prodotto di come Palantir desidera apparire e che tracciano processi di immaginazione. Tuttavia, esaminando questi brevetti (e consultandoci con due dei nostri colleghi in campo legale), notiamo anche che le informazioni in essi presentate costituiscono una rappresentazione realistica, o almeno una buona approssimazione, delle capacità tecniche di Palantir. Questa conclusione è ulteriormente supportata dalla nostra revisione della lunga storia contrattuale di Palantir con organizzazioni come CIA, NSA, ICE, FBI, CDC, FDA, LAPD, NYPD, NOPD, ecc. a livello nazionale negli Stati Uniti, e con organizzazioni di sorveglianza a livello internazionale, che noi riteniamo che ci sia almeno una prova dell’efficacia della piattaforma di sorveglianza della Palantir. Tale efficacia è corroborata da molti dei rapporti che abbiamo citato sopra riguardanti arresti e sequestri.

I ricercatori utilizzano ampiamente i brevetti come fonti di dati per i loro studi. In effetti, diversi studiosi dei media e della comunicazione hanno utilizzato i brevetti per studiare l’ideazione, lo sviluppo, la progettazione, le capacità tecniche e le proiezioni future di organizzazioni e aziende. Tini (2020 ) analizza come il linguaggio dei brevetti modella le concezioni di razza e status socioeconomico; Bucher (2020 ) utilizza i brevetti per indagare sul feed di notizie di Facebook; Shapiro (2020 ) teorizza le città intelligenti attraverso i brevetti; Cochoy e Soutjis (2020 ) analizzare i brevetti per studiare i display digitali dei prezzi; Delfanti e Frey (2020 ) esplora il futuro del lavoro visto attraverso i brevetti di Amazon; Jethani (2020 ) esamina come i brevetti segnano l’evoluzione dei dispositivi di localizzazione; Parisi (2019 ) discute i brevetti relativi all’aptica e ai videogiochi; Owen (2018 ) analizza la storia delle tutele brevettuali sui medicinali contro l’HIV/AIDS.

I brevetti sono stati inoltre utilizzati come dati per caratterizzare le comunità epistemiche e la produzione di conoscenza. In precedenti ricerche sugli studi scientifici e tecnologici, Coward e Franklin (1989 ) utilizzano i brevetti per studiare il collegamento tra ricerca scientifica e tecnologia industriale; Weiner (1987 ) esamina la brevettazione nella ricerca accademica attraverso casi di studio storici; Packer e Webster (1996 ) discutono della cultura brevettuale nella commercializzazione della scienza universitaria; Mackenzie, Keating e Cambrosio (1990 ) analizzano l’influenza restrittiva della brevettazione sulla ricerca scientifica nel campo delle biotecnologie; Russel (2011) utilizza i brevetti per analizzare la politica degli standard web nel W3C come menzionato sopra. I brevetti sono quindi una ricca risorsa di dati primari e particolarmente utili per uno studio quantitativo approfondito delle aziende IT e di sorveglianza opache. Monitorando i brevetti nel tempo e isolando argomenti e temi ricorrenti nei loro contenuti, i ricercatori possono intenderli come un meccanismo per proiettare le aspirazioni di un’azienda IT e, in alcuni casi, come prova della tecnologia ricercata, approvata, sviluppata, adottata e distribuita.

Metodi

Per questo studio, abbiamo eliminato tutti i brevetti di Palantir che contenevano la parola “ontologia” (al 25 agosto 2020) da Google Patents (un elenco completo di questi brevetti insieme ai loro nomi, autori e date critiche è disponibile nelle appendici online sul sito web di Taylor & Francis). Questo processo ha prodotto un campione mirato (n = 155) di brevetti Palantir, composto da 5197 pagine, oltre 2,5 milioni di parole e oltre 18,5 milioni di caratteri. Abbiamo quindi preparato il set di dati per l’elaborazione eliminando tutti i metadati e le caratteristiche uniche, convertendo i formati, comprimendo e raggruppando i brevetti in un unico documento. Ci siamo consultati con un collega informatico e abbiamo importato diverse librerie Python utilizzate per l’elaborazione dei dati (Pandas, Matplotlib, NumPy e Seaborn). Abbiamo utilizzato Google Collaboratory per assemblare i dati del brevetto, caricati in un formato di paragrafo testuale. È stata quindi eseguita la preelaborazione, inclusa la punteggiatura, il valore nullo, la rimozione delle stop word, la lemmatizzazione, la conversione in minuscolo e la tokenizzazione, risultando in un set di dati preelaborati. È stata eseguita la codifica della parte del discorso (POS) e i token sono stati presi di mira dal POS corrispondente in base al contesto e alla definizione (questo ha prodotto i nomi, i verbi, ecc. più frequenti). Il riconoscimento delle entità denominate è stato eseguito per individuare e classificare le entità nel testo in categorie predefinite come persone, organizzazioni, luoghi, orari, quantità, valori monetari e percentuali. La modellazione degli argomenti è stata eseguita utilizzando un modello bag-of-words e la Latent Dirichlet Allocation (un processo automatizzato che identifica la cooccorrenza di parole in cluster sotto argomenti specializzati senza nome che devono essere determinati dai ricercatori) (Blei, Ng e Jordan 2003 ). Una volta prodotto il corpus finale, abbiamo esaminato i risultati in modo collaborativo e iterativo e interpretato i 20 argomenti modellati dall’output automatizzato, che contenevano le 20 parole più frequenti correlate a ciascun argomento. Abbiamo quindi sviluppato manualmente tre temi generali emersi da questi 20 argomenti. Infine, abbiamo creato in modo collaborativo e iterativo un elenco di parole chiave che eravamo interessati a esplorare (divise in parole chiave sociali, tecniche e con nomi propri). Abbiamo cercato automaticamente le frequenze delle parole prossimali più comuni. Abbiamo quindi rivisto manualmente gli argomenti e le parole chiave, cercando esempi interessanti in frasi di esempio e visualizzazioni che potessimo estrarre per la presentazione. Tutti i dati grezzi e di elaborazione si trovano nel nostro deposito dati e ulteriori materiali supplementari si trovano nelle nostre appendici online.

Analisi

Innanzitutto, tutti i brevetti Palantir nel nostro corpus descrivono, in qualche modo, vari atti di sorveglianza digitale attraverso il tracciamento dei dati e la triangolazione tra i sistemi. Alcuni dei brevetti più interessanti nel nostro set di dati includono titoli che descrivono l’integrazione dei dati, i processi di creazione del contesto, l’entità, la proprietà, l’identificazione delle relazioni e il rilevamento delle minacce. La Tabella n. 1 è un piccolo campione di titoli brevettuali estratti dal nostro corpus.

 

Tabella 1. Elenco campione dei titoli dei brevetti Palantir. Scarica CSVTabella di visualizzazione

 

Insieme ai titoli, il corpus includeva dati relativi ai codici identificativi dei brevetti, nomi degli assegnatari, nomi degli inventori, date di priorità, date di deposito e creazione, date di pubblicazione, collegamenti ai risultati e collegamenti a figure rappresentative, oltre ad altre informazioni strutturate standard trovate nei brevetti tecnologici. Tra i 155 brevetti, solo 51 hanno fornito informazioni, indicando che circa un terzo dei brevetti di sorveglianza di Palantir sono concessi dagli uffici brevetti e marchi dei rispettivi paesi. Questa informazione non significa che la grande maggioranza di questi brevetti non verrà concessa, poiché il tempo più lungo osservabile tra la data di priorità (prima data) e la data di concessione (data finale) è stato di 12 anni, dal 20/11/06 all’8/28/18. All’interno del corpus sono presenti brevetti che hanno date di priorità negli ultimi due o tre anni. Tra i paesi e le regioni che hanno presentato domanda, la suddivisione è stata di 31 dall’Ufficio europeo dei brevetti, quattro dalla Germania, uno dall’Australia, uno dal Regno Unito, uno dai Paesi Bassi e 117 dagli Stati Uniti, dimostrando chiaramente che Palantir archivia la maggior parte dei suoi dati di sorveglianza con brevetti a livello nazionale.

Tra i nomi propri, abbiamo distillato i nomi delle società di piattaforme dal corpus perché eravamo interessati a vedere se Palantir immaginava di integrare i dati provenienti dai social media e dalle fonti della piattaforma. Questi includevano Amazon, Apple, Facebook, Google, Instagram, LinkedIn, Microsoft e Twitter. I brevetti menzionano Google e Microsoft molto più in generale rispetto alle altre società, solitamente nell’integrazione di Palantir e nel monitoraggio dei loro vari servizi (aziendali e personali). I dati qui mostrano che Palantir prevede che la sua piattaforma effettui il monitoraggio dei dati provenienti dai prodotti e dai servizi, tra gli altri, delle piattaforme di social media. Nella tabella seguente sono riportate le parole chiave dei nomi propri e le frequenze delle parole prossimali più comuni, Tabella 2. Società di media Internet descritte nei brevetti Palantir con frequenze di parole prossimali.

 

Tabella 2. Società di media Internet descritte nei brevetti Palantir con frequenze di parole prossimali. Scarica CSVTabella di visualizzazione

 

Di seguito è riportato un esempio sotto forma di un breve estratto dal corpus Palantir che descrive la capacità di Palantir di integrare set di dati disparati provenienti da fonti esterne come piattaforme, società finanziarie, social media e organizzazioni governative e include un campione di alcuni dei nomi propri per le società di social media elencate nei nostri risultati sopra (Michel et al. 2018 ):

I sistemi di dati delle entità consumatrici possono includere sistemi informatici pubblici come i sistemi informatici affiliati al Bureau of the Census degli Stati Uniti, al Bureau of Labor Statistics degli Stati Uniti o a FedStats, oppure possono includere sistemi informatici privati ​​come i sistemi informatici affiliati a istituti finanziari, agenzie di credito, siti di social media, servizi di marketing, agenzie pubblicitarie o altre organizzazioni che raccolgono e forniscono dati demografici o dati sui singoli consumatori. In alcune forme di realizzazione, i sistemi di dati delle entità dei consumatori possono includere informazioni pubblicitarie relative a singoli consumatori come visualizzazioni di annunci, clic, impressioni di annunci, dettagli di annunci o altre informazioni relative a annunci pubblicitari. In alcune forme di realizzazione, i sistemi di dati delle entità consumatori possono includere la cronologia di navigazione web (ad esempio, dati di navigazione forniti da Apple Safari, Microsoft Internet Explorer, Google Chrome, Mozilla Firefox o altri browser web), interazioni di social network (ad esempio, da fornitori di social network come, tra gli altri, Facebook, LinkedIn e Instagram) o altri comportamenti online disponibili relativi a un consumatore o un gruppo di consumatori.

Sebbene ci siano altri esempi di passaggi estesi tra cui potremmo scegliere nel corpus, nel brano sopra riportato abbiamo ritenuto opportuno mostrare l’ampiezza del modo in cui Palantir descrive la sua piattaforma di sorveglianza integrando vari dati sugli individui attraverso i sistemi, anche dalla loro navigazione e ricerca sul web, storia, connessioni di social network e come questi dati possono essere collegati e integrati con dati governativi e bancari sugli stessi individui, tramite identificatori di risorse uniformi, interfacce di programmazione delle applicazioni, ecc. Questo passaggio dà un’idea di ciò che Palantir immagina come riempimento di alcuni dei contenuto dei suoi sforzi di integrazione dei dati, accennando solo a ciò che l’azienda è pubblicamente disposta a dire, cosa che riteniamo presenti già allarmanti preoccupazioni sulla privacy. Secondo l’azienda, Palantir non raccoglie informazioni direttamente ma offre software per l’integrazione dei dati; questo è l’argomento presentato in documenti come Privacy Impact Assessments per organizzazioni federali e sanitarie (Edge e Neuman 2016 ). Pertanto, è possibile difendere le linee critiche riguardanti l’ipotetica provenienza dei dati. Tuttavia, Palantir rimane aperta alla critica di essere potenzialmente complice di atti di deportazione, reclusione e razzismo attraverso i suoi contratti.

Di particolare interesse per le società mediatiche descritte nei brevetti sono state menzionate diverse società che si occupano dell’ottenimento di dati da e-mail e corrispondenza private, relazioni e collegamenti ai social media e rating di credito. Questi elementi potrebbero avere effetti negativi significativi per gli individui se triangolati e impiegati dagli amministratori per giudicare attività come la ricerca di un prestito, lavoro, immigrazione e visti, o controlli dei precedenti penali, oltre a creare preoccupazioni potenzialmente “astratte” come la colpa per associazione. In questi brevetti, Palantir ammette esplicitamente lo scopo della sua piattaforma, che è la raccolta e il tracciamento di informazioni personali a fini di sorveglianza tra domini (vedi Ribes et al.2019 sulla “logica dei domini” in informatica).

Il nostro oggetto di analisi principale era la modellazione degli argomenti, che includeva gli argomenti, le parole chiave associate per ciascun argomento e i nostri esempi scelti manualmente presi dai dati negli estratti (Tabelle 3 e 4). L’esame di questi argomenti e passaggi fornisce ai ricercatori prove di prima mano e documentazione di fonte primaria relativa agli approcci, ai servizi, ai tipi di dati e alle azioni di integrazione presenti nella piattaforma di sorveglianza di Palantir. Gli argomenti rivelano inoltre informazioni sull’infrastruttura (Bowker e Star 2000 ; Bowker et al. 2010 ; Karasti e Blomberg 2018 ; Dantec e Di Salvo 2013 ) che può essere realizzato con la piattaforma di sorveglianza e gli strumenti gestionali e amministrativi pervasivi che i gestori dei dati utilizzano nel loro lavoro per documentare e tenere traccia dei dati relativi a settori quali l’assistenza sanitaria, l’immigrazione e presunte attività criminali.

 

Tabella 3. Modellazione tematica dei brevetti Palantir (1–10) Scarica CSVTabella di visualizzazione

Tabella 4. Modellazione tematica dei brevetti Palantir (11–20) Scarica CSVTabella di visualizzazione

 

Tra i venti argomenti, vediamo tre temi che rivelano la posizione di Palantir come azienda di integrazione dati e come le disposizioni della piattaforma di sorveglianza di Palantir possono essere differenziate tra le domande di brevetto per le sue tecnologie software. L’unico argomento che non segue questi filoni è l’argomento 17, che internamente si riferisce ai documenti come brevetti, alla loro struttura e alle parti (ad esempio, dati relativi a date e riferimenti). Se presi insieme e impilati, questi tre filoni tematici rappresentano un imbuto di dati (discusso di seguito) di come le tracce del comportamento umano vengono preparate per ordinare le azioni come oggetti di dati digitali che vengono poi trasformati in sistemi software rappresentazionali (metadati, ontologie e tecnologie semantiche), che vengono poi infine elaborati e interpretati attraverso l’analisi della piattaforma di sorveglianza fornita da Palantir. Pertanto, la modellizzazione dell’argomento (in risposta a RQ1) ci consente di comprendere le aspirazioni di sorveglianza, le immaginazioni e le capacità tecniche di Palantir (in risposta a RQ2).

Risultato 1: Etichettatura di tracce umane e azioni di smistamento

Il primo tema emerso dal tema della modellazione riguardava il modo in cui il software Palantir etichetta le tracce umane e inizia a ordinare le azioni; questo contiene l’argomento 1 (identificazione delle corrispondenze dei dati, delle associazioni e delle loro relazioni), argomento 5 (segmentazione e partizionamento degli oggetti utilizzando insiemi, affermazioni, serie temporali e valori), argomento 10 (denunce di frode medica e sanitaria), argomento 16 (frode finanziaria rilevamento) e l’argomento 19 (sicurezza, attacco, frode, kill chain, hacking). Si tratta di argomenti relativi all’identificazione di oggetti normativi e relazioni nei sistemi IT per segnalare frodi, presunte criminalità, hacking o eventi insoliti. L’etichettatura delle tracce umane e le azioni di smistamento in questa fase (ovvero, all’inizio dell’imbuto dei dati) possono facilitare l’organizzazione dei dati per il rilevamento, la previsione e l’analisi. Ad esempio, un brevetto (Goenka et al.2019 ) descrive l’acquisizione di un’immagine di una persona con uno smartphone e la successiva estrazione dei dati dall’immagine da inviare a un server per rilevare corrispondenze (riconoscimento facciale) e collegamenti ai vari profili della persona e ai relativi contenuti dei media (social), consentendo l’incrocio-ricerca e recupero dei media per l’etichettatura (Figura 8).

Figura 8. Riconoscimento facciale per l’abbinamento con fonti multimediali (Goenka et al.2019 ).

Figura 8. Riconoscimento facciale per l'abbinamento con fonti multimediali (Goenka et al. Citation2019).

Questi argomenti (1, 5, 10, 16, 19) si riferiscono all’identificazione delle entità, al loro ordinamento utilizzando informazioni di dominio per produrre corrispondenze e alla creazione di etichette a livello di oggetti e delle loro relazioni (ad esempio, un paziente con un operatore sanitario, viso dati agli account dei social media, i criminali a rischiare punteggi). Palantir aveva tentato di prendere le distanze dall’idea che la società faciliti l’integrazione di alcuni tipi di dati controversi (Palantir 2020b ), come quando la società ha minimizzato il suo coinvolgimento nello scandalo Cambridge Analytica (CA), nonostante la testimonianza dell’informatore di CA Christopher Wylie ai legislatori britannici secondo cui c’erano “dipendenti senior della Palantir che stavano lavorando sui dati di Facebook” (Confessore e Rosenberg 2018 ), o nella continua negazione da parte della Palantir di fornire qualsiasi assistenza diretta all’ICE attraverso l’integrazione dei dati riguardanti gli immigrati privi di documenti destinati alla deportazione (Pressman 2019 ). All’inizio della storia dell’azienda, Palantir è stata coinvolta in un’altra controversia sulla raccolta di dati su Facebook che coinvolgeva uno studio legale che lavorava per la Camera di commercio degli Stati Uniti. Lo studio legale voleva spiare gli oppositori politici della Camera e i profili sui social media (Johnson 2011 ). Presentiamo la citazione seguente da un brevetto Palantir (Beard et al. 2016 ) che descrive come i contenuti non strutturati dei social media possono essere integrati tramite Palantir.

Il sistema di strutturazione dei dati può anche includere uno o più componenti di strutturazione che possono analizzare il contenuto non strutturato dei social media… I tipi di entità possono definire una persona, un luogo, una cosa o un’idea. Esempi di tipi di entità includono il profilo della piattaforma di social media (ad esempio, il profilo utente di Facebook o Twitter), l’indirizzo IP, l’indirizzo e-mail, l’album fotografico, l’elenco degli amici e la posizione. I tipi di eventi possono definire un tipo di evento della piattaforma di social media associato all’oggetto di un’indagine penale. I tipi di eventi possono includere, ad esempio, l’accesso del soggetto al profilo della propria piattaforma di social media, la pubblicazione di una foto sul profilo della piattaforma di social media del soggetto, l’invio di richieste di amicizia e l’accettazione di richieste di amicizia. I tipi di documento possono definire un tipo di documento della piattaforma di social media creato dal soggetto o dai contatti del soggetto. Esempi di tipi di documenti includono messaggi privati, aggiornamenti di stato, post di microblog (ad esempio, post sulla bacheca di Facebook, Tweet di Twitter), commenti sui post di microblog di altri utenti, immagini e video.

Inoltre, alcuni resoconti di seconda mano dei clienti di Palantir hanno confermato e riportato l’accesso di Palantir a dati di domini (relativi a sanità, finanza, social media, ecc.) come quelli sopra elencati (oltre ai clienti che sono utenti del suo software), come evidenziato dal “Data Protection Impact Assessment: NHS COVID-19 Data Store” del NHS (NHS 2020 ) che afferma chiaramente che Palantir è in contatto con dati medici e sanitari sensibili di cittadini del Regno Unito e che Palantir deve seguire le norme e i regolamenti locali come il Regolamento generale sulla protezione dei dati (GDPR). Per quanto riguarda i dati sanitari, la Figura 9 contiene un’immagine da un brevetto Palantir (Wang et al. 2014 ) che descrive le informazioni sulle prescrizioni di una persona e la rete di farmacisti, strutturate per individuare le denunce di frode medica e sanitaria.

Figura 9. Immagine che mostra la prescrizione di una persona e la rete di farmacisti (Wang et al.2014 ).

Figura 9. Immagine che mostra la prescrizione di una persona e la rete di farmacisti (Wang et al. Citation2014).

I risultati di questo primo gruppo tematico di brevetti relativi all’etichettatura di tracce umane e alle azioni di smistamento forniscono quindi la prova che Palantir ha concettualizzato, progettato e implementato tecnologie mirate e specifiche del dominio riguardanti l’identificazione di oggetti e relazioni di dati e che, in in alcuni casi, è probabile che Palantir abbia accesso a quei dati che si trovano spesso in aree sensibili che richiedono adattamenti e normative sulla privacy. Le prove brevettuali in questo gruppo, integrate con casi clinici secondari come quelli del NHS e della polizia di New York, in cui Palantir è descritto come in contatto diretto con i dati del dominio o con l’analisi secondaria e i risultati prodotti dai dati del dominio, mostrano potenzialmente che l’azienda non è del tutto indipendente dal dominio o “interattivo” nei suoi approcci all’integrazione dei dati e deve rispettare normative come il GDPR.

Risultato 2: sfruttamento di metadati, ontologie e tecnologie semantiche

Il secondo tema emerso dal nostro topic modeling riguarda il modo in cui Palantir conduce la propria integrazione dei dati sfruttando la potenza dei metadati, delle ontologie e delle tecnologie semantiche. Questo tema contiene l’argomento 3 (selezione di oggetti dati personalizzabili nei grafici con nodi e spigoli), argomento 4 (modellazione e collegamento di ontologie, entità, oggetti, relazioni e proprietà relative a persone, eventi e cose), argomento 12 (livelli di astrazione utilizzando layer, mappe, grafici), argomento 14 (schemi con insiemi, tipi e proprietà) e argomento 20 (rappresentazione e significato, standardizzazione e struttura interna, metadati). Questo secondo filo mostra temi relativi allo sviluppo di tecnologie per orchestrare l’integrazione dei dati per produrre legami e relazioni di rete tra più domini, come quelli del primo tema.

Gli argomenti di questo secondo tema rappresentano un livello di astrazione più elevato rispetto agli argomenti del primo tema. Invece, l’attenzione qui è sulla produzione di significato e contesto di secondo ordine triangolando i dati estesi raccolti ed etichettati nel primo tema. Questi argomenti si basano su un’integrazione significativa dei dati e un assemblaggio significativo tramite grandi volumi di dati provenienti da domini diversi. Su questa scala, esistono prove convincenti di collegamenti tra queste entità di dominio disparate che vanno oltre l’etichettatura di oggetti ed eventi derivanti dalle procedure iniziali di integrazione dei dati. Ad esempio, un brevetto Palantir (Cervelli, GoGwilt e Prochnow 2013 ) mostra come viene utilizzata un’ontologia per connettere le informazioni che sono state etichettate e recuperate dai parser, come quelle rappresentate nel nostro primo tema, con collegamenti, oggetti dati e proprietà, che vengono poi modellati e archiviati in un database (Figura 10, superiore). Si noti il ​​ruolo centrale dell’“Ontologia” nel diagramma di Palantir di questo ecosistema informativo. Un esempio di seguito (Carter e Cohen 2018) mostra come viene identificato un “dipendente”, insieme ai dati su chi ha “visitato” o dove è stato “visto”, con chi è “sposato” e le cose che la persona “possiede” (Figura 10, metter il fondo a).

Figura 10. Infrastruttura ontologica di Palantir (Cervelli, GoGwilt e Prochnow 2013 ) e un esempio (Carter e Cohen 2018 ).

Figura 10. Infrastruttura ontologica di Palantir (Cervelli, GoGwilt e Prochnow Citation2013) e un esempio (Carter e Cohen Citation2018).

Gli argomenti di questo secondo tema (3, 4, 12, 14, 20) triangolano i dati del dominio tramite metadati per produrre un’astrazione in rete (cioè la fase intermedia del funnel dei dati). Questa fase prevede di prendere i dati dal primo contenitore relativo all’etichettatura delle tracce umane e alle azioni di smistamento e di costruirli in un’ontologia più completa. Il software Palantir viene qui utilizzato per fornire uno strato intermedio semantico tra questi punti dati e il loro eventuale processo decisionale preventivo. Il software Palantir costruisce e modella queste entità e le loro relazioni nei metadati, producendo nuova “conoscenza” per i clienti Palantir. In questa fase, avviene l’infrastrutturazione ed è garantita dalla capacità di Palantir di connettere e mettere in relazione diversi domini di dati in silos, producendo nuovi livelli di associazione, triangolazione, coordinamento, ecc., una pratica che storicamente si è verificata nelle istituzioni di informazione che creano conoscenza su larga scala, e grafici come quelli di Google, Microsoft, Amazon, ecc. discussi sopra. È importante notare che queste descrizioni di “conoscenza” riguardano l’utilizzo della tecnologia per creare schemi e ricavare modelli da archivi di dati. Queste pratiche si basano su un’ontologia prestabilita che comprende il mondo in un certo modo.

Ci sono prove in questo tema che Palantir ha aspirazioni infrastrutturali per diventare un sistema di classificazione generale per l’integrazione dei dati (ciò che nella scienza dell’informazione viene definito “ontologia di livello superiore”, che sono ontologie indipendenti dal dominio costituite da categorie astratte e termini per integrazione dei dati del dominio) che può essere adattato in un grafico della conoscenza universale. Allo stesso modo in cui il grafico della conoscenza di Google introduce problemi etici relativi al modo in cui rappresenta la conoscenza e monopolizza fatti e significati nel presentare informazioni generali agli utenti che interagiscono con Ricerca Google (Vang 2013 ), gli argomenti descritti in questo tema mostrano potenzialmente che Palantir immagina in modo simile un mondo in cui la sua piattaforma potrebbe fungere da grafico di conoscenza universale “ombra” per governi, industrie e organizzazioni. Ad esempio, la parola “conoscenza” ricorre 110 volte nel corpus. Spesso si riferisce all’assorbimento, allo sfruttamento o all’astrazione della “conoscenza” del dominio in un’ontologia generalizzata che altri utenti e non specialisti al di fuori di un dominio potrebbero essere in grado di interrogare per ottenere risultati di ricerca.

Risultato 3: elaborazione interpretativa per il processo decisionale preventivo

L’ultimo tema riguardava l’elaborazione interpretativa per il processo decisionale preventivo e contiene l’argomento 2 (memoria, elaborazione e dispositivi di archiviazione), l’argomento 6 (provenienza, ricevute e verifica di affermazioni, descrizioni, divulgazioni), l’argomento 7 (punteggio logico basato su regole e analisi con alert), argomento 8 (comunicazione e notifica con messaggi), argomento 9 (visualizzazioni con diagrammi di flusso, figure e diagrammi di processo), argomento 11 (codice lato client, dataset, modelli), argomento 13 (software lato server funzionamento, implementazione e prestazioni), argomento 15 (sandboxing, cloud, sperimentazione, esecuzione di test, processo decisionale, analisi) e argomento 18 (geolocalizzazione, filtri/riquadri). Questi argomenti rappresentati in questo tema (2, 6, 7, 8, 9, 11, 13, 15, 18) rivelano il lavoro di dati leggibili e gli elementi SaaS che Palantir fornisce ai propri clienti, ovvero la capacità di interagire con rappresentazioni significative dalle informazioni che gli utenti ricevono sotto forma di dashboard, visualizzazioni, interfacce, documentazione, comunicazione, ecc. (ovvero, la fase finale del funnel dei dati). I dati analitici sono presentati qui per fornire un sondaggio globale dei dati.

Questi argomenti finali si concentrano su come Palantir consente ai propri utenti di gestire i dati su larga scala utilizzando sistemi informativi client o lato utente per supportare la previsione e l’analisi delle decisioni. In questa fase finale sono inclusi elementi utilizzabili, forniti da dati che sono stati resi semanticamente attraverso il lavoro sui dati di elaborazione interpretativa per la gestione, l’analisi e la previsione che si verifica nella piattaforma di sorveglianza di Palantir, e questo supporta i lavoratori della conoscenza e i professionisti dei dati. Le immagini presentate di seguito (Figura 11) mostrano i tipi di visualizzazioni che gli utenti della piattaforma di sorveglianza di Palantir possono utilizzare per assistere nelle indagini e nei casi, consentendo agli utenti di interagire e gestire i propri dati. Sebbene queste immagini siano solo schizzi, i giornalisti hanno riferito di fonti che affermano che l’interfaccia della piattaforma di sorveglianza di Palantir “è più efficiente e più facile da usare rispetto alle alternative create dagli appaltatori della difesa” (Weinberger 2020 ).

Figura 11. Dall’alto: lettore di cavi classificato interattivo (Lee et al. 2014), rilevamento del percorso per minacce alla sicurezza (Simaitis 2019 ) e corrispondenza delle entità del database (McGrew e Cohen 2013 ).

Figura 11. Dall'alto: lettore di cavi classificato interattivo (Lee et al. Citation2014), rilevamento del percorso per minacce alla sicurezza (Simaitis Citation2019) e corrispondenza delle entità del database (McGrew e Cohen Citation2013).

La maggior parte degli argomenti del corpus rientrano in quest’ultima categoria, dimostrando che Palantir è fortemente interessata ai processi di analisi amministrativa e burocratica incentrati sull’uomo coinvolti nel lavoro sui dati. I brevetti di Palantir dimostrano che l’azienda progetta prodotti incentrati sulla comunicazione tra le persone all’interno e tra organizzazioni focalizzate sulla sorveglianza. Gli argomenti di questo tema parlano ai molteplici stakeholder che Palantir immagina utilizzando i suoi prodotti, dai programmatori e manager agli avvocati e ai dipendenti dei servizi finanziari: La Figura 11rappresenta alcuni degli scenari di ricerca che Palantir immagina coinvolgeranno i suoi utenti. L’immagine in alto mostra un modello di informazioni riservate relative a notizie ed eventi di sicurezza e intelligence (principalmente in Medio Oriente) e come queste verranno orchestrate con i dati analitici. La seconda immagine rappresenta un incidente terroristico a Londra utilizzando una mappa e dati analitici, inclusa la capacità di “discriminare” tra punti dati per acquisire “conoscenza” e potenzialmente aggirare incidenti futuri. L’immagine finale contiene una serie di nomi arabi in uno strumento per rilevare relazioni e legami familiari attraverso i database.

Il materiale qui presentato (Medio Oriente, arabo, ecc.) è la prova dei pregiudizi di Palantir e del modo in cui l’azienda immagina che i suoi prodotti verranno utilizzati (principalmente dalle agenzie di polizia, sicurezza e intelligence occidentali). Tuttavia, l’azienda non ha esitato ad esprimere la propria approvazione per l’egemonia occidentale e l’eccezionalismo statunitense. Nella lettera di Karp che accompagna la documentazione alla SEC, l’amministratore delegato della Palantir afferma che “Il nostro software viene utilizzato per prendere di mira i terroristi e per mantenere i soldati al sicuro… Abbiamo scelto da che parte stare” (Palantir 2020a , ii) e altre sezioni dell’osservazione del deposito sul sostegno di Palantir alla “democrazia liberale occidentale” (34). Ancora più tristemente noto, Karp ha ulteriormente elaborato la posizione ideologica di Palantir affermando che “il nostro prodotto viene utilizzato occasionalmente per uccidere persone” (Allen 2020 ), e lo stesso Thiel ha dichiarato di definire la diversità e il multiculturalismo un “mito” (Sacks e Thiel 1999 ) sostenendo il capitalismo monopolistico (Thiel e Masters 2014 ), una volta scrivendo “Non credo più che libertà e democrazia siano compatibili” (Thiel 2009). Weigel (2020 ) discute le prime influenze ideologiche e accademiche sulla leadership di Palantir, inclusi Thiel e Karp.

I temi nel nostro corpus presentano la prova che Palantir immagina che la sua piattaforma di sorveglianza funga da tecnologia preventiva e predittiva in grado di contrastare ciò che Palantir immagina come eventi criminali prima che accadano (Andrejevic, Dencik e Treré 2020 ). Qui, seguendo Massumi (2015 ), riteniamo che Palantir presuppone che “ciò di cui deve occuparsi abbia un’esistenza oggettivamente data prima del proprio intervento” (5) e che combini “un’epistemologia proprietaria con un’ontologia unica in modo tale da rendere presente un futuro/causa che mette in atto un movimento che si autoperpetua” (14). Questa logica operativa utilizza la piattaforma di sorveglianza di Palantir per combinare l’ontologia con l’epistemologia “in modo tale da dotarsi di poteri di auto-causazione” (200). Palantir traccia quindi le tracce umane e le ordina, sfrutta metadati, ontologie e tecnologie semantiche e le presenta utilizzando analisi per gli amministratori, producendo un funnel di dati che porta a un processo decisionale preventivo. Immaginiamo i tre temi presentati sopra come parte di una rappresentazione a imbuto di dati (Figura 12).

Figura 12. Rappresentazione del funnel di dati di Palantir contenente tre temi.

Figura 12. Rappresentazione del funnel di dati di Palantir contenente tre temi.

Le tecnologie di Palantir che supportano il processo decisionale preventivo, basato sull’ordinamento probabilistico dei dati e sull’etichettatura ontologica dei soggetti come “criminali” ecc. all’interno di connessioni di rete più ampie, sono coinvolte in ciò che De Goede (2008 ) si riferisce a una “politica di prelazione” e forza di legge laddove può verificarsi violenza interpretativa. Queste connessioni tra governance, rischio, sorveglianza e etichettatura ontologica dei gruppi marginali sono documentate negli studi sulla “guerra al terrorismo” (Amoore e De Goede 2005 ). Come Amoore (2013 , 59) mostra, esiste una “ontologia di associazione” che tecnologie come Palantir rendono visibili, rendendo i soggetti basati sulla correlazione probabilistica delle tracce di dati e dove la “possibilità di azione” rimane aperta alle forze di sicurezza e amministrative (64). L’espansione di Palantir nella fornitura di questo tipo di servizi tecnologici dalle agenzie di sicurezza governative alle imprese e alle organizzazioni no-profit nel settore pubblico mostra “la facilità con cui le tecnologie antiterrorismo e i finanziamenti antiterrorismo possono essere sfruttati per la sorveglianza civile” (Hong, 2020 , 26). Nella nostra sezione finale, concettualizziamo la piattaforma di sorveglianza di Palantir attraverso la nozione teorica di infrastruttura.


https://www.asterios.it/catalogo/il-feudalesimo-digitale


Discussione: Infrastrutture

Concettualizziamo la piattaforma di sorveglianza di Palantir e il processo decisionale preventivo che consente come se beneficiassero di atti di infrastrutturazione. Mentre gli studiosi di studi su scienza e tecnologia, studi sui media, comunicazione e studi sull’informazione si sono concentrati sulla definizione dell’infrastruttura, gli studiosi si sono sempre più concentrati su come i ricercatori che osservano e coloro che costruiscono e mantengono l’infrastruttura dell’informazione partecipano a pratiche attive di infrastrutturazione. Per Karasti e Blomberg (2018 ), l’infrastruttura è “il processo sempre continuo di creazione e attuazione di infrastrutture informative” (234). Spostare l’attenzione sulle pratiche infrastrutturali spinge la nostra attenzione critica sulla natura processuale dei fenomeni infrastrutturali, o su ciò che altri hanno chiamato “dispositivi scalari” (Ribes 2014 ) e come possono essere coinvolti, adottati e plasmati futuri dinamici. Altri hanno descritto come il lavoro di articolazione nelle infrastrutture “estende i problemi di utilizzo nelle relazioni eterogenee coinvolte in progetti infrastrutturali su larga scala, a lungo termine e interdisciplinari” (Mikalsen, Farshchian e Dahl 2018 ).

Le infrastrutture informative che implementano i sistemi utilizzano tipicamente metadati, ontologie e tecnologie semantiche per mettere in atto e arruolare soggetti, e sono spesso invisibili nella loro fornitura e impatto. Il modo in cui tali categorie hanno influenzato l’infrastruttura è stato studiato come politica di rappresentazione e classificazione della conoscenza, dibattuto da ingegneri di standardizzazione e progettisti di infrastrutture. Eppure, sappiamo dagli studiosi delle infrastrutture che hanno esaminato il potere delle tecnologie semantiche (Allhutter 2019 ; Waller 2016 ) che gli standard di metadati, la progettazione di database e le tecniche di acquisizione basate su documenti arruolano tutti i soggetti in diversi modi che hanno effetti duraturi a lungo termine che vanno oltre gli atti iniziali o inaugurali di essere resi, catturati o resi leggibili nei sistemi. Poirier (2019 ) ha sostenuto che tali infrastrutture semiotiche e il modo in cui gli individui diventano idonei sono forme di potere dei dati. Ma anche se le persone e le cose vengono rappresentate mediante la modellazione formale dei dati, tali standard sono sempre contestati e in evoluzione, anche se pretendono di istituire concetti oggettivi e immutabili. Poirier ha descritto questo come il doppio legame della catacresi nelle infrastrutture semiotiche classificatorie come i modelli di dati. Tali formalismi ontologici schematizzano il significato in modi che collocano le persone dentro o fuori categorie, mentre ci sono fenomeni che resistono a tipi o varianti che non rientrano in tali categorie. Gli standard infrastrutturali come le etichette dei dati utilizzati per la piattaforma di sorveglianza di Palantir sono esempi dell’infrastruttura dell’azienda quando l’etichettatura viene utilizzata per rappresentare e commisurare diversi flussi di prove nell’analisi predittiva (per scopi di sorveglianza, di polizia o altre applicazioni).

I prodotti software e la piattaforma di sorveglianza di Palantir sono garantiti da standard e si può dire che influenzino l’infrastruttura del software di sorveglianza nella vita di coloro che sono soggetti a queste tecnologie. Nel loro lavoro sulla formazione dei pubblici, Dantec e DiSalvo (2013 ) sostengono che tale lavoro infrastrutturale può spesso rivelare il potere e la struttura dell’egemonia in questi sistemi, ma può anche offrire una risposta all’autorità radicata che essi rappresentano. Per Le Dantec e DiSalvo, una caratteristica essenziale dell’infrastruttura è la distinzione tra sistemi fissi e sistemi che cambiano oltre i casi d’uso previsti, o “il lavoro di creazione di risorse socio-tecniche che consentono intenzionalmente l’adozione e l’appropriazione oltre l’ambito iniziale del progetto” (247). Altri hanno sottolineato i vantaggi dello studio delle infrastrutture in quanto consentono ai ricercatori di esaminare processi in corso e continui (Bowker e Star 2000 ; Pipek e Wulf 2009 ). Questa qualità mutevole può essere un’arma a doppio taglio; mentre i modelli presenti nell’infrastruttura possono essere modificati, aggiornati, modificati o cambiati nella loro creazione e sviluppo, come attuazioni dell’infrastruttura, possono lentamente filtrare oltre i casi d’uso previsti ed essere applicati (o applicati erroneamente) in modo troppo ampio man mano che si radicano per lunghi periodi (Ribes e Finholt 2009 ). Qui, una caratteristica essenziale dell’investigazione dell’infrastruttura attraverso metadati, ontologie e tecnologie semantiche è la loro qualità processuale; questa apertura può eventualmente calcificarsi, diventare fragile e persino allontanarsi dai significati previsti. Anticipare questa qualità processuale dell’infrastruttura ci consente di esaminare e persino mitigare i “problemi ontologici” che derivano dalla visibilità e dall’impatto dei modelli di dati sugli individui che identificano e rappresentano nei sistemi (Iliadis 2018, 2019).

Gli studiosi che studiano ingegneria degli standard e progettisti di infrastrutture individuano metadati, ontologie, comunità di tecnologia semantica e le loro istituzioni nei loro archivi e dibattiti ben documentati sullo sviluppo degli standard (Russell 2014 ). Esiste una ricca storia di discussioni documentate negli elenchi organizzativi e nei verbali delle riunioni negli archivi degli standard. I resoconti delle prime tecnologie web provengono da tali documenti e archivi web. Ma sempre più spesso, le decisioni sugli standard di modellazione dei dati dell’infrastruttura di progettazione vengono racchiuse in piattaforme che limitano la nostra capacità di seguire queste scelte, intervenire in tali rappresentazioni o verificare il modo in cui gli interessati vengono resi leggibili o idonei nei sistemi (Acker 2018 ). Nel loro studio sulle promesse e le insidie ​​dei passaggi digitali, Latonero e Kift (2018 ) sostengono che la logica delle diverse tecnologie di sorveglianza può rafforzare diverse categorie di classificazione di gruppi di persone, in particolare con l’aumento dei sistemi di controllo delle frontiere digitali. Ad esempio, nell’UE, mentre i droni e i satelliti per la sorveglianza delle frontiere utilizzati attraverso il sistema europeo di sorveglianza delle frontiere (Eurosur) rafforzano i confini esternalizzati attraverso lo smistamento di gruppi, il database europeo di dattiloscopia dell’asilo (Eurodac), che utilizza informazioni biometriche per classificare i richiedenti asilo e immigrati privi di documenti, rafforza “i confini interni attraverso l’identificazione degli individui” (Latonero e Kift  2018 , 2). Mettendo insieme due tipi di classificazione digitale, le tecnologie di sorveglianza come Eurosur ed Eurodac realizzano un’infrastruttura sicura per la microidentificazione e il macrosmistamento oltre i confini dell’UE.

In quanto forza ontologizzante che ha il potenziale per combinare diversi archivi di dati e nella sua vasta portata di configurazione e integrazione di fonti di dati per lo Stato, la piattaforma di sorveglianza di Palantir diventa un processo indelebile per l’infrastruttura della sorveglianza e della governance digitale contemporanea. Tuttavia, ci sono tensioni tra l’impresa tecnologica e le piattaforme proprietarie che intermediano infrastrutture e sistemi sociali come gli standard per l’interoperabilità; l’attività infrastrutturale di modellazione dei dati rimane una sfida aperta per le infrastrutture informative in termini di incommensurabilità del dominio, tuttavia il lavoro di platformizzazione consente a Palantir di aggirare o limitare questi problemi di indeterminatezza attraverso i suoi prodotti tecnologici (e limitandone l’accesso), evidenziando così anche il ruolo critico di progettazione ed estetica snella della piattaforma nel facilitare l’adozione di questi sistemi restrittivi.

Conclusione

L’analisi quantitativa dei brevetti con la modellazione tematica può fornire una comprensione multilivello delle aziende tecnologiche opache e, cosa ancora più importante, a nostro avviso, fornire prove relative alle tecnologie e alle pratiche commerciali delle aziende IT. I brevetti sono documenti che possono far luce sulla logica organizzativa e gli studi futuri possono guardare ai brevetti come fonti primarie per le analisi investigative delle aziende IT. Le logiche riguardanti risorse, capacità, obiettivi, aspirazioni, partenariati e pianificazione possono essere rese visibili attraverso i brevetti e offrire opportunità ai ricercatori. Raccomandiamo diversi percorsi per l’analisi dei brevetti di queste aziende tecnologiche. In primo luogo, i ricercatori possono prelevare i brevetti disponibili al pubblico dagli archivi. In secondo luogo, i brevetti contengono diverse opportunità di ricerca, dalle immagini all’etichettatura dei metadati. In terzo luogo, i contenuti dei brevetti possono essere disposti in modo schematico per fornire una visione multilivello. Come mostra la nostra revisione della letteratura, gli studiosi dei media e della comunicazione (tra gli altri) stanno già utilizzando i brevetti come una forma vantaggiosa di utilizzo dei dati primari tra diversi tipi di metodi.

Palantir caratterizza il suo lavoro in modi non specifici in interviste e post di blog tecnici che tendono a minimizzare le aspirazioni globali dell’azienda e la sua gestione di alcuni dei dati più sensibili del mondo. I brevetti descritti in questo articolo mostrano una storia diversa, fornendo la prova primaria dei tipi di lavoro onnicomprensivo di integrazione dei dati a cui l’azienda immagina di lavorare. Palantir prevede che le sue tecnologie si sincronizzeranno con altre organizzazioni e piattaforme, tra cui Amazon, Google, Microsoft e i governi degli Stati Uniti e del Regno Unito, per integrare, tra gli altri, i dati di clienti, cittadini, rifugiati, pazienti e presunti criminali. Mentre Palantir tenta di prendere le distanze pubblicamente dall’immagine di un’azienda tecnologica globale che facilita la modellazione di dati in cui potrebbero essere in gioco le libertà civili e i diritti umani, i brevetti mostrano che tali processi sono stati immaginati, progettati e implementati già nel 2006. Vengono descritti assistenza sanitaria, sicurezza, immigrazione, social media e raccolta, ordinamento e modellazione di dati finanziari per il processo decisionale preventivo. Più recentemente, i documenti depositati dalla Palantir presso la SEC sembrano confermare questa missione, compresa la razionalizzazione della natura di tale lavoro (Palantir  2020a , i–ii):

I nostri partner richiedono qualcosa di più. Hanno bisogno di piattaforme generalizzabili per modellare il mondo e prendere decisioni. Ed è ciò che abbiamo costruito. […] La costruzione di piattaforme software che consentono una sorveglianza più efficace da parte dello Stato dei suoi avversari o che assistono i soldati nell’esecuzione di attacchi solleva innumerevoli questioni, coinvolgendo i punti di tensione e i compromessi tra la nostra sicurezza collettiva e la privacy individuale, il potere delle macchine, e il tipo di vita che entrambi vogliamo e dovremmo condurre. Le sfide etiche che si presentano sono costanti e inesorabili. … Abbracciamo la complessità che deriva dal lavorare in aree in cui la posta in gioco è spesso molto alta e le scelte possono essere imperfette. … L’élite ingegneristica della Silicon Valley potrebbe saperne più di molti altri sulla creazione di software. Ma non sanno più come dovrebbe essere organizzata la società o cosa richiede la giustizia.

La caratterizzazione degli “avversari” da parte di Palantir e la sua critica alla concezione della Silicon Valley di “giustizia” e di “come la società dovrebbe essere organizzata” sono curiose se lette insieme ai brevetti presentati in questo articolo, dove le tecnologie per la raccolta, l’etichettatura e la modellazione dei dati sono descritte in contesti che includono il riconoscimento facciale, la polizia predittiva, la sorveglianza sul posto di lavoro e il mining dei social media.

Infine, i brevetti di Palantir rivelano anche l’immagine di un’azienda tecnologica che utilizza la sua piattaforma di sorveglianza per lavorare verso qualcosa come l’infrastruttura o per assistere i clienti nell’accumulazione di un’infrastruttura di dati ombra a fini di governo e controllo. I brevetti sono ricche risorse per incontrare e interpretare le descrizioni e i meccanismi di una piattaforma di sorveglianza, che modellano sempre più le infrastrutture digitali critiche dello Stato, delle aziende e delle istituzioni. Rivelano inoltre che la creazione di queste tecnologie comporta processi lunghi e, in alcuni casi, per Palantir, questi sono durati più di dieci anni. Questi documenti si muovono nel tempo per fasi e in modo organizzato in modi diversi dai post dei blog aziendali e da altri media (articoli di notizie, rapporti, ecc.), fornendo una visione più dettagliata e informativa delle aspirazioni di Palantir per la sua tecnologia. Palantir vuole che la sua piattaforma di sorveglianza diventi il ​​sistema operativo de facto per i governi e i dati più sensibili del mondo nei settori pubblici e nei settori privati, acquisendo allo stesso tempo dati aperti da istituzioni pubbliche. Sebbene Palantir possa affermare il contrario, riteniamo che ci siano prove sufficienti in questi brevetti per suggerire che Palantir abbia una base di conoscenza interna o un grafico della conoscenza per etichettare le entità nel mondo, insieme ai loro attributi e relazioni, e che queste risorse occluse non siano completamente rilasciate agli utenti, ma che gli utenti sono soggetti ad essi nell’utilizzo dei prodotti. Pertanto, l’importanza di Palantir per i media e la comunicazione emergenti si trova nella tecnologia dell’azienda che funge da mediatore tra i mondi sociali dei dati e delle informazioni.

Riferimenti

_________________________

Fonte: Andrew Iliadis & Amelia Acker (2022) The seer and the seen: Surveying Palantir’s surveillance platform, The Information Society, 38:5, 334-363, DOI: 10.1080/01972243.2022.2100851
To link to this article: https://doi.org/10.1080/01972243.2022.2100851