Gli esseri umani faticano a identificare l’aggressività nei cani e negli altri esseri umani

E’ quanto emerso da uno studio condotto dal gruppo di ricerca DogStudies presso l’Istituto Max Planck di Geoantropologia, i cui risultati sono stati pubblicati su PLOS ONE, nel dicembre 2022.  I ricercatori hanno mostrato ai partecipanti video di coppie di esseri umani, cani e macachi per determinare quanto bene gli esseri umani valutano le interazioni sociali

Come specie, gli esseri umani interpretano costantemente i segnali per valutare le situazioni sociali e fare previsioni su quello che potrebbe accadere dopo. Essere in grado di dire se qualcun altro, umano o animale, è felice con noi, se sta per diventare aggressivo o sta prestando attenzione, può avere importanti vantaggi evolutivi. Questo studio rivela che mentre gli esseri umani valutano con un grado di correttezza che va oltre la pura casualità statistica le interazioni tra esseri umani, cani e scimmie, fanno di contro fatica a prevedere comportamenti aggressivi sia nei cani che negli esseri umani.

Nello studio il gruppo di ricerca DogStudies dell’Istituto Max Planck di Geoantropologia, insieme ai colleghi dell’Università Friedrich Schiller di Jena, dell’Istituto Max Planck per lo sviluppo umano di Berlino e dell’Università di Lipsia, hanno utilizzato video per determinare quanto bene le persone possono giudicare le interazioni sociali. I ricercatori hanno mostrato a 92 partecipanti 27 videoclip, ciascuno dei quali mostrava un’interazione non verbale tra una coppia di bambini umani, una coppia di cani o una coppia di macachi. I partecipanti sono stati divisi in due gruppi, uno dei quali ha classificato le interazioni come giocose, neutre o aggressive, mentre l’altro ha previsto l’esito di ciascuna interazione.

I partecipanti hanno ottenuto punteggi superiori al livello casuale nel classificare le interazioni tra tutte le specie e hanno previsto esiti accurati nel 50-80% delle interazioni. Tuttavia, l’accuratezza delle categorizzazioni e delle previsioni dipendeva sia dalla specie che dal contesto sociale dell’interazione. Curiosamente, e contrariamente alle ipotesi degli sperimentatori, i partecipanti non erano migliori nel valutare le interazioni umane rispetto a quelle di altre specie. Inoltre, hanno avuto le prestazioni peggiori nel valutare le interazioni aggressive nei cani e negli esseri umani.

Dal momento che identificare e predire l’aggressività correttamente nei cani e negli esseri umani potrebbe aiutare le persone a evitare lesioni e persino la morte, i ricercatori si aspettavano che i partecipanti fossero i migliori nel valutare le situazioni aggressive, ma lo studio attuale rivela che tali valutazioni sono più difficili per le persone del previsto.

“È possibile che siamo prevenuti nel dare per scontato buone intenzioni da parte di altri esseri umani e del ‘migliore amico dell’uomo’”, afferma Theresa Epperlein, prima autrice del nuovo studio. “Forse questo pregiudizio ci impedisce di riconoscere le situazioni aggressive in queste specie”.
“I nostri risultati sottolineano il fatto che le interazioni sociali possono spesso essere ambigue”, aggiunge l’autrice senior Juliane Bräuer, “e suggeriscono che prevedere con precisione gli esiti delle interazioni può essere più vantaggioso che categorizzare i contesti emotivi”.

Sebbene lo studio attuale riveli molto sul modo in cui gli esseri umani interpretano le situazioni sociali, solleva la questione di come formiamo esattamente le nostre valutazioni e se le nostre capacità possono migliorare con la formazione, anche se ricerche precedenti hanno portato dati a favore del fatto che l’esperienza non porta sempre a risultati migliori. Per rispondere a queste domande, sono necessari ulteriori studi per determinare su quali segnali gli esseri umani fanno affidamento mentre osservano le interazioni, come vocalizzazioni, espressioni facciali o linguaggio del corpo, e come tali segnali vengono utilizzati dalle diverse specie.

Di seguito la libera traduzione in Italiano dell’articolo scientifico “Context and prediction matter for the interpretation of social interactions across species”  di Theresa Epperlein, Gyula Kovacs, Linda S. Oña, Federica Amici, Juliane Bräuer, pubblicato nel December 7, 2022
https://doi.org/10.1371/journal.pone.0277783

Il contesto e la previsione sono importanti per l’interpretazione delle interazioni sociali tra le specie

Abstract 

Le previsioni sulle azioni future degli altri sono cruciali durante le interazioni sociali, per poter reagire in modo ottimale. Un altro modo per valutare tali interazioni è definire esplicitamente il contesto sociale delle situazioni e classificarle in base al loro contenuto affettivo. Qui investighiamo come gli esseri umani valutano le interazioni aggressive, giocose e neutre tra membri di tre specie: bambini, cani e macachi. Abbiamo presentato ai partecipanti umani brevi videoclip di interazioni nella vita reale di diadi delle tre specie e abbiamo chiesto loro di classificare il contesto della situazione o di prevedere l’esito dell’interazione osservata. I partecipanti hanno ottenuto risultati superiori al livello casuale nel valutare le situazioni sociali negli esseri umani, nei cani e nelle scimmie. La precisione con cui i partecipanti hanno previsto e classificato le situazioni dipendeva sia dalla specie che dal contesto. Contrariamente alla nostra ipotesi, i partecipanti non erano migliori nel valutare le situazioni aggressive rispetto a quelle giocose o neutre. È importante sottolineare che i partecipanti hanno ottenuto risultati particolarmente scarsi nel valutare il comportamento aggressivo dei cani. Inoltre, i partecipanti non erano migliori nel valutare le interazioni sociali degli esseri umani rispetto a quelle di altre specie. Discuteremo quale meccanismo gli esseri umani utilizzano per valutare le situazioni sociali e in che misura questa abilità può essere riscontrata anche in altre specie sociali.

Introduzione 

Una situazione tipica durante una passeggiata con il cane è che mentre due cani interagiscono, ai loro proprietari piace interpretare il comportamento mostrato dai loro cani in termini di significato e funzione. I proprietari spesso non sono d’accordo tra loro, poiché uno può vedere un’interazione giocosa mentre l’altro la percepisce come piuttosto aggressiva. Anche gli esseri umani ampiamente formati, come gli scienziati comportamentali che osservano professionalmente le interazioni umane o animali, a volte hanno difficoltà a definire e concordare il contesto in cui avviene un’interazione sociale (ad esempio giocosa o aggressiva) e quindi anche a comprendere il significato dei segnali comportamentali1

Per garantire una reazione ottimale in una determinata situazione, tuttavia, potrebbe essere più importante prevederne l’esito piuttosto che definirne il contesto di per sé. Utilizzando l’esempio con i due cani, determinare in che misura l’interazione è giocosa o aggressiva è meno critico che prevedere se i cani si attaccheranno e si faranno del male a vicenda nei secondi successivi. Per fare previsioni affidabili sugli eventi futuri e minimizzare i costi della sorpresa, gli esseri umani applicano la conoscenza acquisita durante le esperienze precedenti a nuove situazioni2. Poiché le previsioni accurate di solito portano a scelte di azione appropriate (ad esempio evitare rischi o identificare e reagire al pericolo, riconoscere opportunità vantaggiose o riflettere sugli errori3, hanno un effetto benefico sulla sopravvivenza. In altre parole, prevedere l’esito di una situazione è altamente adattivo.

Le previsioni sugli stati mentali intenzionali degli altri e sulle azioni future sono cruciali durante le interazioni sociali. Per attribuire stati intenzionali agli altri, gli esseri umani devono comprendere che le azioni sono dirette a uno scopo. Questa capacità, importante anche per prevedere gli esiti delle azioni, emerge in giovane età. I bambini intorno ai sei mesi sono già in grado di seguire lo sguardo mirato4, un’abilità che continua a svilupparsi nel corso degli anni. Ad esempio, Cannon e Woodward (2012) hanno scoperto che, nel loro primo anno, i bambini stanno già sviluppando una comprensione delle azioni dirette a un obiettivo per fare previsioni online sulle prossime azioni degli altri5. Osservano in modo predittivo un oggetto che un’altra persona aveva precedentemente raggiunto, anche quando la posizione dell’oggetto era cambiata. Per gli adulti è stato dimostrato che all’interno di scene complesse, gli spettatori tendono a focalizzare la loro attenzione sulle informazioni più significative e rilevanti per il compito6, rappresentate da uno schema di osservazione predittiva (ad esempio prevedere il punto di rimbalzo in una partita di tennis con fissazione diretta7). Questi risultati suggeriscono che i soggetti umani si affidano più allo sguardo predittivo (producendo movimenti oculari simili a quelli prodotti durante l’esecuzione del compito) che allo sguardo reattivo (cioè analizzando l’azione) quando osservano un compito, mostrando quanto siano importanti le previsioni delle azioni nella vita di tutti i giorni. Tuttavia, finora la maggior parte degli studi si è concentrata sul modo in cui gli esseri umani prevedono l’esito di complesse interazioni sociali tra i membri della propria specie8. Ma sarebbe anche altamente adattivo prevedere il comportamento di altre specie, in particolare quando esiste il rischio di lesioni (vedi anche l’esempio del cane sopra).

Sebbene questa lacuna nella letteratura esista ancora, si sa molto su come gli esseri umani definiscono il contesto sociale di una data situazione e da esso deducono il significato dei comportamenti dimostrati dai soggetti coinvolti nell’interazione. Un approccio tipico per gli scienziati comportamentali è quello di stabilire etogrammi codificando un numero enorme di interazioni e i loro esiti per interpretare i comportamenti. Quando vengono stabiliti questi etogrammi per un dato animale, è possibile identificare i contesti sociali riconoscendo comportamenti tipici come i gesti. Ad esempio, una ricerca approfondita ha consentito agli esperti di riconoscere in modo inequivocabile i contesti ludici negli scimpanzé individuando i tipici gesti di gioco, i contesti affiliativi nei corvi contrassegnati dall’offerta di oggetti non commestibili [18] e i contesti ludici nei cani. caratterizzati dal tipico arco da gioco [19].

Tuttavia, alcuni tipi di interazioni sono più difficili di altri da assegnare al contesto per i non esperti. Mentre nei primati [20] e nei cani [21] sembra generalmente facile per gli esseri umani interpretare una situazione sulla base dei segnali uditivi, per i segnali visivi il quadro è molto più complesso.

Ad esempio, la maggior parte delle persone non è esperta nell’interpretare gli stati emotivi degli scimpanzé [22], probabilmente perché gli scimpanzé hanno espressioni facciali che differiscono funzionalmente da quelle umane, nonostante le ovvie somiglianze fisiche [23, 24]. Inoltre, gli esseri umani generalmente hanno problemi a interpretare il linguaggio del corpo dei cani [22, 25–31]. Tali decisioni interpretative dipendono anche dal tipo di contesto. Ad esempio, Amici e colleghi (2019) hanno scoperto che i bambini di sei anni hanno prestazioni superiori al livello casuale nell’interpretazione delle emozioni dei cani. Nello specifico, i bambini erano più bravi nel rilevare le espressioni aggressive rispetto alle espressioni paurose e tristi. Infatti, da un punto di vista evolutivo, gli esseri umani dovrebbero prevedere esiti aggressivi meglio di quelli giocosi e neutrali (ad esempio [4, 6]), perché sapere quando un altro individuo di qualsiasi specie è aggressivo potrebbe fornire un chiaro vantaggio selettivo poiché si può reagire di conseguenza. ed evitare un incontro potenzialmente mortale.

Ma anche all’interno della specie umana non possiamo essere sicuri che tutti interpretiamo allo stesso modo i segnali emotivi degli individui coinvolti in una situazione. Mentre per molto tempo si è ritenuto che le emozioni umane fossero universali [32], studi più recenti hanno dimostrato che esistono enormi differenze culturali nel modo in cui le emozioni vengono espresse, interpretate ed etichettate [33-38].

Nel complesso, questi studi forniscono la prova che gli esseri umani possono prestare attenzione selettivamente al contesto emotivo di una situazione sociale per valutarlo e fare previsioni sui possibili risultati futuri. Tuttavia, i risultati degli studi sopra menzionati non consentono di trarre conclusioni affidabili sulla nostra capacità di prevedere le interazioni sociali intra e interspecifiche in ambienti naturali dinamici. Nel presente studio, abbiamo quindi mirato a testare la capacità di partecipanti adulti sani di valutare varie situazioni sociali tra membri di tre specie. A questo scopo, abbiamo presentato brevi videoclip di tre diverse interazioni nella vita reale (aggressiva, neutrale e giocosa) di diadi di cani, scimmie (macachi) e bambini umani. Abbiamo quindi chiesto ai partecipanti di classificare il contesto della situazione, ad es. se fosse aggressivo, neutrale o giocoso – o per prevedere l’esito delle interazioni osservate. I cani sono stati scelti per valutare le interazioni interspecifiche perché hanno vissuto a stretto contatto con gli esseri umani per un massimo di 30.000 anni e hanno subito uno speciale processo di addomesticamento [39]. I macachi sono stati scelti per la loro parentela come specie di primati.

Abbiamo ipotizzato che gli esseri umani avrebbero prestazioni superiori al livello casuale nel prevedere l’esito delle interazioni sociali in tutte le specie, poiché ciò migliora la capacità di reagire di conseguenza ed economizza lo sforzo cognitivo, il che è benefico per la sopravvivenza. In secondo luogo, abbiamo ipotizzato che i partecipanti avrebbero ottenuto risultati migliori nel prevedere l’esito di un’interazione rispetto alla categorizzazione del contesto, poiché il primo compito è più importante per la sopravvivenza e quindi più adattivo del secondo. In terzo luogo, abbiamo ipotizzato che le prestazioni nella valutazione delle interazioni sociali varierebbero a seconda del contesto. In particolare, ci aspettavamo che i partecipanti avrebbero ottenuto risultati migliori nel valutare il contesto e nel prevedere l’esito di situazioni aggressive rispetto a quelle giocose e neutre, poiché questo è altamente adattivo. Infine, abbiamo ipotizzato che gli esseri umani sarebbero più bravi a valutare le interazioni sociali tra i membri della propria specie a causa del vantaggio intrinseco intra-specie, vale a dire che interagiamo più frequentemente con altri esseri umani che con altre specie.

Metodo

Soggetti 

Abbiamo testato 92 partecipanti (30 uomini e 62 donne) di età compresa tra 19 e 73 anni (media 31,4 anni). I partecipanti sono stati assegnati in modo casuale a uno dei due compiti sperimentali, ovvero classificare il contesto o prevedere l’esito dei videoclip. Ciò ha prodotto due gruppi di 46 partecipanti. I test si sono svolti in diversi luoghi, soprattutto presso l’Università Friedrich Schiller e presso MPI for the Science of Human History di Jena, ma talvolta anche in luoghi privati. Uno sperimentatore era sempre presente per osservare la procedura e rispondere a tutte le possibili domande.

Lo studio è stato approvato dal comitato etico dell’Università di Jena e della Società Max Planck ed è stato condotto in conformità con le linee guida e i regolamenti pertinenti. I partecipanti hanno preso parte su base completamente volontaria e non sono stati ricompensati per aver preso parte agli esperimenti. Il consenso informato scritto è stato ottenuto da tutti i soggetti prima dell’inizio dell’esperimento. Le informazioni sugli scopi precisi dello studio sono state fornite ai partecipanti solo dopo il completamento dell’esperimento. Nel caso in cui i partecipanti fossero interessati, è stato loro consentito di guardare la versione lunga dei videoclip, compreso il risultato (NdT, per la visione dei videoclip consultare l’articolo originale  in inglese). 

Stimoli

In totale sono stati preparati 54 videoclip, 18 per ciascuna delle specie oggetto dello studio: cani, scimmie e bambini umani. Ciascuna delle clip conteneva un’interazione naturale non verbale tra 2 conspecifici (in alcune clip era presente un terzo conspecifico, nel qual caso ai partecipanti veniva chiesto di focalizzare la loro attenzione sui due conspecifici rilevanti). Il numero totale di clip è stato suddiviso in due set comparabili contenenti 27 clip ciascuno.

Le clip sono state selezionate da tre ricercatori con precedente vasta esperienza di lavoro con cani, scimmie ed esseri umani (JB, LSO, FA). Abbiamo definito 3 contesti: un contesto neutro (Neutro; cioè nessuna interazione sociale tra i partner, ad esempio due scimmie che mangiano mele una accanto all’altra), un contesto aggressivo (Aggressivo; cioè un’interazione negativa con comportamenti aggressivi o agonistici tipici della specie tra i partner, ad esempio un cane che difende un giocattolo) e un contesto ludico (Giocoso; cioè un’interazione positiva con comportamenti di gioco tipici della specie, ad esempio bambini che giocano a nascondino). Inoltre, tre ulteriori esperti per ciascuna specie, ciechi rispetto agli obiettivi dello studio, hanno classificato il contesto di ciascuna clip in modo indipendente e hanno concordato con la categorizzazione degli autori (ovvero accordo dell’83% tra specie e clip).

Le clip di cani includevano razze diverse registrate mentre interagivano liberamente in giardini o parchi per cani. Le clip di bambini includevano bambini pre-linguistici e pre-adolescenti (da 1 a 10 anni). Clip di macachi includevano macachi berberi (Macaca sylvanus) ospitati a Kintzheim in Francia, registrati durante le interazioni naturali nel loro gruppo. Il filmato includeva vocalizzazioni, ma nessuna interazione verbale (ad eccezione di singole parole nel caso della registrazione di bambini umani) per renderli paragonabili tra esseri umani e animali non umani. Il materiale video è stato fornito dagli autori dello studio e da volontari che hanno dato il permesso di utilizzare le riprese per scopi scientifici. (I genitori dei bambini raffigurati negli esempi di videoclip hanno fornito il consenso informato scritto come indicato nel modulo di consenso PLOS per pubblicare la loro immagine insieme al manoscritto).

Abbiamo preparato 54 clip in totale: sei clip per ciascuno dei tre contesti per ciascuna delle tre specie (6 clip x 3 contesti x 3 specie). I videoclip erano costituiti da due parti, di cui solo la prima veniva mostrata ai partecipanti. La prima parte della clip, della durata da 2 a 5 secondi, includeva informazioni sulla natura delle seguenti interazioni, inclusi segnali sociali come espressioni facciali e posture del corpo. La clip è stata interrotta 10 fotogrammi prima che un’interazione sociale avesse fine (vedi file S1 e video S1–S9). Pertanto, ogni interazione poteva finire in tre modi diversi:

  • Aggressivo: uno dei due individui ha effettuato un segnale/azione aggressivo nei confronti dell’altro (es. postura rigida del corpo nei cani, bocca aperta nelle scimmie, movimento improvviso verso il partner nei bambini);
  • Giocoso: uno dei due individui ha effettuato un segnale/azione giocoso nei confronti dell’altro (es. inchino giocoso nei cani, faccina giocosa nelle scimmie, sorriso nei bambini);
  • Neutrale: non è stato visualizzato alcun segnale/azione evidente/apparente.
  • La seconda parte della clip, che non è stata mostrata ai partecipanti ed è durata fino a 17 secondi, raffigurava l’interazione aggressiva, giocosa o neutra e il suo esito.

Gli sperimentatori hanno anche preparato delle frasi che descrivevano i risultati plausibili dei videoclip. Queste frasi indicavano come l’interazione poteva continuare, ad es. (a) un individuo attacca l’altro, (b) entrambi gli individui interagiscono scherzosamente tra loro o (c) entrambi gli individui continuano ciò che hanno fatto prima senza ulteriore interazione (per i dettagli, vedere anche il file S1). Quando possibile, ciascuna di queste tre frasi preparate illustrava uno dei contesti, vale a dire una possibilità era giocosa, una neutra e una aggressiva.

Procedura 

Ogni partecipante è stato assegnato in modo casuale a uno dei due gruppi predeterminati e gli sono state presentate 27 clip. Prima dell’inizio del test, lo sperimentatore ha spiegato le procedure di base del test e ha distribuito un foglio di codifica.

Durante il test, ai partecipanti è stata presentata una presentazione PowerPoint composta da un videoclip per diapositiva, che potevano guardare un massimo di due volte. A un gruppo è stato assegnato il compito di classificare il contesto della clip (ovvero Neutrale, Aggressivo o Giocoso). L’altro gruppo aveva il compito di prevedere l’esito della situazione. In quel caso, ogni diapositiva con una clip era seguita da una diapositiva con frasi preparate dagli sperimentatori che descrivevano i tre possibili risultati (vedi sopra). I partecipanti dovevano selezionarne uno e annotare le loro risposte sul foglio di codifica. I partecipanti hanno impiegato 20-30 minuti per guardare tutti i clip e completare le attività.

Progettazione e codifica 

Ad ogni partecipante sono stati presentati 27 videoclip (3 specie x 3 contesti x 3 clip per contesto) in ordine casuale. Come accennato in precedenza, ciascun partecipante è stato assegnato in modo casuale a uno dei due gruppi predeterminati: i partecipanti del gruppo 1 hanno classificato il contesto e i partecipanti del gruppo 2 hanno selezionato l’esito. La metà dei partecipanti di ciascun gruppo è stata testata con un set di stimoli preparato e l’altra metà è stata testata con l’altro set di stimoli, per escludere possibili effetti delle clip. Dopo aver completato il compito principale, i partecipanti sono stati testati anche nell’altro compito. Pertanto, nel gruppo di contesto i partecipanti hanno predetto anche l’esito, mentre nel gruppo di esito i partecipanti hanno anche classificato il contesto. Tuttavia, poiché i due compiti non sono indipendenti l’uno dall’altro, segnalato dai vari effetti significativi dell’ordine del compito e dalla sua interazione con le altre variabili, qui consideriamo i due gruppi di partecipanti indipendentemente l’uno dall’altro e presentiamo solo l’analisi del compito nel quale i partecipanti si sono cimentati per primo (per ulteriori informazioni, vedere il file S1).

Per il primo gruppo abbiamo valutato Scelta del contesto (ovvero quale contesto è stato selezionato: Giocoso, Neutrale o Aggressivo) e Correzione del contesto (se il contesto selezionato era corretto secondo la nostra classificazione). Per il secondo gruppo abbiamo valutato la scelta del risultato (ovvero quale risultato è stato selezionato tra le tre possibilità) e l’esito corretto (se il risultato selezionato era corretto).

Analisi statistiche 

Abbiamo calcolato la media delle prestazioni di ciascun partecipante del gruppo 1 nel categorizzare il contesto per specie e contesto, e delle prestazioni di ciascun membro del gruppo 2 nel prevedere l’esito per ciascuno per specie e contesto.

I dati sono stati analizzati con un’ANOVA con specie (3) e contesto (3) come soggetti all’interno e tipo di compito (2, contesto o esito) come tra fattori soggettivi. I test post-hoc sono stati eseguiti utilizzando la correzione di Bonferroni. Per verificare se i risultati sono significativamente diversi dal caso (33%) abbiamo utilizzato un test t su un campione. Per correlare le prestazioni dei partecipanti abbiamo utilizzato la correlazione di Pearson.

Risultati 

La Figura 1 presenta i punteggi medi di categorizzazione del contesto e la Figura 2 presenta le previsioni medie dei risultati.

journal.pone.0277783.g001
Fig 1. Depicts the average correct responses for the context identifications for each species and context in group 1.

 

journal.pone.0277783.g002
Fig 2. Depicts the average performance of the participants for the estimation of the future outcome of the interactions for each species and context in group 2.


I partecipanti hanno ottenuto risultati simili nel prevedere l’esito e nel categorizzare il contesto (effetto principale del tipo di compito: F(1, 90) = 8.70e-4, p = 0.977; η2 = 9.67e-6). Tuttavia, è stata riscontrata una significativa interazione a 3 vie tra specie, contesto e tipo di compito (F(4.360) = 11,160, p < ,001; η2 = 0,110), indicando che
le prestazioni dei partecipanti nei due gruppi differivano a seconda della specie e dell’esito. Inoltre, è stata riscontrata un’interazione significativa tra specie e tipo di compito, indicando che i partecipanti ai due gruppi hanno mostrato prestazioni diverse a seconda della specie (F(2, 180) = 21,40, p < ,001; η2 = 0,192). Tuttavia, il contesto non ha influenzato le prestazioni dei partecipanti, poiché non vi è stata alcuna interazione significativa tra il tipo di compito e il contesto (F (2.180) = 0,943, p = 0,392; η2 = 0,110). Inoltre, abbiamo trovato un’interazione significativa tra specie e contesto (F(4.360) = 29,40, p < .001; η2 = 0,246), dimostrando che i partecipanti si sono comportati diversamente per le tre specie e questo effetto dipendeva dal contesto. Infine, le prestazioni erano diverse per le tre specie (effetto principale delle specie: F(2.180) = 17,44, p < 0,001; η2 = 0,162), con tutti i partecipanti che si comportavano meglio con i primati che con i cani. Anche le prestazioni erano diverse per i tre contesti principali (effetto principale del contesto: F(2.180) = 66,51, p < 0,001; η2 = 0,425).Per i confronti rispetto al livello di casualità e per il confronto a coppie consideriamo innanzitutto i due tipi di compiti (testati nei gruppi) separatamente. Quindi presentiamo i confronti rilevanti tra i gruppi.

Decisioni sul contesto

I partecipanti hanno identificato il contesto dell’interazione sociale nei videoclip al di sopra del livello casuale nella maggior parte dei casi (P<0,002 per ogni confronto), ad eccezione delle interazioni aggressive nei cani e negli esseri umani.

Il contesto giocoso è stato classificato molto bene in circa il 70% dei test con interazioni uomo-cane, e le interazioni tra scimmie sono state classificate significativamente in modo peggiore rispetto a quelle tra esseri umani (Giocoso: uomo vs scimmia t(45) = 3,95, p = 0,013). Per le interazioni aggressive, i partecipanti hanno classificato correttamente il contesto per le scimmie più spesso che per i cani (Aggressivo: cane vs scimmia t(45) = -5,05, p<0,001). Allo stesso modo, per i risultati Neutri il contesto è stato classificato meglio per le scimmie che per cani e esseri umani (Neutro: cani vs scimmie t(45) = -7,91, p<0,001; umani vs scimmie t(45) = -9,14, p<0,001) .

All’interno delle specie abbiamo trovato i seguenti risultati: per i cani il contesto è stato classificato peggiore nel contesto Aggressivo, mentre le interazioni giocose e le interazioni neutre sono state categorizzate significativamente meglio (Aggressivo vs Giocoso t(45) = 6,91, p<0,001; Aggressivo vs Neutrale t (45) = -3,87, p = 0,019). Per gli esseri umani, il contesto Giocoso è stato classificato meglio di Neutro e Aggressivo (Giocoso vs Neutrale t(45) = 4,98, p<0,001, Giocoso vs Aggressivo t(45) = 6,95, p<0,001). Per le scimmie, il modello era diverso: il contesto è stato classificato meglio nelle situazioni neutre rispetto agli altri due contesti (Neutro vs Aggressivo t(91) = -6,77, p<0,001, Neutrale vs Giocoso t(45) = -8,29, p< 0,001). Tutti gli altri confronti rilevanti non erano significativi.

Per quanto riguarda le prestazioni individuali dei partecipanti, non abbiamo trovato correlazioni nelle prestazioni nella valutazione del contesto tra tutte e tre le specie (N = 46; P> = 0,215). Per la correlazione tra i contesti c’era solo una correlazione positiva significativa tra il contesto ludico e quello neutro (r = 0,31, P = 0,039), indicando che i partecipanti che avevano ottenuto buoni risultati nel valutare il contesto per l’interazione ludica erano bravi anche nel valutare le interazioni neutre. Le altre due correlazioni non erano significative (N = 46; P> = 0,387).

Decisioni sull’esito 

I partecipanti sono riusciti a prevedere l’esito delle interazioni in modo significativamente migliore rispetto al livello casuale per quasi tutti i casi (P<0,010 per ogni confronto), con due eccezioni. Le valutazioni dei partecipanti relative alle interazioni giocose nelle scimmie hanno mostrato una forte tendenza (p = 0,054), mentre le previsioni dei partecipanti sugli esiti delle interazioni aggressive nei cani erano significativamente al di sotto del livello di probabilità (p = 0,005).

Nel contesto giocoso, i partecipanti hanno previsto l’esito significativamente migliore per cani e esseri umani che per le scimmie (cani vs scimmie t(45) = 4,50, p = 0,001; umani vs scimmie t(45) = 4,77, p<0,001). Al contrario, nel contesto Aggressivo i risultati erano previsti significativamente migliori per i primati (cioè umani e scimmie) che per i cani (Aggressivo: umani vs cani t(45) = 4,50, p = 0,001; scimmie vs cani t(45) = – 5,45, p<0,001). Nel contesto Neutrale, il risultato era previsto migliore per gli esseri umani rispetto alle altre due specie (Neutro: umani vs cani t(45) = 5,86, p = 0,009; umani vs scimmie t(45) = 3,68, p = 0,038) .

All’interno delle specie abbiamo trovato i seguenti risultati: i partecipanti hanno predetto l’esito di un’interazione con il cane in un contesto aggressivo rispetto al contesto giocoso e al contesto neutro: (Aggressivo vs Giocoso t(45) = 8,29, p<0,001, Aggressivo vs Neutrale t( 45) = -5,25, p<0,001). Per gli esseri umani si è verificato lo stesso schema: i partecipanti hanno predetto l’esito di un’interazione in modo peggiore in un contesto aggressivo rispetto al contesto giocoso e al contesto neutro (Aggressivo vs Neutrale t(45) = -6,64, p<0,001; Aggressivo vs Giocoso t( 45) = 4,00, p = 0,011). Per le scimmie i partecipanti hanno previsto meglio il risultato nel contesto Neutro rispetto al contesto Giocoso (Neutro vs Giocoso t(45) = -3,73, p = 0,032). Tutti gli altri confronti rilevanti non erano significativi.

Comparazione tra decisioni di contesto e di esito

In questa analisi post-hoc abbiamo confrontato le prestazioni nei due compiti (gruppo 1 che categorizza i contesti e gruppo 2 che prevede gli esiti) per gli stessi contesti e specie, poiché c’era un’interazione a 3 vie di specie, contesto e tipo di compito (vedi Sopra). Ci sono stati risultati significativi solo per il contesto Neutrale. In particolare, i partecipanti del gruppo 1 erano significativamente più bravi nel classificare il contesto delle interazioni tra scimmie rispetto ai partecipanti del gruppo 2 nel predire l’esito (t(45) neutro = 5,26, p<0,001). Al contrario, i partecipanti del gruppo 2 erano significativamente più bravi nel predire l’esito delle interazioni umane rispetto ai partecipanti del gruppo 1 nel categorizzare il contesto (Neutro t(45) = -6,80, p<0,001).

Per quanto riguarda la performance individuale abbiamo trovato correlazioni positive tra la previsione dell’esito delle interazioni sociali tra tutte e tre le specie (N = 46; bambini e cani: r = 0,35, P = 0,018; bambini e scimmie: r = 0,56, P<0,001, scimmie e cani: r = 0,48, P = 0,001), indicando che i partecipanti che erano abili predittori per una specie, hanno ottenuto buoni risultati anche per le altre due specie. Abbiamo anche trovato correlazioni positive nella previsione degli esiti  tra tutti e tre i contesti (N = 46; giocoso e aggressivo: r = 0,56, P<0,001; giocoso e neutrale: r = 0,43, P = 0,003, neutrale e aggressivo: r = 0,56, P<0,001), indicando che i partecipanti che erano abili predittori per un contesto, hanno ottenuto buoni risultati anche per gli altri contesti.

Discussione

I partecipanti al nostro studio hanno ottenuto punteggi superiori al livello casuale nel prevedere situazioni sociali negli esseri umani, nei cani e nelle scimmie. Di fronte a una scelta tra tre risultati, i partecipanti hanno selezionato quello corretto nel 50-80% delle interazioni, come previsto dalla nostra prima ipotesi. Pertanto, per la maggior parte delle nove situazioni i partecipanti erano in grado di prevedere l’esito delle interazioni sociali per tutte le specie.

Tuttavia, i nostri dati non supportano la nostra seconda ipotesi, poiché i partecipanti che prevedevano l’esito di un’interazione sociale in generale non hanno ottenuto risultati migliori rispetto ai partecipanti che avevano categorizzato il contesto emotivo dell’interazione. Solo nelle interazioni umane neutre i partecipanti hanno ottenuto risultati migliori nel prevedere gli esiti rispetto alla categorizzazione del contesto. Ciò dimostra che i contesti possono effettivamente essere ambigui, in particolare per le interazioni umane [vedi anche 38]. Suggerisce inoltre che prevedere l’esito di una determinata situazione può talvolta essere più costruttivo che semplicemente categorizzarne il contenuto affettivo. Sorprendentemente, c’è stata una situazione in cui i partecipanti hanno classificato il contesto meglio che prevederne l’esito, ad es. in situazioni neutre con le scimmie. In questo caso, la prestazione nella categorizzazione del contesto è stata molto elevata, superiore al 90%, mentre le previsioni sugli esiti erano circa il 60%. Pertanto, categorizzare il contesto può essere utile in generale, ma a seconda della situazione e della specie, categorizzare o prevedere può essere più accurato. Ovviamente questi due compiti non sono del tutto indipendenti l’uno dall’altro. Quando i partecipanti prendono una decisione sul potenziale esito di una situazione, è molto probabile che considerino anche il contesto sociale, e quando il loro compito è valutare il contesto, potrebbero farlo anche tenendo conto in parte del suo esito. Tuttavia, a volte gli esseri umani sembrano considerare il contesto e il risultato in modo indipendente. In una situazione quotidiana potrebbero, ad esempio, solo speculare sul risultato senza pensare a come definire il contesto. Potrebbe anche essere importante in quale ordine le due attività vengono testate sperimentalmente (vedi file S1). Per indagare ulteriormente tale questione, gli studi futuri dovrebbero concentrarsi su un contesto e una specie per escludere possibili effetti di interazione tra questi fattori.

Gli studi futuri dovrebbero anche tenere conto delle differenze individuali. I partecipanti al nostro studio che erano particolarmente abili nel prevedere l’esito per una specie o per un contesto, hanno ottenuto buoni risultati anche per le altre specie o in altri contesti. Pertanto, ci sono persone che sono abili predittori delle interazioni sociali in generale, indipendentemente dalla specie e dal contesto. È interessante notare che non abbiamo trovato tale correlazione per valutare il contesto, indicando anche che i contesti possono effettivamente essere ambigui.

La nostra terza ipotesi era che i partecipanti sarebbero stati complessivamente più bravi nel valutare le situazioni aggressive rispetto a quelle giocose e neutre, indipendentemente dalla specie. Non abbiamo trovato prove nei nostri dati per supportare questa ipotesi. Al contrario, i partecipanti hanno ottenuto risultati scarsi nel valutare il comportamento aggressivo dei cani. In particolare, hanno valutato i contesti aggressivi tra i cani a livello di probabilità e hanno previsto risultati al di sotto del livello di probabilità. Hanno anche valutato le interazioni aggressive nei cani peggiori di quelle giocose e neutre. Pertanto, il comportamento aggressivo dei cani non è ben riconosciuto. Inoltre, i partecipanti non erano in grado di prevedere cosa sarebbe potuto accadere dopo. Inoltre, altri studi hanno dimostrato che gli esseri umani hanno risultati sorprendentemente scarsi nel rilevare l’ansia e l’aggressività nei cani. Questo è molto probabilmente il motivo della relativa frequenza di episodi di morsi segnalati, poiché gli esseri umani non riescono a notare lo spostamento e i comportamenti di pacificazione dei cani prima di un attacco [44]. Un possibile metodo per prevenire gravi episodi di morsi potrebbe comportare che i potenziali proprietari di cani siano meglio istruiti sul comportamento del cane prima dell’adozione, poiché è stato anche scoperto che possedere un cane non migliora la capacità di valutare il comportamento del cane [13, 45].

È interessante notare che i partecipanti al nostro studio hanno anche sottovalutato le aggressioni umane. I partecipanti hanno valutato il contesto al di sotto del livello casuale e non sono riusciti a prevedere in modo affidabile l’esito delle interazioni aggressive, ottenendo risultati peggiori rispetto a contesti giocosi e neutri. È possibile che gli esseri umani siano prevenuti nel presumere buone intenzioni da parte di altri esseri umani e del “migliore amico dell’uomo”, impedendoci talvolta di riconoscere situazioni aggressive in queste specie.

In generale, la performance dei partecipanti dipendeva sia dalla specie che dal contesto. Pertanto, dobbiamo respingere la nostra quarta ipotesi secondo cui gli esseri umani saranno generalmente più bravi a valutare le interazioni sociali tra i membri della nostra stessa specie rispetto ad altre specie animali. Nel seguito considereremo separatamente i tre contesti. Per quanto riguarda il contesto ludico, i partecipanti hanno valutato la situazione meglio per i cani e gli esseri umani che per le scimmie. È possibile che i volti giocosi dei cani possano essere più facili da comprendere per gli esseri umani rispetto ai volti giocosi di altri primati [46]. Inoltre, altri studi hanno scoperto che gli esseri umani riconoscono più facilmente le emozioni positive dei cani .

Ciò potrebbe potenzialmente essere una conseguenza della co-domesticazione, il che significa che attraverso il processo di addomesticamento, gli esseri umani sono diventati più bravi a valutare quando un cane sta giocando e quindi non è minaccioso. Tuttavia, in altri studi non abbiamo trovato prove che gli esseri umani abbiano una tendenza innata a comprendere i cani, in particolare quando si tratta di interazioni aggressive. 

Inoltre, contrariamente alla nostra quarta ipotesi, i partecipanti non erano migliori nel valutare le interazioni sociali degli esseri umani rispetto a quelle delle scimmie e dei cani. (Questo valeva solo per prevedere il risultato in un contesto neutrale.) Pertanto, non abbiamo trovato una chiara differenza tra le specie.

Si potrebbe sostenere che le nostre clip non erano rappresentative dei comportamenti delle specie, o che l’intensità percepita dei contesti emotivi potrebbe differire tra le clip, o che alcune clip potrebbero non avere sufficienti informazioni specifiche del contesto per essere valutate con successo dai partecipanti. Tuttavia, le clip sono state selezionate con cura per eliminare i pregiudizi nei confronti di qualsiasi specie. In effetti, ogni clip è stata valutata correttamente sia per il contesto che per il risultato da almeno 3-23 partecipanti, indicando che le clip contenevano sufficienti informazioni specifiche sul contesto per essere valutate con successo, ma non erano autoesplicative (vedere il file S1 per i dettagli). Ad esempio, le prestazioni sono state scarse per ogni clip di cane aggressivo, indicando che le clip erano paragonabili tra loro e che gli esseri umani non sono molto bravi nel valutare le interazioni dei cani aggressivi. Crediamo che i vantaggi della nostra decisione di utilizzare clip di interazioni sociali reali superino gli svantaggi di una possibile diversa intensità delle situazioni emotive. Gli studi futuri dovrebbero controllare la forza apparente del contesto emotivo utilizzando dei criteri; per esempio, se c’è o meno contatto fisico tra i soggetti.

Una questione aperta che emerge dal presente studio è come funziona esattamente la valutazione della situazione sociale da parte degli esseri umani. Uno studio recente ha utilizzato il tracciamento oculare dei partecipanti umani mentre guardavano video clip con espressioni emotive naturalistiche di cani o esseri umani. Lo studio ha rilevato che, sebbene gli stati emotivi dei cani siano più evidenti nei segnali corporei, gli esseri umani si concentravano principalmente sulla testa dei soggetti nel video. Un altro studio ha scoperto che quando vengono presentate solo le espressioni facciali dei primati e dei cani, i partecipanti si concentrano prevalentemente sugli occhi umani e sulle bocche degli animali. In particolare, per giudicare le grandi scimmie sarebbe utile se gli osservatori umani si affidassero piuttosto alle vocalizzazioni, poiché le scimmie esprimono intenti aggressivi principalmente attraverso le vocalizzazioni. Gli studi futuri dovrebbero utilizzare questionari per scoprire quali caratteristiche utilizzano i partecipanti per valutare tale interazione sociale e, cosa più importante, per trovare modi per migliorare le prestazioni dei partecipanti.

L’abilità di percepire e anticipare azioni finalizzate a uno scopo non sembra essere unicamente umana. Le grandi scimmie, ad esempio, sono in grado di fare previsioni in diretta basate sugli obiettivi delle azioni di altri individui. Kano e Call (2014) hanno testato le grandi scimmie con un esperimento di tracciamento oculare in cui le scimmie hanno familiarizzato con filmati che mostrano una mano umana che si allunga per afferrare uno dei due oggetti. Nell’evento di prova le posizioni degli oggetti sono state scambiate e la mano ha raggiunto in modo incompleto gli oggetti. Le scimmie guardavano in modo predittivo l’oggetto obiettivo familiare piuttosto che la posizione familiare quando osservavano l’azione della mano nell’evento di prova. Pertanto, analogamente ai bambini umani, le grandi scimmie fanno previsioni online basate su obiettivi delle azioni di altri individui. Per confrontare la capacità di previsione degli esseri umani e dei primati non umani, Myowa-Yamakoshi, Scola e Hirata (2012) hanno esaminato i movimenti oculari anticipatori nei neonati, negli adulti e negli scimpanzé. L’esperimento ha dimostrato che gli scimpanzé anticipano gli obiettivi dell’azione allo stesso modo degli esseri umani, anche se gli scimpanzé utilizzavano metodi diversi per scansionare le azioni dirette ad uno scopo. Inoltre, ci sono prove che i cani possono percepire le azioni umane come dirette a un obiettivo. Recenti esperimenti hanno anche utilizzato il tracciamento oculare sugli animali per scoprire come osservano le espressioni emotive in altre specie. I cani, ad esempio, si concentrano principalmente sui segnali del corpo quando osservano le espressioni emotive sia dei conspecifici che degli esseri umani. I macachi rhesus esplorano i volti umani e delle scimmie in modo diverso rispetto ai volti degli scimpanzé e dei cani, indicando che la loro esperienza con le specie osservate potrebbe avere un ruolo. Pertanto, gli animali sono anche in grado di valutare le interazioni sociali naturali nella propria specie e in quelle di altre specie, sebbene a volte possano utilizzare meccanismi diversi rispetto agli esseri umani.

Per riassumere, dimostriamo che gli esseri umani si comportano al di sopra del livello casuale nel valutare le interazioni sociali naturali negli esseri umani, nei cani e nelle scimmie, anche senza precedenti esperienze speciali con le specie non umane. Quanto bene gli esseri umani prevedono gli esiti e classificano le situazioni dipende dalla specie e dal contesto. Gli esseri umani non sono più bravi a valutare le interazioni sociali della propria specie rispetto ad altre specie. Sorprendentemente, i partecipanti hanno ottenuto risultati particolarmente scarsi nel valutare il comportamento aggressivo dei cani. Pertanto, i comportamenti aggressivi nei cani non sono ben riconosciuti e gli esiti delle interazioni aggressive tra cani sono difficili da prevedere per la persona media.

  1. Hobaiter C, Byrne Richard W. The Meanings of Chimpanzee Gestures. Current Biology. 2014;24(14):1596–600. pmid:24998524; Liebal K, Oña L. Mind the gap –moving beyond the dichotomy between intentional gestures and emotional facial and vocal signals of nonhuman primates. Interaction Studies. 2018;19(1–2):121–35.
    ↩︎
  2. Friston K, Kilner J, Harrison L. A free energy principle for the brain. Journal of Physiology-Paris. 2006;100(1):70–87. pmid:17097864; Brown E, Brüne M. The role of prediction in social neuroscience. Frontiers in Human Neuroscience. 2012;6. ↩︎
  3. Wolpert DM, Ghahramani Z, Jordan MI. An internal model for sensorimotor integration. Science. 1995;269(5232):1880–3. pmid:7569931; Greve PF. The role of prediction in mental processing: A process approach. New Ideas in Psychology. 2015;39:45–52. ↩︎
  4. In realtà i movimenti oculari proattivi e diretti ad uno scopo mentre osservano azioni manipolative svolte da altri è una capacità che emerge nei bambini più tra i 9 e 12 mesi. Si è scoperto che l’inizio della capacità dei bambini di prevedere lo scopo dell’azione degli altri è sincronizzato con l’inizio della loro capacità di eseguire quell’azione. Inoltre, esisteva una relazione di corrispondenza tra capacità di previsione dell’azione e capacità motoria della stessa azione. I nostri risultati indicano che la capacità di prevedere gli obiettivi di azione degli altri richiede una corrispondente abilità motoria, fornendo prova ontogenetica di un processo di corrispondenza diretta da parte di un sistema di neuroni specchio. ↩︎
  5. Cannon EN, Woodward AL. Infants generate goal-based action predictions. Developmental science. 2012;15(2):292–8. ↩︎
  6. Henderson JM. Gaze Control as Prediction. Trends in Cognitive Sciences. 2017;21(1):15–23 ↩︎
  7. Flanagan JR, Johansson RS. Action plans used in action observation. Nature. 2003;424(6950):769–71. ↩︎
  8. Donnier S, Kovács G, Oña LS, Bräuer J, Amici F. Experience has a limited effect on humans’ ability to predict the outcome of social interactions in children, dogs and macaques. Scientific Reports. 2020;10(1):21240.  ↩︎