Metodi

Documentazione tecnica dell'algoritmo di identificazione, delle fonti dei dati e della metodologia alla base della piattaforma.

Le basi

Origine dei dati

I dati tassonomici e morfologici alla base della chiave derivano dalla tesi di laurea magistrale di Francesco Simone Mensa (Roma Tre, 2016-2017). Le matrici sono state validate dal Dr. Fabrizio Rigato (MSNM, 2015).

Tesi FormiKey

Matrici di caratteri costruite con Mesquite in formato NEXUS per 43 generi e 80 specie della città di Roma.

Leggi su ResearchGate →

Checklist Schifani 2022

Riferimento tassonomico principale: 267 specie italiane in 7 sottofamiglie e 42 generi.

DOI: 10.21426/b637155803 →

Immagini

Specimen da AntWeb.org (California Academy of Sciences, CC BY-SA 3.0). Illustrazioni anatomiche di Maurizio Mei.

I dati

Matrice di caratteri

La chiave utilizza una matrice a 39 caratteri morfologici per 43 generi. Ogni carattere è classificato per:

  • Regione del corpo: testa, torace (mesosoma), peziolo, gastro, zampe, antenne
  • Difficoltà di osservazione: facile, medio, difficile
  • Ambito tassonomico: alcuni caratteri sono specifici per una sottofamiglia

Ogni cella contiene uno o più stati possibili (supporto al polimorfismo: {0, 1}). Il valore ? indica dato mancante e viene trattato come compatibile.

L'algoritmo

Scoring multi-accesso pesato

A differenza delle chiavi dicotomiche tradizionali, i caratteri possono essere selezionati in qualsiasi ordine e i generi non vengono eliminati ma classificati per compatibilità.

1

Pesatura con entropia di Shannon

Il peso di ogni selezione è calcolato come l'entropia di Shannon (information gain) del carattere al momento della selezione. Un carattere che divide equamente i generi ha alta entropia (alto valore diagnostico).

H(c) = - ∑i pi · log2(pi)

dove pi è la frequenza dello stato i tra i generi candidati rimanenti

2

Calcolo dello score per genere

score(g) = (Wtot - mismatch · Wavg) / Wtot,eff

  • Wtot = somma dei pesi dei caratteri per cui il genere ha dati
  • Wavg = peso medio per carattere
  • mismatch = numero di caratteri non compatibili
  • Wtot,eff = peso totale effettivo, inclusa penalità per dati mancanti
3

Penalizzazione per sottofamiglia

Quando tutti i caratteri selezionati appartengono alla stessa sottofamiglia, il sistema inferisce una sottofamiglia implicita. I generi di altre sottofamiglie ricevono una penalità maggiore per dati mancanti (fattore 0.8 vs. 0.3).

4

Tolleranza agli errori

L'utente può impostare una tolleranza (0-3 mismatch ammessi). Con tolleranza 1 (default), un genere che non corrisponde a un singolo carattere resta visibile con score ridotto, compensando errori di osservazione comuni.

5

Suggerimento del carattere successivo

Dopo ogni selezione, il sistema calcola l'entropia di Shannon per i caratteri non utilizzati. Il carattere con massima entropia (massimo potere discriminante) viene evidenziato come "Carattere consigliato".

Interfaccia

Indicatori in tempo reale

La chiave fornisce quattro indicatori per guidare l'utente durante l'identificazione.

Barra di progresso

Combinazione pesata (70/30) di concentrazione dei candidati e numero di caratteri usati.

Diagnosi

Livello di confidenza (alto/medio/basso) basato sul distacco tra il primo e il secondo candidato.

Badge impatto (-N)

Per ogni stato non ancora selezionato, mostra quanti generi verrebbero esclusi dalla scelta.

Carattere consigliato

Il carattere con la massima entropia tra quelli non utilizzati, evidenziato con ★.

Da sapere

Limitazioni

La chiave opera a livello di genere, non di specie.

I caratteri sono definiti per la casta operaia. Regine e maschi richiederebbero matrici separate.

Le matrici risalgono al 2015-2017. Revisioni tassonomiche successive non sono ancora integrate.

Le specie coprono la città di Roma. L'espansione all'intera fauna italiana è in corso.

Riferimenti

Citazione

Piattaforma

Mensa, F.S. (2026). Formiche d'Italia — Piattaforma interattiva per l'identificazione dei generi di Formicidae italiani. https://formicheditalia.it

Tesi originale

Mensa, F.S. (2017). Chiave interattiva per il riconoscimento dei generi di Formicidae italiani e delle specie della città di Roma. Tesi di laurea magistrale, Università Roma Tre. ResearchGate →

Prova la chiave

Usa l'algoritmo descritto sopra per identificare un genere di formica.

Apri la chiave