Metodi
Documentazione tecnica dell'algoritmo di identificazione, delle fonti dei dati e della metodologia alla base della piattaforma.
Origine dei dati
I dati tassonomici e morfologici alla base della chiave derivano dalla tesi di laurea magistrale di Francesco Simone Mensa (Roma Tre, 2016-2017). Le matrici sono state validate dal Dr. Fabrizio Rigato (MSNM, 2015).
Tesi FormiKey
Matrici di caratteri costruite con Mesquite in formato NEXUS per 43 generi e 80 specie della città di Roma.
Leggi su ResearchGate →Checklist Schifani 2022
Riferimento tassonomico principale: 267 specie italiane in 7 sottofamiglie e 42 generi.
DOI: 10.21426/b637155803 →Immagini
Specimen da AntWeb.org (California Academy of Sciences, CC BY-SA 3.0). Illustrazioni anatomiche di Maurizio Mei.
Matrice di caratteri
La chiave utilizza una matrice a 39 caratteri morfologici per 43 generi. Ogni carattere è classificato per:
- Regione del corpo: testa, torace (mesosoma), peziolo, gastro, zampe, antenne
- Difficoltà di osservazione: facile, medio, difficile
- Ambito tassonomico: alcuni caratteri sono specifici per una sottofamiglia
Ogni cella contiene uno o più stati possibili (supporto al polimorfismo: {0, 1}).
Il valore ? indica dato mancante e viene trattato come compatibile.
Scoring multi-accesso pesato
A differenza delle chiavi dicotomiche tradizionali, i caratteri possono essere selezionati in qualsiasi ordine e i generi non vengono eliminati ma classificati per compatibilità.
Pesatura con entropia di Shannon
Il peso di ogni selezione è calcolato come l'entropia di Shannon (information gain) del carattere al momento della selezione. Un carattere che divide equamente i generi ha alta entropia (alto valore diagnostico).
H(c) = - ∑i pi · log2(pi)
dove pi è la frequenza dello stato i tra i generi candidati rimanenti
Calcolo dello score per genere
score(g) = (Wtot - mismatch · Wavg) / Wtot,eff
- Wtot = somma dei pesi dei caratteri per cui il genere ha dati
- Wavg = peso medio per carattere
- mismatch = numero di caratteri non compatibili
- Wtot,eff = peso totale effettivo, inclusa penalità per dati mancanti
Penalizzazione per sottofamiglia
Quando tutti i caratteri selezionati appartengono alla stessa sottofamiglia, il sistema inferisce una sottofamiglia implicita. I generi di altre sottofamiglie ricevono una penalità maggiore per dati mancanti (fattore 0.8 vs. 0.3).
Tolleranza agli errori
L'utente può impostare una tolleranza (0-3 mismatch ammessi). Con tolleranza 1 (default), un genere che non corrisponde a un singolo carattere resta visibile con score ridotto, compensando errori di osservazione comuni.
Suggerimento del carattere successivo
Dopo ogni selezione, il sistema calcola l'entropia di Shannon per i caratteri non utilizzati. Il carattere con massima entropia (massimo potere discriminante) viene evidenziato come "Carattere consigliato".
Indicatori in tempo reale
La chiave fornisce quattro indicatori per guidare l'utente durante l'identificazione.
Barra di progresso
Combinazione pesata (70/30) di concentrazione dei candidati e numero di caratteri usati.
Diagnosi
Livello di confidenza (alto/medio/basso) basato sul distacco tra il primo e il secondo candidato.
Badge impatto (-N)
Per ogni stato non ancora selezionato, mostra quanti generi verrebbero esclusi dalla scelta.
Carattere consigliato
Il carattere con la massima entropia tra quelli non utilizzati, evidenziato con ★.
Limitazioni
La chiave opera a livello di genere, non di specie.
I caratteri sono definiti per la casta operaia. Regine e maschi richiederebbero matrici separate.
Le matrici risalgono al 2015-2017. Revisioni tassonomiche successive non sono ancora integrate.
Le specie coprono la città di Roma. L'espansione all'intera fauna italiana è in corso.
Citazione
Piattaforma
Mensa, F.S. (2026). Formiche d'Italia — Piattaforma interattiva per l'identificazione dei generi di Formicidae italiani. https://formicheditalia.it
Tesi originale
Mensa, F.S. (2017). Chiave interattiva per il riconoscimento dei generi di Formicidae italiani e delle specie della città di Roma. Tesi di laurea magistrale, Università Roma Tre. ResearchGate →
Prova la chiave
Usa l'algoritmo descritto sopra per identificare un genere di formica.
Apri la chiave