Prevedere cosa accadrà nei prossimi mesi, rispetto alle professioni più richieste dal mercato del lavoro, è molto complesso perché i modelli, i dati e le variabili a disposizione non sono adeguati e sufficientemente stabili per consentire di descrivere rigorosamente il fenomeno attuale. Si tratta di una situazione nuova e imprevedibile, che evolve senza una vera e propria logica e dipende da numerosi fattori sconosciuti, non ultimo i provvedimenti del governo riguardanti il lavoro, i lavoratori e i datori di lavoro pubblici e privati. I dati a disposizione, provenienti  dalle Comunicazioni Obbligatorie (CO) e dalla rilevazione continua sulle Forze Lavoro, consentono di capire molto bene cosa sia accaduto durante il periodo di chiusura, come rappresentato efficacemente nella serie di pubblicazioni Misure dell’osservatorio Veneto Lavoro. Disegnare con lo stesso rigore lo scenario futuro non è possibile e rischierebbe di aggiungere incertezza alle incertezze esistenti. Cosa è possibile fare, allora? Sulla base delle offerte di lavoro pubblicate sul web, analizzando la situazione attuale e i trend dei mesi scorsi, è possibile fare alcune considerazioni utili alla rappresentazione dello scenario, senza la pretesa di richiamare un rigore metodologico che, in un momento storico estremamente mutevole, non sarebbe affidabile e credibile. Prima di scrivere questo articolo, che sintetizza il lavoro pubblicato sulla piattaforma www.iolavoro.info, mi sono chiesto a lungo se fosse o meno opportuno utilizzare le parole big data, per trattare un fenomeno che, per essere descritto, necessita di una grande quantità di dati. Poiché in questo momento si parla di big data anche quando si tratta di scrivere una lista della spesa un po’ più lunga del solito, ho deciso di fare una captatio benevolentiae, ben sapendo che i big data “veri” sono un’altra cosa rispetto al fenomeno di cui parlerò. La parola grande, o piccolo, e in questo la mia formazione da fisico non aiuta a prendere la questione alla leggera, non ha nessun significato se non viene specificato “rispetto a cosa”. Una formica è piccola rispetto a un elefante, ma è grande rispetto a un virus. Per questo, la notazione scientifica contempla gli ordini di grandezza, che consentono di avere un’idea esatta della “grandezza” fisica in esame. Così, se si parla di un oggetto che ha le dimensioni di 10^-9 metri si può fare un paragone con la grandezza di un atomo, mentre se si trattano distanze dell’ordine di 10¹¹ metri si può immaginare lo spazio che separa la terra dal sole. Per i dati non esiste un vero e proprio ordine di grandezza, che consenta di sapere quando “rientrano nella normalità” e quando sono “big”. In poche parole, non esiste un “rispetto a cosa”, o un riferimento certo e duraturo con cui effettuare dei confronti. Per questo, troppo spesso le parole big data, che hanno sicuramente un certo appeal sulle masse, si usano impropriamente e capziosamente (come nell’articolo che state leggendo). La mia idea è che i dati diventano big quando la loro raccolta e la loro elaborazione richiede risorse molto onerose, rispetto a quelle disponibili in un preciso momento storico, in termini di infrastrutture, strumenti, metodi e capacità di calcolo, per gestirne la quantità e la velocità di aggiornamento. Di conseguenza, le risorse richieste si possono considerare con buona approssimazione dei buoni indicatori di quanto i dati siano big. Negli anni ’80, raccogliere ed elaborare un dataset giornaliero contenente 100.000 record che occupasse uno spazio di 50 Mb era un’attività onerosa e in effetti, per le conoscenze e la tecnologia di quegli anni (i primi hard disk avevano una capienza di 5Mb), la parola big avrebbe potuto avere un senso. In un periodo in cui la quantità di dati è impressionante, penso all’IOT, alla telefonia, alle preferenze degli utenti raccolte dai colossi del web, il mercato del lavoro è interessato da un cambiamento, che, a dire la verità, è iniziato quando sono state introdotte le comunicazioni obbligatorie (CO), ovvero le comunicazioni telematiche attraverso le quali i datori di lavoro (pubblici e privati) segnalano le attivazioni, le cessazioni e le trasformazioni contrattuali al Ministero del Lavoro e alle regioni.

Si tratta di flussi di dati continui e consistenti che vengono raccolti attraverso un’infrastruttura costruita ormai più di dieci anni fa, quando le CO rientravano a pieno titolo tra i big data. Nel frattempo, il mondo si è trasformato: sono nati i servizi in cloud, i social network, Google e Amazon hanno cambiato l’economia e il modo di relazionarsi attraverso l’analisi di quantità di dati talmente consistenti e mutevoli da renderne difficile la quantificazione. Usare i big data per produrre statistiche ufficiali non è semplice: occorrono metodologie robuste, che non contemplino l’approccio classico di conduzione delle indagini (disegno del campione, raccolta dati, strutturazione e analisi delle informazioni, etc) o di trattazione degli archivi amministrativi. Le istituzioni che si occupano di statistiche ufficiali di solito non forniscono i dati di flusso, ma producono dati strutturati, sicuramente di qualità, che subiscono un processo di analisi e validazione affinché possano diventare “conoscenza”. Lo scotto da pagare per ottenere dati di qualità riguarda essenzialmente i tempi necessari al processo di analisi e diffusione I flussi di dati raccolti devono consolidarsi per diventare uno stock riferito a un arco temporale ben definito, che nella maggior parte dei casi descrive un fenomeno relativo a un arco temporale distante nel tempo. Si tratta di un limite che, oltre a far riflettere su come si sarebbe dovuto evolvere il ruolo delle istituzioni rispetto all’open data e alla fornitura dei dati di flusso, non consente di monitorare l’andamento dei fenomeni in tempo reale. I dati di flusso riguardanti il mercato del lavoro si possono suddividere essenzialmente in tre categorie:

Comunicazioni obbligatorie: vengono raccolte dal Ministero del Lavoro, contengono dati personali, che per essere rilasciati dovrebbero essere resi anonimi, e non sono disponibili in formato open né sotto forma di stock né tantomeno sotto forma di flussi.
Offerta di lavoro pubblico e privato: è presente sul web, in modalità totalmente destrutturata e localizzata su numerose piattaforme di settore.
Curriculum vitae: sono contenuti perlopiù all’interno delle piattaforme che si occupano dell’erogazione di servizi associati al lavoro (incontro domanda offerta)

La disponibilità di queste nuove fonti di dati è figlia del cambiamento sociale avvenuto negli ultimi anni: il “modo” di cercare lavoro è totalmente cambiato rispetto al passato. Gli annunci si consultano online, i cv si mettono in vetrina sui social network, le aziende affidano la ricerca di lavoratori qualificati ai cacciatori di teste e inseriscono le opportunità lavorative nei siti in cui si tenta di incrociare la domanda e l’offerta. In questo sistema, più o meno chiuso rispetto alle policy di diffusione adottate dalle diverse piattaforme, il linguaggio con cui si parla di professioni è totalmente destrutturato ed è subordinato alle mode e alla creatività delle aziende e dei lavoratori, che spesso inventano nuovi nomi per dare una diversa dignità a professioni che in realtà non hanno nulla di nuovo. Le istituzioni e il mondo della ricerca, invece, utilizzano dei sistemi classificatori attraverso i quali raccolgono i dati, li standardizzano e li analizzano. In Europa, per trattare i dati sulle professioni, esiste la ISCO (International Standard Classification of Occupations), il sistema classificatorio fornito dall’ILO (International Labour Organization), che in Italia prende il nome di CP2011 Classificazione delle professioni edizione 2011).

Alla CP2011 sono collegate numerose banche dati: le CO, l’indagine sulle professioni basata sul modello ONET, gli infortuni sul lavoro, gli sbocchi occupazionali dei corsi di laurea, l’indagine sulle forze lavoro, le retribuzioni e la riforma dei concorsi pubblici e dei piani di fabbisogno nel pubblico impiego. Per completare il panorama informativo, manca(va)no, oltre alla raccolta dei cv, l’analisi e la strutturazione e la rappresentazione dei dati relativi alle offerte di lavoro. Si tratta di un tassello essenziale, che consente di studiare un aspetto importante del mercato lavoro e di fornire dei cruscotti informativi utili ai cittadini, agli orientatori dei centri per l’impiego e ai decisori politici.

Raccogliere i dati relativi alle vacancies è un’operazione complessa: esistono numerosi motori di ricerca, alcuni con limitazioni riguardo al loro utilizzo, altri con API dedicate, alcuni dedicate alle aziende private, altri ai concorsi pubblici, ciascuno con criteri di ricerca diversi: il pericolo di trovare lo stesso dato replicato su diverse piattaforme è reale e introduce degli errori sistematici che influenzano negativamente le analisi. Inoltre, la strutturazione delle offerte di lavoro contenute in più dizionari eterogenei e diversificati introduce un ulteriore livello di complessità che, per non appesantire questo articolo, rimando a un approfondimento successivo. Basti sapere che per effettuare questa operazione è necessario l’impiego di un algoritmo in grado di individuare, ad esempio, l’offerta di lavoro denominata “SVILUPPATORE JAVA” e associarla all’Unità Professionale, il massimo livello di dettaglio della CP2011, 3.1.2.1.0 — Tecnici programmatori.

A questo punto, c’è da chiedersi “Quanto sono big i dati riguardanti le offerte di lavoro?”. La risposta sincera sarebbe “poco”, ma è possibile articolare una risposta meno sincera… che dipende sostanzialmente da due fattori:

le risorse a disposizione
la frequenza di raccolta

Un crawler ben strutturato, eliminando le duplicazioni, permette di acquisire circa 300.000 vacancies giornaliere: tante rispetto all’indagine statistica sulle forze lavoro, un’inezia rispetto ai tweet o al catalogo dei prodotti di Amazon. Poiché la frequenza con cui vengono aggiornate le vacancies non è molto elevata, avrebbe senso schedulare la raccolta compatibilmente con le reali necessità di analisi, allo scopo di ottimizzare ulteriormente la quantità di dati e di risorse impiegate. In entrambi i casi, è sufficiente un’architettura che contempli un nodo Elastic attraverso i suoi moduli Logstash, Elasticsearch e Kibana attraverso cui è possibile seguire il flusso logico schematizzato nella figura sottostante.

Tralasciando gli aspetti tecnologici, che meritano sicuramente approfondimenti ulteriori, è utile focalizzare l’attenzione sui risultati che si possono ottenere da un’analisi di questo tipo. In primo luogo, è possibile raggruppare i dati al massimo livello di aggregazione della CP2011 per capire quali sono le professioni più richieste all’interno di un singolo raggruppamento. Le professioni intellettuali e le professioni tecniche, al momento dell’analisi, rappresentano più del 60% dell’offerta.

Scendendo un po’ più nel dettaglio, e facendo un focus sui Grandi Gruppi, che si potrebbero intendere grossolanamente come delle macro aree tematiche in cui confluiscono un certo insieme di professioni, si può comprendere meglio la distribuzione degli annunci lavorativi rispetto alle Unità Professionali. Le rappresentazioni grafiche che seguono evidenziano, attraverso il diagramma a torta, la composizione percentuale relativa all’offerta lavorativa riferita all’Unità Professionale (le percentuali sono da intendersi rispetto al totale degli annunci acquisiti). Si tratta di una rappresentazione riferita al momento in cui è stato scritto quest’articolo, ma la situazione è in continua evoluzione ed è rappresentata in tempo reale sul sito www.iolavoro.info.

Tra le professioni intellettuali, l’offerta lavorativa per gli Analisti è progettisti di software rappresenta il 20,2% del totale, seguono gli Ingegneri elettronici e gli Ingegneri meccanici (7,4% e 7.0%). In generale, le offerte lavorative per le  professioni svolte in ambiti tecnologici ammontano a circa il 50% del totale. Sono molto richieste anche le figure associate alla gestione e al controllo delle imprese (Specialisti in contabilità, delle vendite, del controllo di gestione e delle risorse umane). Le professioni tecniche mostrano un andamento leggermente diverso: metà dell’offerta lavorativa è suddivisa tra i Contabili (15,1%),  i Tecnici programmatori (12,6%), gli Agenti di commercio (10,4%) e le Professioni sanitarie e infermieristiche (10,3%). Tra le Professioni qualificate nelle attività e nei servizi spiccano gli Esercenti delle vendite nei negozi e i Commessi nelle vendite al minuto (34,8%) seguiti dai Cuochi e dai Camerieri (18,9%).  Analizzando i dati a livello dell’Unità Professionale è possibile comprendere meglio e dettagliatamente  l’andamento nel tempo dell’offerta lavorativa e di conseguenza la “richiesta di professioni”. Le professioni che hanno sofferto meno nel periodo di lockdown appartengono perlopiù a quei settori che non sono stati sottoposti alla chiusura o riguardano attività svolte da remoto in smart working. Quest’ultimo aspetto rappresenta uno spunto di riflessione sul quale sarebbe necessario aprire un ampio capitolo...

Gli Analisti e progettisti di software, la cui richiesta è abbastanza uniforme sul territorio ma si concentra maggiormente a Roma, a Milano, a Torino e a Bologna, hanno addirittura subito un incremento della richiesta, presumibilmente a causa delle numerose attività svolte nei mesi di lockdown attraverso le piattaforme informatiche.

 

Le stesse considerazioni possono essere estese ai Tecnici programmatori: in questo caso, però, l’incremento è meno marcato, ma l’andamento evidenzia una crescita nei mesi di aprile e maggio e un lento e graduale  ritorno ai valori percentuali precedenti alla pandemia.

La quota di vacancies relativa ai Contabili e agli Agricoltori e operai agricoli specializzati di giardini e vivai, di coltivazioni di fiori e piante ornamentali è rimasta più o meno stabile, se si considerano le fluttuazioni statistiche e il naturale aumento delle richieste di operai specializzati nella cura dei giardini durante il periodo primaverile.

Le Professioni sanitarie infermieristiche, nei mesi di aprile e maggio, hanno fatto registrare una crescita di circa 3 punti percentuale rispetto al totale delle offerte lavorative. Un dato sicuramente interessante compatibile con l’emergenza sanitaria affrontata nel Paese.  Successivamente, si è verificata una lenta decrescita, che probabilmente, a meno di misure mirate nel settore sanitario, tornerà ad attestarsi intorno al 3%.

Il settore della ristorazione, come era prevedibile, ha registrato un crollo marcato delle vacancies (mediamente del 50% rispetto alle percentuali pre-covid). Soltanto nell’ultimo mese si evidenzia una netta ripresa, complice anche la stagione estiva, soprattutto nelle grandi città e nelle località turistiche. I trend per i cuochi, i camerieri e i baristi sono rappresentati nei tre pannelli di sintesi seguenti.

L’andamento è invece positivo e in crescita per numerose Unità Professionali appartenenti al Grande Gruppo degli artigiani e degli operai specializzati, in particolar modo nel settore dell’edilizia. Gli Idraulici, i Muratori e i Carpentieri hanno fatto registrare un incremento medio del 300% rispetto alla percentuale di vacancies presente sul web nel periodo precedente alla chiusura. C’è da dire che le aziende che assumono sono concentrate soprattutto al centronord e che l’offerta complessiva, per queste unità professionali, si attesta normalmente intorno allo 0,5% rispetto al totale.

Come è stato specificato ampiamente nell’introduzione, trarre delle conclusioni da questa analisi e fare previsioni sui possibili scenari futuri sarebbe un azzardo. Nella malaugurata ipotesi in cui si verifichi un secondo lockdown, alcuni settori, attualmente in crescita, potrebbero subire dei crolli improvvisi che influenzerebbero gli andamenti a breve e a lungo termine . È ancora troppo presto per fare delle previsioni attendibili, ma un monitoraggio continuo delle vacancies è sicuramente una fonte informativa molto ricca che si presta ad analisi di diverso tipo, soprattutto se associata a fonti più strutturate quali possono essere l’archivio delle Comunicazioni Obbligatorie o l’indagine Excelsior.

Condividi