Data analysis flat icons collection

I 5+1 concetti statistici che tutti i data scientist dovrebbero conoscere

Abbiamo visto qui i 10 consigli utili per compilare al meglio il nostro CV ed affrontare con successo un colloquio di lavoro.

Oggi scopriremo insieme quali sono i 5 +1 concetti statistici che tutti i data scientist dovrebbero conoscere.

Pronti? Via!

 

 

1. La differenza tra popolazione e campione

La popolazione è l’insieme di tutti gli elementi di interesse per la ricerca statistica che si intende effettuare. Facciamo un esempio: vogliamo studiare i dati occupazionali in Europa. Bene, la nostra popolazione di riferimento comprenderà dunque tutte le persone con età compresa tra i 15 e i 64 anni che vivono in Europa.

A volte però raccogliere i dati per tutta la popolazione risulta difficile o molto dispendioso. Dunque, ricorriamo al campione. Il campione è un sotto insieme, diciamo una porzione rappresentativa della popolazione che vogliamo studiare. Campionare è utilissimo per condurre studi efficaci!

2. Teorema del Limite Centrale

Il teorema del limite centrale ci aiuta a giustificare l’uso della distribuzione normale per grandi campioni, anche nel caso in cui non sappiamo l’effettiva distribuzione sottostante. Vediamo il suo funzionamento con un esempio: vogliamo vedere qual è il voto medio con cui gli studenti statunitensi si laureano nel 2020. Sicuramente i dati da reperire sono molti, ma possiamo chiedere aiuto al Teorema del Limite Centrale. Prendendo infatti diversi campioni di studenti statunitensi appena laureati, la media ottenuta da questi campioni è approssimabile alla media che si otterrebbe studiando l’intera popolazione.

3. Indici di posizione: media, mediana e moda

Gli indici di posizione sono fondamentali nell’analisi statistica. Abbiamo una variabile e la vogliamo esplorare per conoscerla? Bene, in primo luogo è conveniente dare uno sguardo agli indici di posizione. Questi ci consentono di valutare la distribuzione della variabile che stiamo studiando. La media ci dice attorno a quale valore si concentra la distribuzione. La mediana è quel valore che taglia perfettamente a metà la distribuzione, corrisponde al secondo quartile della distribuzione. La moda, infine, ci indica quale valore compare con maggiore frequenza nella nostra distribuzione campionaria.

4. La distribuzione normale

La distribuzione normale è fondamentale per gli studi statistici.

Le distribuzioni di probabilità ci aiutano a capire, anche in maniera visiva, con quale probabilità effettivamente può verificarsi un evento. Sono fondamentali per gli studi predittivi.

La distribuzione normale ha la forma a campana, è largamente utilizzata in analisi statistica perché descrive in modo efficace molti fenomeni naturali. Le probabilità più elevate che un evento si verifichi si concentrano attorno al valore medio, e si riducono progressivamente quando ci spostiamo verso le code della distribuzione.

5. Dati quantitativi e dati qualitativi

I dati quantitativi sono utili per misurare, quantificare, un fenomeno. Utilizziamo a tale scopo dei dati strutturati e ne traiamo delle analisi statistiche. Riguarda un campione piuttosto ampio e ci aiuta a trarre conclusioni di carattere generale.

La ricerca qualitativa si propone di analizzare il fenomeno oggetto di studio. Serve a comprendere motivazioni, abitudini e tendenze che ritroviamo nei dati numerici della ricerca quantitativa. È indirizzata a campioni più ristretti ed è focalizzata a comprendere un aspetto specifico della ricerca.

Una è meglio dell’altra? Beh, possiamo sicuramente dire di no! Sono entrambi approcci validissimi, che si completano a vicenda. L’ideale sarebbe poter utilizzare entrambi!

Abbiamo visto i 5 aspetti statistici che ciascun data scientist dovrebbe conoscere. Ma se vi ricordate bene all’inizio dell’articolo vi avevamo promesso il +1.

Ecco a voi la bonus track. Parliamo di approccio critico all’analisi.

La formazione e la capacità di esprimere un pensiero critico possono davvero fare la differenza e rendere una qualunque analisi dati, una buona analisi.

L’approccio critico è una di quelle che oggi definiamo soft skill. Un’attività interdisciplinare che ci aiuta a riscontrare debolezze, criticità ed errori nelle analisi che stiamo conducendo. Ci aiuta a capire cosa è apprezzabile e cosa no, e comunicarlo in maniera chiara e puntuale.

Siamo giunti alla fine di questo piccolo viaggio nella data science.

Sei interessato a conoscere meglio come lavorano i nostri data scientist? Beh, che aspetti, contattaci!

Read More
Redazione 3 Marzo 2021 0 Comments

D come donna e come dati: la professione del Data Scientist allo specchio

Quando la vita è una questione di numeri, ma anche di creatività, ecco che si materializza la figura, quasi mitologica, del Data Scientist. Il team di Iws per stare al passo con le esigenze di mercato sempre più importanti rispetto le analisi dei dati, ha ampliato la sua Area BigData e Analysis con l’ingresso di Michela Di Lullo.

 

Laureata con il massimo dei voti in “Scienze Statistiche e Decisionali”, collaboratrice e anche ricercatrice presso l’Università La Sapienza di Roma, Michela fa percepire da subito la sua personalità eclettica che è sicuramente un valore aggiunto per il ruolo che ricopre.

 

Le abbiamo fatto qualche domanda per svelare i segreti di una professione che sta ormai prendendo piede, e si conosce ancora poco, almeno in Italia, ma che le aziende dicono sia difficilissimo trovare durante le proprie selezioni del personale.

 

 

Come descriveresti la figura professionale del Data Scientist sulla base della tua esperienza?

Non è semplice descrivere la figura professionale del Data Scientist, almeno per due motivi: il DS è una figura poliedrica, fatta di volti diversi e competenze trasversali; si tratta di una figura professionale nuova, almeno in Italia, dove la maggior parte delle aziende non ha ancora definito strategie di business strutturate in grado di sfruttare pienamente il valore insito nei dati. Per questo motivo, nonostante grandi e piccole organizzazioni stiano introducendo nei loro organigrammi nuove figure deputate ad estrapolazione, eleborazione ed interpretazione dei dati, non esiste ancora una professione codificata.

Sulla base della mia ancora giovane esperienza, direi che il DS è una figura nuova nel panorama ICT, che deve essere capace di coniugare una formazione matematica con competenze informatiche e intuizioni strategiche. In particolare, il DS in grado di comprendere le politiche economiche delle aziende e aumentare produttività e profitti; dotato di buone doti comunicative ed in grado di relazionarsi con il management delle aziende per indirizzare determinate scelte di Business.

Il DS ha anche una preparazione informatica: deve avere familiarità con i linguaggi di programmazione e trovare “divertente” creare codici informatici per raggiungere gli scopi più disparati. La presenza di un DS all’interno di un team di esperti con conoscenze e caratteristiche complementari, assicura il rigore del metodo scientifico, elaborando ipotesi ed eventualmente confutandole sulla base dei fatti e non delle proprie sensazioni.

 

Perché c’è bisogno di Data Scientists?

Il Data Scientist rientra, secondo ”Il Sole 24 Ore”, tra le 7 professioni ICT attualmente più richieste al mondo. Infatti, sempre di più le aziende sono consapevoli di potere acquisire vantaggi competitivi dai dati, che attualmente vengono nel migliore dei casi “memorizzati”, ma non realmente analizzati. Attualmente con IWS stiamo realizzando diversi progetti relativi all’analisi dei dati per vari settori merceologici. Questo ci fa presagire che ci sarà sempre più bisogno di figure professionali come quella del DS perché i modelli di business delle aziende cambiano sempre più velocemente e con esse i mercati economici. Quella che non cambierà mai, invece, sarà la necessità da parte delle imprese di aumentare produttività e profitti, necessità che un DS dovrebbe essere in grado di indirizzare in modo creativo ed efficace.

 

Ci sarebbe differenza se tu lavorassi all’estero?

Secondo le statistiche attuali, in Italia, solo 3 aziende su 10 hanno un Data Scientist. All’estero, invece, il fenomeno dell’assunzione di DS in azienda, piccola o grande che sia, è già esploso da tempo. Ciò nonostante, sembra che Big Data e Data Science stiano entrando velocemente nella mentalità delle aziende italiane. A dirlo l’Italian Labour Market Digital Monitor, che svela come negli ultimi mesi le richieste di specialisti siano aumentate del 137%.

Personalmente ho avuto la fortuna di trovare delle possibilità lavorative come DS in Italia e non ho ancora avuto modo di esercitare questa professione all’estero. A detta di alcuni colleghi che nel frattempo si sono spostati, però, direi che il mercato del lavoro estero sembra più forte e consapevole di quello italiano. In ultimo, ma non per importanza, il modello di Work-Life Balance che supera lo schema delle “8 ore lavorative” giornaliere, largamente testato e affermato all’estero, rende ancora più appetibili per i giovani le offerte di lavoro fuori dall’Italia, specialmente nel nostro settore.

 

Cosa ti piace di più del tuo lavoro?

Partendo dal presupposto che secondo me la vera missione del Data Scientist è quella di utilizzare i dati in modo creativo per generare valore, i due aspetti che più mi piacciono del mio lavoro sono:

  • la creatività richiesta ad un DS;
  • la propensione alla comunicazione che un buon DS deve avere, ma soprattutto migliorare di continuo.

A differenza di quanto in tanti penseranno, quello del DS non affatto un lavoro “noioso”, fatto di calcoli, numeri, teorie e teoremi. Nonostante Machine Learning e Intelligenza artificiale si basino fortemente su statistica, matematica e logico, si tratta di un lavoro estremamente creativo, il che rende quella del Data Scientist, a mio avviso, una delle professioni più “cool” nel mondo dell’IT. Come dicevo, il secondo aspetto che più mi piace del mio lavoro, è che al DS è richiesto di essere un buon “narratore”. Fa parte del lavoro del DS quello di convincere il management che attraverso la statistica e scienze annesse è possibile risolvere problemi di business che le aziende non sanno neppure di avere. Personalmente trovo estremamente stimolante la necessità lavorativa che mi spinge a migliorare di giorno in giorno la mia capacità di sintetizzare contenuti ed esporli in modo chiaro e persuasivo.

 

Sei stata coinvolta in attività accademica prima di approdare nel mondo del lavoro, cosa è cambiato?

Subito dopo la laurea di secondo livello, ho deciso di intraprendere un dottorato di ricerca triennale in matematica applicata presso il Consiglio Nazionale delle Ricerche – IASI di Roma. Quello della ricerca è sicuramente un mondo meno strutturato di quello aziendale, ma decisamente meno redditizio dal punto di vista economico. Di positivo c’è che i dottorandi hanno il privilegio di studiare ciò che realmente gli piace ed interessa. Io, ad esempio, ero affascinata dall’idea di sfruttare risorse naturali come sole, vento e acqua per produrre energia salvaguardando l’ambiente e ho proposto al mio tutor un progetto che ci ha visti poi impegnati nella ricerca di nuovi modelli e algoritmi per ottimizzare pianificazione ed esercizio di sistemi energetici integrati.

Durante il percorso di dottorato mi è stata offerta la possibilità di fare un periodo di studio e ricerca presso lo Zuse Institut di Berlino, al fianco di alcuni dei più grandi esperti del settore.

La mia avventura continua oggi in una compagnia in forte espansione ed evoluzione come IWS e la trovo molto entusiasmante.

 

In quali settori secondo te assume grande importanza l’analisi dei dati? Come farlo capire alle aziende clienti?

In tutti i settori l’analisi dei dati è una di quelle attività che interessa l’azienda indipendentemente dalle sue dimensioni e dal mercato di competenza. E se per un momento mi metto nei panni di tutti i Sales Manager che cercano di farlo comprendere ai propri interlocutori nelle aziende clienti, la strada è non priva di difficoltà. Mi auguro che nelle aziende italiane si abbassi la resistenza verso la scelta di applicare un approccio scientifico allo studio delle informazioni che collezionano, per convertirle in occasioni di business e indirizzare le scelte aziendali con una maggiore consapevolezza. Dopotutto, credo fermamente nel mio lavoro e sostengo che la scelta di trasformarsi in “data driven company” sia la chiave, oltre che una necessità, per cavalcare l’onda dell’innovazione e rispondere ai repentini cambiamenti del mercato.

Read More
Redazione 9 Maggio 2017 0 Comments