Ultimo aggiornamento il
La conversione di "big data" in risultati significativi può sembrare complicata. Ma una volta capito cos'è e come funziona, renderlo significativo non è così complicato.
Nel corso degli anni, molte parole d'ordine diventano di moda in molti settori. Ci sono pochi che sono diventati così popolari e per così tanto tempo come i big data. Ma cos'è esattamente i big data?
I big data si riferiscono a un oceano virtuale di informazioni da una varietà di fonti, analizzate e filtrate in modo tale da sviluppare risultati significativi e attuabili.
Il processo di conversione dei "big data" in risultati significativi può apparire complicato e difficile. Tuttavia, una volta compreso quali sono i big data e come funzionano, capire come renderli significativi non sembra così complicato.
Cosa sono i Big Data?
Quando senti la gente parlare di "big data", di solito è un sacco di saluti e grandi parole. Ma quando si riduce tutta l'iperbole, i "dati" reali sono in realtà molti flussi di input di dati multipli.
Per capirlo, un esempio può essere d'aiuto. Supponiamo che tu gestisca un'azienda manifatturiera ombrello. Il tuo dipartimento marketing sta cercando un modo per prevedere meglio quando la domanda del mercato sta per aumentare.
Prima dei tempi dei big data, gli esperti di marketing studiavano le tendenze del mercato, inviavano sondaggi ai clienti e molte altre attività.
Raccolgono tutti quei dati e li archiviano nei database interni della propria azienda. Qualcuno potrebbe anche essere responsabile dell'aggiornamento dei dati delle ricerche di mercato su base annuale o trimestrale.
Tuttavia, l'avvento dei big data espande la capacità di condurre questo tipo di ricerca. In particolare, i big data sono particolarmente efficaci nell'identificare tendenze o eventi importanti in tempo quasi reale.
Gli input di dati per questo tipo di analisi dei "big data" potrebbero includere flussi di dati in tempo reale scrivendo il codice che si collega al API (Application Programming Interface) di molte aziende diverse che hanno reso pubblici tali dati:
- Twitter e Facebook: Identifica quando e perché le persone stanno discutendo dell'acquisto di ombrelli.
- Tempo metereologico: Identificazione condizioni meteo o previsioni che potrebbero trasformarsi in vendite ombrello più alte.
- Mercato azionario: Variazioni stagionali del costo delle materie prime per la produzione di ombrelli.
- Uso Web del cliente: Utilizzo delle informazioni dal cookie per computer di persone che visitano il catalogo dell'azienda per comprendere i comportamenti di acquisto.
- Cronologia acquisti clienti: Monitoraggio della geografia e delle stagioni delle tendenze dei punti vendita da parte dei rivenditori.
Per utilizzare i big data, il team di marketing di questa società dovrebbe, in alcuni casi, installare nuove tecnologie.
Big Data e Internet
Ciò potrebbe includere la tecnologia Internet of Things (IoT) presso i rivenditori che monitora e segnala i comportamenti dei consumatori. Oppure potrebbe implicare che un programmatore scriva il codice richiesto per interfacciarsi con l'API di Twitter per filtrare eventuali tweet che menzionano "ombrelli" o il nome dell'azienda.
Ognuna di queste tecnologie è ora disponibile grazie a Internet. Internet consente a chiunque di attingere a flussi di dati provenienti da tutto il mondo.
Ecco come l'installazione nel nostro esempio potrebbe funzionare in questo caso.
Questo diagramma mostra come i dati fluiscono nel "data lake" dell'azienda da molte fonti diverse. I dati in arrivo possono essere strutturati in modo diverso, ma l'importante è raccogliere quanti più dati possibili da tutte le fonti.
Che cos'è un Data Lake?
A differenza di un database, che contiene dati strutturati organizzati in colonne e righe specifiche, un lago di dati è un enorme archivio per molte diverse forme di dati.
I dati archiviati potrebbero essere strutturati o non strutturati. Significa che può avere righe e colonne strutturate oppure no. I dati potrebbero essere stringhe che utilizzano una formattazione specifica per separare i dati. Ogni origine dati può inviare dati a un data lake in qualunque forma gli piaccia.
Immagina un lago di dati come una grande biblioteca che contiene molte forme di media, come libri, immagini su microfiche e video su DVD.
Immagina l'ingegnere dell'intelligence digitale e dell'analisi dei dati come mecenate di quella biblioteca. Questi utenti possono estrarre digitalmente i dati da libri, microfiche e DVD e trovare modi per mescolare e combinare quei dati e imparare cose da come i dati sono correlati.
Da questi apprendimenti proviene un'intelligenza reale e attuabile. Alcuni di questi dal nostro esempio potrebbero includere:
- Le chiacchiere su Twitter e Facebook indicano una tempesta in arrivo a New York City, con migliaia di clienti che intendono acquistare ombrelli.
- I dati di acquisto dei cookie per computer e le macchine di pagamento al dettaglio indicano che gli acquirenti in California sono disposti a pagare di più per gli ombrelli firmati rispetto alle persone in Virginia.
- Un grande modello di tempesta in avvicinamento indica che gran parte della costa orientale sarà coperta da un temporale per un'intera settimana.
Tutti questi insegnamenti potrebbero spingere il team di marketing a investire in più pubblicità geograficamente dove la domanda di vendita ombrello è molto più forte. Le operazioni di produzione potrebbero anche spostare i loro sforzi di produzione in quelle aree del mondo più vicine a dove le vendite hanno maggiori probabilità di salire.
In questo modo, utilizzando i big data, qualsiasi azienda può ottimizzare il proprio marketing e le proprie operazioni.
Che cos'è Hadoop?
La domanda successiva è: in che modo le aziende elaborano volumi di dati così elevati e identificano le tendenze?
Questo tipo di compressione dei dati richiede enormi risorse informatiche. Tanto che le aziende non usano più i computer mainframe di grandi dimensioni in locale come una volta. Molti di questi servizi sono ora acquisti dal cloud. I servizi di cloud data intelligence come Apache Hadoop offrono molti nodi di computer su una grande rete cloud. Ognuno di questi nodi contribuisce alla potenza di elaborazione richiesta per analizzare enormi flussi di dati da più fonti.
Questo tipo di potenza di elaborazione è il cuore della macchina o dell'intelligenza digitale e dell'analisi dei dati. Hadoop è il framework software che consente a tutta questa rete di enormi potenze computazionali di funzionare come richiesto dagli ingegneri dell'intelligenza digitale.
Una volta che il motore di calcolo produce intelligenza fruibile, questi vengono generalmente consegnati all'azienda sotto forma di dashboard o report.
I big data non sono solo parole d'ordine
La verità è che i "big data" sono più di un semplice gergo aziendale. Molte aziende stanno imparando che, facendo un uso migliore dei dati, sono in grado di raggiungere numerosi risultati.
- I produttori possono migliorare le metriche di produzione critiche come resa, qualità ed efficienza.
- I rivenditori possono allineare meglio gli investimenti in marketing, pubblicità e affari in base ai segnali del mercato.
- I distributori sono in grado di prevedere potenziali problemi in una catena di approvvigionamento per sviluppare preventivamente piani di emergenza.
- Le organizzazioni giornalistiche possono identificare rapidamente eventi importanti analizzando i segnali pubblici su Internet.
- Esperti di sicurezza informatica utilizzare i segnali su Internet per identificare gli attacchi informatici mentre sono in corso.
Mentre gran parte di ciò che i big data ha realizzato negli ultimi anni rimane praticamente invisibile al pubblico, i big data hanno effettivamente avuto un impatto significativo sulla vita quotidiana delle persone in tutto il mondo.