Knime: nuove funzionalità in arrivo con la piattaforma Analytics 3.7.0. e Server 4.8.0.

Iws Consulting come partner di Knime lo scorso 3 dicembre ha partecipato alla presentazione in anteprima dell’evoluzione della piattaforma analytics. Il 6 Dicembre 2018, in occasione del Nicholas Day, la casa tedesca rilascerà delle nuove features riguardanti sia la parte analitica che quella server.

di Andrea Macera, Senior Data Engineer and Data Analyst.

 

 

Knime è una piattaforma gratuita e open-source il cui utilizzo è orientato principalmente all’analisi, reporting e integrazione dei dati, integrando vari componenti, messi a disposizione dal tool, per machine learning e data mining attraverso il concetto di pipeline di dati modulari. Un’interfaccia grafica e l’uso di JDBC consentono l’assemblaggio di nodi che combinano diverse sorgenti di dati, compresa la pre-elaborazione (ETL: Extraction, Transformation, Loading), per la modellazione, l’analisi e la visualizzazione dei dati senza, o con una programmazione minima.

 

In questo articolo illustreremo queste nuove funzionalità inserite nelle nuove versioni KNIME Analytics 3.7.0 e KNIME Server 4.8.0.

 

Iniziamo con la descrizione delle nuove features introdotte dal tool inerenti alla nuova versione Analytics:

Sono stati introdotti nuovi nodi di calcolo statistico, che utilizzando algoritmi machine learning, riescono a fornire dati utili per effettuare analisi predittive con elevate prestazioni. Più nello specifico, l’integrazione con XGBoost é interessante sapere che è disponibile nella nuova versione di KNIME AP. (Fig. 1).

 

Si intensificano le possibilità di interazione con Tableau: con il nuovo rilascio di KNIME Analytics Platform è stata estesa l’integrazione per aggiungere il supporto per nuovi formati di date e time e sia per supportare il formato Hyper di Tableau. Questo consente di scrivere file in formato Hyper cosí come inviare i file direttamente a Tableau Server. Nella versioni precedenti era disponibile esclusivamente il formato TDE con le stesse funzionalitá di scrittura del file e di invio al Tableau Server (fig. 2).

Da oggi, Knime, consente di acquisire files direttamente da Google Driver. Il nodo predisposto a tale funzione evita le fastidiose operazioni di download/update dei dati, consentendo in maniera rapida e semplice il loro accesso. Ciò facilità la gestione di files, presenti su path condivisi, garantendo la coerenza delle informazioni presenti su essi (fig. 3).

Ti è mai successo che durante lo sviluppo di un job Knime, ti accorgi che ti occorre un particolare script per poter eseguire formule matematiche complesse; oppure che ti occorrono particolari funzionalità e che tali non sono presenti tra i molteplici nodi messi a disposizione dal tool?

Con l’arrivo della versione Analytics 3.7.0, ciò non rappresenta più un problema: l’integrazione con Python, presente da tempo in KNIME Analytics Platform, ma ciò che hanno reso disponibile nell’ultima release é l’integrazione con Jupyter. Infatti ora é possibile importare ed eseguire codice disponibile in Jupyter notebooks (fig. 4).

L’ultima, ma non per importanza, grande novità introdotta in questa nuova versione è l’ampliamento della connettività con il mondo BIG DATA. Ormai l’uso dei big data, sta diventando sempre più indispensabile per le aziende e Knime consente la gestione di essi in modo ottimale, utilizzando connettori che consentono la compatibilità con i più grandi leader mondiali di tool big data (es. Cloudera, Microsoft Azure HDInsight, ecc..). È stata aggiunta la possibilitá di mixare job PySpark con il workflow che lavora su Spark. Inoltre, ulteriore importante supporto é quello con Apache Livy per controllare i job di Spark nell’ambiente big data, cosí come il supporto di Spark 2.4. (fig. 5).

 

Dopo aver descritto le principali caratteristiche delle nuove features analitiche implementate nella versione KNIME Analytics 3.7.0, passiamo a quelle della versione KNIME Server 4.8.0.

 

La differenza sostanziale di cui ci rendiamo subito conto è nell’utilizzo di executor distribuiti che danno la possibilitá di scalare con l’esecuzione dei workflow per il KNIME Server. Ciò consente maggiori vantaggi (speed-up e throughput) quando si esegue un elevato numero di operazioni in parallelo (fig. 6).

 

Con il lancio sul mercato delle 2 nuove versioni, Knime si proietta ad aggiudicarsi un posto accanto ai grandi competitor mondiali. Difatti, rende automatizzabile e in maniera semplice e intuitiva, il ciclo di vita del dato, partendo dall’acquisizione di esso fino all’analisi delle informazioni. Attraverso l’iterazione con varie tecnologie, rende il tool portatile e adatto ad ogni esigenza.

Read More
Redazione 10 Dicembre 2018 0 Comments

Il rinnovo tecnologico di un parco server: la soluzione iperconvergente

CASE STUDY

Il rinnovo tecnologico di un parco server: la soluzione iperconvergente.

 

Da un’architettura obsoleta e complessa ad una soluzione iperconvergente che potrà garantire affidabilità, scalabilità e risparmio, con performances elevate.

 

Esigenza del cliente:

Presso il cliente è stata evidenziata l’esigenza di rinnovo tecnologico del parco server composto da macchine obsolete con lo scopo di aumentare la ridondanza e le performance dei servizi erogati dal Datacenter interno.

E’ stato proposto al cliente un sistema basato su server Lenovo System x3650 M5, che integra il software di virtualizzazione SANSymphony di DataCore. Questa soluzione rappresenta l’ultimo importante passo di Lenovo nel guidare l’utente utilizzatore all’adozione di tecnologia Data Center software-defined, con vantaggi come: maggiore agilità e significativi risparmi economici.

Obiettivi raggiunti:

L’attività è stata sviluppata con grande professionalità, ottenendo un risultato vincente. Dunque l’architettura obsoleta e complessa è stata sostituita con una soluzione iperconvergente che potrà garantire affidabilità, scalabilità e risparmio a lungo termine, con performance estremamente elevate.

Fondamentale l’apertura del cliente, che è stato in grado di percepire quanto fosse importante avere un sistema che garantisse i processi interni nonché l’attività operativa quotidiana. La risposta è stata la Soluzione Software-Defined e Infrastruttura Iper-convergente di DataCore.

Valore aggiunto:

IWS è partner certificato sia di DataCore che di Lenovo, condizione indispensabile per poter offrire installazioni garantite, nonché una adattabilità dei tecnici esperti ad operare in ambienti misti, capaci di praticare la migrazione dei servizi senza bloccare l’operatività quotidiana degli utenti utilizzatori.

DataCore è una soluzione compatta e ad alte prestazioni che minimizza il numero di server  necessari per supportare la disponibilità continua nella memorizzazione delle risorse, riducendo enormemente TCO e complessità.

Inoltre grazie alla stretta collaborazione con questi partner tecnologici coinvolti nel progetto, Iws Consulting riesce a garantire al cliente un’assistenza veloce e diretta, per un lungo periodo di tempo.

Possibili sviluppi:

Il cliente ha richiesto una proposta per l’assistenza client/server per i prossimi 5 anni e una offerta anche per la sostituzione degli apparati Network.

Read More
Redazione 12 Marzo 2018 0 Comments