Cosa succede quando tre giovani dipendenti veterani di Netflix, Airbnb, Google e Apple si accorgono di un problema di trasformazione dei dati? Quindi hanno creato una startup che ha risolto il problema. Tobiko Data può contare subito su un investimento di 22 milioni di dollari.
A partire da una felpa con cappuccio aziendale? Questo è abbastanza normale nella Silicon Valley. Ma Pantaloni firmatiNon l’abbiamo ancora visto. Toby Mao sembrava sentirsi bene quando entrò nella sala riunioni con soli quindici minuti di ritardo. La sua maglietta porta un marchio diverso: quello del noto cubo puzzle. Non è una coincidenza, a quanto pare: Toby – o Tobias se preferisci – ha detenuto per un po’ il record mondiale del Cubo di Rubik. Per inciso, è stato anche suo fratello Tyson a fondare la World Cubing Association. Ma insieme a Jaroslaw Zigerman i fratelli hanno fondato anche la startup Tobico – di cui abbiamo parlato con Toby Mau durante la visita del press tour IT nella Bay Area californiana, conosciuta come Silicon Valley.
Più efficienza e minori costi
Appena cinque giorni prima del nostro appuntamento, Tobico ha annunciato un round di investimento del valore di circa 22 milioni di dollari. Non è male per un’azienda che ha meno di due anni e che ora conta 20 dipendenti. Ma Toby Mau ha già avuto successo in Airbnb e Netflix, dove ha guidato rispettivamente le metriche e la piattaforma XP. Per inciso, su Netflix ha incontrato anche Jaroslav, che a sua volta ha guidato il team di ingegneria dei dati AI/ML di Apple. Anche i giovani veterani. Il tipo che, quando vede un problema o una lacuna nel mercato, è disposto e in grado di sviluppare da solo la soluzione.
‘Tobiko Data è una piattaforma di trasformazione dei dati open source con SQLMesh come prodotto di punta. Questo prodotto è un framework che consente ai data scientist di lavorare in modo corretto ed efficiente linee di tubazioni “Costruire”, dice Toby Mau con l’enfasi necessaria che rivela che questa è la soluzione immediata al problema che vedono.
“I dati sono diventati particolarmente importanti, soprattutto se devono supportare applicazioni di intelligenza artificiale e machine learning nella tua azienda. Ma il problema più grande è che l’attuale panorama dei dati è incredibilmente disordinato. maccheroni codice Scrivere. Nessuno sa ancora veramente quali codici e dati si trovino in casa, e il controllo dei dati è ancora lungi dall’essere maturo, rendendo gran parte dei dati inaffidabili o semplicemente sbagliati. “Nulla di tutto ciò è efficiente e lo stesso settore IT non sta pensando di affrontare la questione in modo adeguato e tutto in una volta”, afferma Mao.
Aggiungi a Snowflake e Databricks
E quando vogliamo dirgli che esistono soluzioni a questo, come Snowflake e Databricks, Toby Mau ha già pronta la sua risposta alla domanda attesa. ‘La dimensione del fiocco di neve e del data brick è molto buona. Ma se non funzionano in modo efficiente, i costi possono aumentare molto rapidamente. Ecco perché aziende come Netflix e Apple pensano continuamente a questi prodotti efficienza: Per evitare costi così elevati, Toby Mao lo sa in prima persona.
Questo è esattamente il motivo per cui ha creato SQLGlot presso Netflix: un framework parser SQL open source che ora viene utilizzato da molte aziende nel loro ambiente di sviluppo. “Consideratelo come uno dei tasselli tecnologici fondamentali alla base della nostra soluzione SQLMesh”, afferma Mao. Questa soluzione deve garantire efficienza nell’ambiente di sviluppo. “Quello che vedi è che molto lavoro viene duplicato in molti ambienti di sviluppo. Con ogni piccola modifica in SQL, l’intero repository viene ricostruito, ciò comporta molto tempo e quindi costi aggiuntivi”, afferma Mao.
Non con SQLMesh, perché capisce esattamente cosa deve essere calcolato. Questo è ciò che rende unico il nostro strumento. SQLMesh non ricalcolerà mai nulla che sia già stato calcolato. Personalizzate le query? SQLMesh sa cosa vuoi ottenere e sa cosa deve ancora essere ricalcolato. Ciò consente di risparmiare molto tempo e costi. Sì, sono disponibili altri framework ma non capiscono SQL. Trattano tutto come testo grezzo o stringhe e presumono che l’elaborazione a valle di tutto questo ricalcolo non necessario non sia un loro problema.’
Modello di business?
Mao racconta di aver fondato inizialmente l’azienda non a scopo di lucro, ma basandosi sulla semplice osservazione che lui e i suoi colleghi avevano un’idea per trovare una soluzione a un problema. Come pensano di rendere redditizia la loro idea, sviluppata in open source? “Siamo un’azienda open source, quindi chiunque è libero di scaricare e utilizzare la nostra tecnologia, ma ciò che abbiamo deciso la scorsa settimana è che oltre alla versione open source, offriremo anche una versione aziendale a pagamento di SQLMesh, che fornirà funzionalità aggiuntive. funzionalità come il modulo Observer Questo ti dice non solo che qualcosa è andato storto da qualche parte nel tuo codice, ma anche e specificamente cosa è successo e perché. Ancora una volta, questo è possibile solo perché SQLMesh comprende anche il tuo SQL e può quindi mappare i dati insieme. “, dice Mao.
Mao vede Snowflake e DataBricks come “partner” piuttosto che come concorrenti. Davvero non ci sono concorrenti, vogliamo ancora saperlo prima di lasciarlo partire per la sua base a San Mateo. “Sì, dbt labs sono attivi dal 2016 e forniscono anche un importante quadro di trasformazione dei dati Quando lavoravo presso Airbnb, ho anche conosciuto la loro piattaforma, ma mi sono anche reso conto che non avrebbe funzionato abbastanza bene per Airbnb perché dbt funziona. non si adatta bene. Attraverso SQLGlot, la nostra soluzione comprende molto meglio anche l’SQL scritto”, conclude Mao.
“Specialista del web. Esperto di zombi da una vita. Ninja del caffè. Analista amico degli hipster.”