A Microsoft a múlt héten jelentette be vadonatúj Azure fejlesztéseit és bővülő szolgáltatáspalettáját. A bejelentések között szerepelt az Azure Data Lake is, amely hatalmas mennyiségű strukturálatlan adat "ömlesztett" tárolásához és elemzéséhez használható. A szolgáltatás fontos eleme a Data Lake Analytics, amely egy új elosztott feldolgozó és elemző rendszer, Apache YARN alapokon. A bejelentés része egy új lekérdezési nyelv, az U-SQL is. Mit tud és mire jó?
"Tudjuk, hogy rengeteg fejlesztő és statisztikus szenved a nagy adathalmazok feldolgozásával a meglévő technológiákkal és eszközökkel" - mondta T. K. Ranga Rengarajan a Microsoft Data Platform igazgatója kapcsolódó blogposztjában. "Az általános programozási nyelveken írt megoldások hatékonyak lehetnek, de komoly tanulást igényelnek, míg az SQL-alapú eszközök egyszerűbb indulást, de korlátozott kiterjeszthetőséget nyújtanak". A Microsoft szerint az áthidaló megoldás az U-SQL, egy új lekérdezőnyelv, amely "egyesíti az SQL könnyű használatát a C# kifejező erejével."
"Az U-SQL lényege, hogy az SQL lekérdezések bővítését tesz lehetővé a C#-hoz hasonló szintaxisú kifejezésekkel illetve függvényekkel. Ennek megfelelően a nyelv alapjait a C# alaptípusai képeik, a legkérdezések pedig a LINQ-hez hasonló szintaxis mentén történnek. Az U-SQL lekérdezések egy lépésben tudják a strukturálatlan adatokat struktúrákba rendezni, majd ezeken számításokat, kereséseket végezni" - foglalja össze aprog.hu.
A nyelv támogatását az Azure Data Lake Tools for Visual Studio implementálja, ezt telepítve hozzáférhetőek a szokásos programozási, hibakeresési és teljesítményelemzési eszközök az új nyelv alatt is. A nyelv fejlesztésénél felhasználták a SCOPE kísérleteredményeit és a T-SQL, hagyományos SQL és Hive nyelvvel szerzett tapasztalatokat is.