Selon Microsoft et Databricks, le moteur de requête vectorisé écrit en C++ accélère jusqu'à 20 fois les workloads Apache Spark.
Microsoft a dévoilé en avant-première un moteur de requête vectorisé en C++ pour le service d'IA et d'analyse dans le cloud Azure Databricks basé sur Apache Spark. C’est le 22 septembre qu’Azure Databricks, délivré en partenariat avec la firme éponyme, a présenté le moteur Delta Engine alimenté par Photon. Écrit en C++ et compatible avec les API Spark, le moteur de requête vectorisé Photon exploite l'architecture moderne des processeurs et la couche de stockage transactionnel open source Delta Lake pour améliorer jusqu'à 20 fois les performances d'Apache Spark 3.0.
Selon Microsoft, la prise de décision des entreprises étant de plus en plus basée sur les données, elles doivent impérativement disposer d'une plate-forme capable d'analyser rapidement des quantités et des types massifs de données. Photon accroit le traitement parallèle des données et des instructions au niveau du CPU. Parmi les autres composants de Delta Engine, on trouve un optimiseur de requêtes amélioré et une couche de mise en cache. La combinaison de ces technologies étend les cas d’usage dans le domaine du big data, notamment à l'ingénierie des données, à l'apprentissage machine, à la science des données et à l'analyse des données.
Avec Azure Databricks, les utilisateurs pourront mettre en place rapidement des environnements Apache Spark optimisés. Le service offre une intégration native avec Azure Active Directory et d'autres services Azure dans le cloud comme Azure Synapse Analytics et Azure Machine Learning, les clients pouvant ainsi créer des entrepôts de données de bout en bout, des solutions d'apprentissage machine et d'analyse en temps réel. Les utilisateurs peuvent demander un accès à la preview de Photon en remplissant un questionnaire.
Aucun commentaire:
Enregistrer un commentaire