Build 2015 – Using Azure Search to build great search experiences

La recherche est devenu un moyen naturel d’accéder à l’information. Azure Search est un service Azure permettant de créer des modules de recherche dans lesquelles on va pouvoir indexer des contenus pour permettre de la recherche. Comme tous les services Azure, la recherche est géoréplicable et propose de l’elasticité sur les ressources. Le service propose une version gratuire qui contient toutes les fonctionnalités mais un nombre limité de requêtes.

Comme la plupart des outils de recherche Azure Search fonctionne en créant et alimentant des index, dans lesquels on définit une schéma de données, en déclarant des champs. Ces champs vont porter des méta données qui vont indiquer le type (string, int, point géographique, …), et définir le comportement des champs lors de la recherche (searchable, filterable, retrievable, …). Les champs peuvent également avoir des paramètres linguistiques, du stemming (réduction des mots selon des critères phonétiques), et des analysers spécifiques ou provenant de Lucene.

Le service permet de faire de la recherche pur, ou en mode suggestions (pour des usages type autocomplete).

Pour alimenter l’index, on peut pousser manuellement des données dedans avec une API Rest (possibilité de faire des batchs avec jusqu’à 1000 doucments, en mode CRUD), ou configurer une synchronisation des données avec Azure Document DB, ou SQL Azure.

Build 2015 – Project Oxford : Adding smart to applications

Project Oxford est une nouvelle fonctionnalité qui n’a pas été annoncée pendant la keynote. Elle fait partie de Azure, dans la famille du machine learning

C’est un set d’API REST basé sur du machine learning pour interagir avec des contenus multimedias
– traitement images (analyse, OCR, thumbnail intelligent, …)
– reconnaissance visages (detection, verification, identification)
– speech (Text To Speech, Speech To Text)
– LUIS (language understanding intelligent service, ex: traductions, détecter les intentions)

L’API semble simple d’utilisation, et la partie LUIS permet seule, ou combinée au speech, des scénarios métier assez intéressant pour pouvoir définir des commandes, un peu comme le fait Cortana.

Project Oxford est disponible en béta ici:
http://www.projectoxford.ai

Cela passe par la souscription et le portail azure donc il vous faudra obligatoirement un compte Azure pour pouvoir tester

[JSS 2013] Session : HD Insight

Speaker : Benjamin Guinebertière

Le speaker démarre sa session en présentant sa société v-traffic  http://www.v-traffic.com/  filiale du groupe info trafic.

Cette société est chargée de collecter les données publiques et privées qu’elle achète aux sociétés comme Tom-tom sur la géo-localisation des voitures en temps réel afin de recouper le tout et d’informer les automobilistes sur la disponibilité des axes de circulation dans toute la France et auquel cas proposer un itinéraire de substitution, ceci dans un délai relativement court via les médias suivants : web, radio, application Windows Phone.

Cas pratique :

L’entreprise V-Traffic souhaite mensuellement fournir à ses dirigeants un rapport détaillé  sur la qualité et la véracité des données mises à disposition des utilisateurs de v-traffic.
Et dans un second temps, débattrenégocier et réajuster l’achat des données le mois suivant.

Qu’est ce que HD Insight ?

HD Insight est le nom du projet Hadoop qui a l’origine est un projet linux du nom d’Hadoop Apache et qui a été porté sur la plateforme Windows (Win Server 2008) et mise à disposition par Hortonworks Data Platform.
Ce service permet de gérer d’importants volumes données (BIG Data) sur la plateforme Windows Azure et s’exécute dans les datacenters de Microsoft basé sur :

  • le système HDFS : Hadoop File System
  • MapReduce est le modèle de programmation utilisé pour traiter de gros volumes de données.

L’utilité d’HD Insight dans Windows Azure réside dans le fait de pouvoir créer un accès rapide, sécurisé et temporaire afin d’y réaliser vos traitements et ensuite clôturer et effacer le cluster (location temporaire d’un cluster).

Lors de la création, il vous sera demandé un nom de cluster, le nombre nœuds.

Dans la rubrique HDInsihgt, Créer un cluster > Créer des noeuds > Sélectionner la version (2.1) > Choisir un username.

Démo :

Cette opération de création de cluster peut être scriptée via Windows Azure Powershell (Similaire au command Shell sous Unix).

La suite de la démo nous montre comment utiliser les langages de script que sont Pig (Développé par Twitter) et Hive (Développé par Facebook) qui vont pointer dans un répertoire dans lequel se trouve des fichiers de logs et qui recensent la position des automobilistes, la vitesse moyenne, les ralentissements, les chemins de substitutions empruntés (boite noire des taxis, GPS).

Une surcouche en python est utilisée afin de déterminer la position exacte des voitures en recherchant dans les 36 000 polygones de la carte de France et identifier leur position.
Ce calcul est gourmant en performance. C’est pourquoi il faut agréger et regrouper les données géographiques en rectangle plus larges afin de cibler les zones concernées et limiter la recherche à la zone sélectionnée.

Ceci dans le but d’optimiser les temps de traitements des fichiers de logs consommés par la plateforme.

En résumé, les données sont collectées dans des tables sous Hive puis agrégées (requête d’agrégation) dans une base SQL Server  afin de les restituer via un portail SharePoint (RS, Power Pivot, Power BI).

Un autre exemple d’utilisation citée par le speaker : Facebook utilise les logs des jeux qui sont disponibles (analyse du temps passé par les gamers afin d’identifier les tricheurs).

Conclusion :

La session fut très enrichissante pour une première approche. Il faut la mettre en relation avec la session sur le Big Data (de Romain Casteres)

Elle a le mérite de nous expliquer par un cas concret les possibilités de la plateforme HD Insight et de manière générale sur le « Big Data » qui jusqu’alors me semblait relativement floue.

Luiggi – Consultant décisionnel MCNEXT

Tour de France Windows 8 et Windows Phone 8 – Mai 2013

Tour de France Windows 8 et Windows Phone 8

Tour de France Windows 8 et Windows Phone 8

Microsoft organise un Tour de France autour des applications Windows 8 et Windows Phone 8

« Apprendre à développer, sécuriser et optimiser vos « back-end » pour vos applications Windows 8 et Windows Phone 8″

Au programme 4 heures de :

  • Formation
  • Démo
  • Code

L’objectif est de vous apprendre, en une demi-journée, à développer, sécuriser et optimiser vos « back-end » pour vos applications Windows 8 et Windows Phone 8.

Les thèmes suivants (autour de Windows 8 et Windows Phone 8) seront abordés :

  • Tour d’horizon de la plateforme
  • Concepts fondamentaux pour la mise enplace d’API et les best pratices d’utilisation dans vos applications
  • L’implémentation de services de notification et de push
  • Les différentes approches pour sécuriser vos API et la mise en oeuvre de ces mécanismes
  • L’optimisation des ressources et des services mis enplace ainsi que la montée en charge de vos applications mobiles avec Windows Azure.

Les intervenants :
Ce Tour de France sera animé par des intervenants MCNEXT :

  • John Thiriet, consultant DotNET et MVP Expression Blend
  • Guillaume Leborgne, chef de projet et expert DotNET

Ils ont développé de nombreuses applications Windows 8 et Windows Phone 8 présentes dans le Microsoft Store. Ce sont leurs retours d’expériences autour de Windows 8 et Windows Phone 8 qu’ils souhaitent vous apporter.

Le public visé :
Développeurs généralistes
Niveau technique : 300

Pour en savoir plus :
http://www.mcnext.com/evenements/microsoft/Pages/tour-de-france-windows-8-et-windows-phone-8.aspx