Microsoft Word, Outlook et PowerPoint pour obtenir un outil de sous-titrage d'images automatique alimenté par l'IA formé sur de grands ensembles de données après les services Azure

Technologie / Microsoft Word, Outlook et PowerPoint pour obtenir un outil de sous-titrage d'images automatique alimenté par l'IA formé sur de grands ensembles de données après les services Azure 2 minutes de lecture

Microsoft Azure. CirtixGuru



Microsoft a confirmé qu'il a développé un système de sous-titrage d'image puissant et intelligent. Le système alimenté par l'IA peut générer rapidement et de manière autonome des cations d'images pertinentes. Le système n'est peut-être pas aussi fluide ou créatif que les humains créant des légendes pour les images, mais il aurait été formé sur d'énormes ensembles de données pour améliorer la pertinence et la précision. Microsoft assure que le système est deux fois plus puissant que celui qui est actuellement utilisé dans les services de l'entreprise.

Microsoft a un nouveau système de sous-titrage automatique des images. Le système sera lancé en premier dans Azure Cognitive Services. Cependant, Microsoft a indiqué que la même chose se répercuterait sur Microsoft Word, Outlook et PowerPoint.



Comment fonctionne le nouveau système de sous-titrage d'images AI-Drive?

Tout système basé sur l'IA doit d'abord être formé sur des ensembles de données pertinents. Ces algorithmes apprennent à partir des points de données et acquièrent ensuite la capacité d'imiter les modèles de comportement attendus. Le nouveau système de sous-titrage automatique des images de Microsoft serait également formé avec un vaste ensemble de données d'images associées à des balises de mots. Ces étiquettes de mots ont été mappées à un objet distinct dans une image.



Après la formation initiale, les chercheurs ont affiné le modèle pré-formé pour le sous-titrage sur l'ensemble de données d'images déjà sous-titrées. Le processus de formation et de mise au point a permis au modèle d'IA d'apprendre à composer une phrase compréhensible. Le nouveau modèle d'IA exploite par la suite le vocabulaire visuel pour générer automatiquement des légendes pour des images contenant des objets nouveaux ou distincts avec précision. Il semble que l'accent soit mis sur l'objet qui est spécifique ou unique dans l'image.



Comme pour tous les modèles d’IA, même le système de sous-titrage d’images de Microsoft n’est ni précis ni parfait à 100%. Cependant, Microsoft assure que le nouveau modèle d’IA est deux fois plus performant que le modèle de sous-titrage d’image actuellement utilisé dans les produits et services de la société. Test interne indique le nouveau modèle peut créer des légendes plus descriptives et plus précises que les légendes écrites manuellement par des humains, affirme Xuedong Huang, un technicien Microsoft et directeur de la technologie d'Azure AI Cognitive Services à Redmond, Washington,

«Nous apportons cette percée de l'IA à Azure en tant que plate-forme pour servir un plus large éventail de clients. Ce n'est pas seulement une percée dans la recherche; le temps qu'il a fallu pour transformer cette percée en production sur Azure est également une percée. »



Ce que Huang a indiqué, c'est que Microsoft a été en mesure d'accélérer considérablement le développement, le raffinement et le déploiement de modèles d'IA qui peuvent rivaliser avec le contenu généré par l'homme. Cependant, il est important de noter que ces modèles suivent généralement un ensemble spécifique de lignes directrices et s'appuient fortement sur les ensembles de données.

Microsoft a travaillé dur ces dernières années pour insuffler la puissance de l'IA à plusieurs de ses produits et services. L'IA détient le pouvoir de stimuler la productivité tout en permettant aux humains d'effectuer des tâches plus créatives. Fait intéressant, Microsoft vise à aider tous les utilisateurs à accéder au contenu essentiel de n'importe quelle image pour les personnes ayant une déficience visuelle grâce au nouveau système de sous-titrage automatique des images.

Mots clés Azur Microsoft