NVIDIA utilise des algorithmes de régression gaussienne pour réimager avec précision des photos déformées

Technologie / NVIDIA utilise des algorithmes de régression gaussienne pour réimager avec précision les photos déformées 3 minutes de lecture

Réimagerie de la photographie spatiale de la NASA pour obtenir un résultat plus clair. Vol spatial maintenant

NVIDIA est connue depuis longtemps pour ses unités de traitement graphique (GPU) immaculées, son produit principal étant la carte NVIDIA GeForce. Avec cela, la société a toujours été au centre de la recherche et du développement d'expériences améliorant l'intelligence artificielle dans les jeux vidéo, la conception graphique, le traitement de données et les véhicules automobiles.

Dernièrement, NVIDIA a commencé à se concentrer sur l'intelligence artificielle de manière isolée avec son projet le plus récent qui se concentre fortement sur la réimagerie intelligente de photos préexistantes à l'aide d'algorithmes gaussiens pour évaluer les moins de différences entre des centaines d'images claires et floues classées en fonction de la température et de la teinte, puis à saisir ces valeurs dans les expressions de régression de photos floues individuelles pour revenir à ce à quoi leurs images claires d'origine auraient pu ressembler. Ce processus est effectué individuellement pour chaque point de la photographie et une sommation est utilisée pour générer une valeur générique de moindre différence.

Bureau NVIDIA. Nasdaq sur Twitter

L'algorithme fonctionne pour apprendre des tentatives passées de ce que certaines couleurs et certains motifs à l'écran indiquent. Lorsque le système a été développé, il y avait des milliers d'images floues et originales afin que la machine puisse identifier quels motifs et couleurs sur l'écran correspondent à quelles rainures et quels bords de l'image d'origine. Après avoir été testé à plusieurs reprises, NVIDIA a réussi à apprendre à sa puce AI à apprendre des essais précédents et à stocker une base de données de codes graphiques correspondants qui sont convertis en code mathématique en fonction de l'emplacement, de la teinte et de la température. En utilisant l'expérience passée et les relations établies entre les images floues et claires du même lieu et de la même teinte, la machine craque avec de nouvelles images, appliquant les formules qui correspondent le mieux à la teinte et à la température de la nouvelle photo. NVIDIA a soumis son algorithme à suffisamment d'essais pour disposer d'une base de données de rétention suffisamment solide que l'IA puisse exploiter lorsqu'elle travaille sur des images plus récentes et le mécanisme est désormais autonome, capable de découvrir pratiquement n'importe quelle image grâce à sa formation en apprentissage par renforcement (RL). . Après avoir découvert suffisamment de visages, par exemple, la machine peut distinguer les visages flous lorsqu'elle est mise à l'épreuve car elle comprend quelles rainures floues correspondent à quels traits du visage en réalité. L'exposition à différents types de bruit tels que des images surétirées, blanchies à la chaux, filtrées et texturées a également été ajoutée à la base de données des algorithmes.

Dans l'algorithme mathématique langue, le programme lit les locus corrompus et clairs correspondants sur les images correspondantes, en enregistrant x, y, x 'et y' dans sa base de données. Il crée ensuite une courbe de régression gaussienne pour faire correspondre les différences entre les deux, ce qui permet une conversion basée sur le bruit photographique général. Dans l'expression de régression des moindres carrés générée, la valeur la plus basse qui satisfait la condition est prise et une nouvelle courbe de la valeur gaussienne est tracée. Lors de la conversion de l'image à sa qualité claire d'origine, la température de chaque point est modifiée en fonction de la différence du motif de régression dans la base de données de la machine AI qui correspond à cette couleur et à ce motif particuliers et chaque point est retourné pour produire une image claire entière. Le mécanisme de courbure gaussienne prend en compte les formes de bruit les plus génériques, mais si l'appareil est capable d'identifier d'autres formes de bruit souvent attribuées à des vitesses d'obturation intempestives ou à un ombrage générique de l'immage, la valeur de moindre différence gaussienne est moyennée avec le les valeurs de moins de différence de poisson (pour le premier) et de Bernoulli (pour le second) de l'ensemble de données.

Réimagerie photo assistée par intelligence artificielle. BT

En termes simples, le rôle que joue l'intelligence artificielle dans ce domaine est la détection et la conversion intelligentes de photos uniques basées sur un ensemble de pratiques déjà tenté par l'appareil. En ce qui concerne le niveau d'intelligence artificielle atteint aujourd'hui, qui en est encore à un stade où il n'est pas particulièrement indépendant et dont les efforts sont limités à l'éventail des scénarios déjà pratiqués, NVIDIA a largement réussi à créer une machine capable de tenter et de recréer des photos invisibles avec le plus haut niveau de précision en adaptant et en élargissant constamment sa base de données pour améliorer le taux de réussite des revirements photographiques ultérieurs.