Intelligence artificielle et réalité augmentée, un couple fait pour durer !

*Meta intégre de l’IA dans ses modèles Meta Rayban 2 pour faciliter les interactions avec le monde réel*

Encore un article qui va parler d’IA me direz-vous ! En effet, mais vous devez constater avec moi qu’au-delà du buzzword, l’intelligence artificielle bouscule de plus en plus de domaines depuis quelques années. Les technologies immersives, et en particulier la RA ne sont pas, ne sont pas épargnées et j’en avais déjà parlé à propos des lunettes de réalité augmentée. Au cours du dernier Laval Virtual, j’ai eu le plaisir d’animer une conversation sur ce sujet avec Émilie GOBIN MIGNOT (CEO de Antilogy) et Velleyen SAWMY (CEO de Enephtys). Voici quelques éléments qui me semblent intéressants à garder en tête pour faire un « bon » mélange de RA et d’IA, du point de vue du professionnel de la RA. Rappelez-vous que je ne suis pas un spécialiste de l’IA et donc prenez tout ce que suit avec des pincettes 🙂

Commençons tout de suite par séparer les différents types d’IA en deux catégories un peu grossière basées sur leur production et non pas sur les algorithmes utilisés. L’IA « descriptive » est connue depuis longtemps, elle sert principalement à comprendre la structure des jeux de données pour, par exemple, faire de la classification. Cette IA est parfaite, dans le contexte de la RA, pour interpréter un flux vidéo et reconnaitre des objets, des actions, des paroles, des éléments du monde réel. L’IA générative est un peu plus récente pour le grand public et vous connaissez bien sa fonction : générez du contenu à partir d’une sollicitation d’entrée. Je me permets ce découpage arbitraire pour mieux mettre en avant, dans la suite, les éléments à bien considérer pour son utilisation dans le cadre de la RA.

Autres éléments à prendre en compte, le timing de l’utilisation de l’IA. On peut faire l’analogie avec la 3D en parlant de « pré-calculé » et de « temps réel ». Dans le premier cas, l’IA est utilisée pour le développement de l’application ou de l’expérience et toute sa production est validée. Dans le second cas, l’action de l’IA est faite à la volée, sans contrôle humain du résultat. Vous comprenez facilement que dans le second cas, la question de bien définir le périmètre d’utilisation de l’IA, surtout si c’est de l’IA générative, est primordiale.

Voici donc les points qui me semblent importants à considérer.

L’IA « descriptive »

Réglons tout de suite le cas de l’IA descriptive qui n’apporte finalement pas de chalenges très nouveaux dans son utilisation. Comme vous le savez, elle est fondamentale pour comprendre l’environnement de l’utilisateur en fonction du contexte et adapter les informations envoyées à l’utilisateur. En réalité augmentée, on va beaucoup travailler avec des outils de « vision par ordinateur » capables de segmenter le flux vidéo en personnes, objets ou tous les autres éléments intéressants. Pour généraliser, tous les outils de traitement du signal sont potentiellement utiles.

*Quelques exemples d’utilisation de vision par ordinateur (source : Introduction à l’apprentissage profond (deep learning) de l’intelligence artificielle)*

Pour avoir intégré moi-même ce type d’outils dans un processus de traitement d’images, les points de vigilance sont typiques d’une intégration informatique : coût et condition de licence, interopérabilité des données, maitrise technique (en gros, votre indépendance par rapport à l’outil), périmètre fonctionnel par rapport à vos besoins, etc. Vous pouvez y voir finalement des considérations assez techniques, qui demande pour vous ou votre équipe une montée en compétence obligatoire. En effet, les fonctionnalités dont on parle sauront normalement au cœur de votre application. Ne pas les maitriser fait courir un grand risque pour votre pérennité et votre développement.

L’IA générative en « pré-calculé »

La principale et la plus évidente utilisation de l’IA générative aujourd’hui est la génération des contenus. Pour les expériences de RA qui peuvent avoir besoin d’éléments 3D créer ou dériver de photos ou de vidéo, le recours à cette technologie fait gagner du temps, c’est une évidence. Je ne vois pas de contraintes particulières dans ce cas sauf peut être la question de la propriété intellectuelle qui agite beaucoup de monde en ce moment. Aujourd’hui, pour tenter de la résoudre, le plus simple est de systématiquement faire retoucher les résultats par un humain. Nous verrons si dans l’avenir les choses se clarifient.

Il se pose aussi la question des compétences, à la fois pour la génération (le fameux « prompt engineering ») et dans chaque secteur particulier de création (il faut en connaitre les bases, le vocabulaire). J’enfonce une porte ouverte mais j’aime bien rappeler qu’utiliser l’IA générative demande une période de formation. On peut très vite faire des choses, c’est le côté magique, mais pour faire des choses utiles, il faut se former. Comme ces outils évoluent à grande vitesse et sont particulièrement nombreux, j’ajouterai que la formation est permanente. Prévoyez donc du temps et du budget.

*Une estimation du gain de productivité lié à l’IA suite à une étude de Goldman Sachs*

C’est difficile de dire à qui l’IA générative est la plus utile, il semble que son utilisation entraine globalement une hausse de productivité. Mais certaines études paraissent apporter des débuts de réponses plus précises (en lien évidement avec les outils étudiés). Pour résumer un peu rapidement, elle va vraiment aider les personnes avec une compétence faible ou moyenne dans le métier, typiquement des profils juniors avec peu d’expérience. A vous de bien cibler les personnes à former !

Petite remarque : Il faut donc que la personne utilisatrice ait un minimum de compétence dans le domaine pour pouvoir à la fois expliciter son besoin et juger la qualité du résultat. Ne comptez donc pas transformer (en un coup de baguette magique) votre conceptrice 3D, votre graphique ou votre technicien « son » en spécialiste de la pédagogie ou de la narration. Encore une fois, le côté spectaculaire de l’IA générative est trompeur, vous aurez toujours des résultats, reste à savoir s’ils seront de qualité.

Est-ce que les modèles que vous allez utiliser ont des biais ou des alignements qui peuvent poser problèmes dans votre secteur ? La plupart des grands modèles ont travaillé sur leur biais (ça devrait être bon) mais ont des alignements très stricts (c’est moins bon). À vous de faire des tests pour évaluer tout cela et éventuellement trouver le bon modèle. Évidemment, si vous travaillez dans des secteurs « particuliers » comme la sextech, le domaine de la chirurgie ou de l’horreur, autant faire une croix tout de suite sur les modèles « grand public ».

L’IA générative en « temps réel »

On rentre ici dans les usages les plus spectaculaires et potentiellement les plus risqués. L’IA générative a le pouvoir de rendre plus fluides et plus naturelles toutes les interactions de votre expérience de RA. On imagine assez facilement une personne fictive qui peut vous parler naturellement dans une visite touristique ou dans un jeu. On peut aller bien plus loin puisque, dans un cas de maintenance industrielle, un générateur électrique peut lui aussi devenir un interlocuteur auquel on va poser des questions pour comprendre son problème ! L’utilisateur peut interagir naturellement avec potentiellement TOUS les éléments de l’expérience (tant qu’il y a de la donnée). Le potentiel d’immersion est énorme…

*Imaginez votre viste de Toronto en suivant un personnage capable de vous parler de manière naturelle (source : Visitez Toronto avec la réalité augmentée)*

Commençons par évoquer les contraintes techniques. Ici, l’IA est intégrée à votre application, il est donc évident que vous devez maîtriser l’aspect technique de l’intégration. Cette compétence va vous aider à optimiser votre application, à prévoir les évolutions en fonction de l’évolution du modèle d’IA et, en corollaire, à éviter une trop forte dépendance technique. J’insiste sur ce dernier point, car, comme nous l’avons vu précédemment, les fonctionnalités proposées par l’IA seront au cœur (si ce n’est le cœur) de votre application.

Notez également qu’un point important du choix est lié au modèle économique de votre propre application, puisque l’utilisation d’une IA (via API) n‘est pas gratuite et peut même couter très cher. Si les modèles sur étagère ne vous conviennent pas, vous aurez à entrainer le vôtre. Le cout associé à un tel entrainement s’écrit avec 5 ou 6 chiffres.

Maintenant que vous avez validé votre modèle et qu’il est entrainé, vous entrez dans la phase d’alignement avec vos objectifs. Le modèle, s’il vient d’un prestataire, est déjà aligné par le constructeur sur des objectifs en général assez larges et très souvent focalisés sur des considérations d’éthique et de sécurité. Vous devez être beaucoup plus précis et donner un rôle à votre IA pour bien contraindre son périmètre de réponse. Si par exemple, le modèle d’IA est utilisé pour rendre plus naturel les interactions avec un guide touristique virtuel du Palais Idéal du Facteur Cheval, vous allez à la fois l’instruire sur des documents relatifs au Palais et lui préciser son rôle de guide, pédagogique, facile à comprendre pour tous les âges, etc. Pour ceux et celles qui travaillent avec des outils de type chatGPT, c’est un sorte de pré-prompt à penser en amont. Mais cela ne suffit pas ! Que va-t-il se passer si l’utilisateur pose une question sur la Maison des Têtes de Valence ? Faut-il répondre ? et pour une question sur les recettes de cuisines adorées par la cousine de Ferdinand Chaval (le fameux facteur) ? Et pour une question sur ses orientation politiques ou sexuels ? Et pour demander un soutien morale aprés la perte de son travail ou aprés la mort de son chat ? Vous avez compris le principe : L’IA peut répondre à tout mais ce n’est pas ce que vous lui demandez ! Et aprés tout ce travail, faut-il mettre en place une étape supplémenttaire de filtre ou de modération ?

Evidemment, pour répondre aux questions des utilisateurs, votre modèle à besoin d’élements entrants, provenant directement de l’utilisateur ou l’utilisatrice. Je n’insiste pas sur les questions relatives à la protection de la vie privée et à la sécurité des données. Vous allez en brasser beaucoup et entre les réglements nationaux, vos obligations et les lois relatives à l’origine des entreprises proposant votre modèle d’IA, il y a quelques points à vérifer en amont.

Une ultime étape importante et pourtant souvent négligée, le suivi qualité de votre utilisation de l’IA. Une fois mise en service, l’IA va produire du contenu et vous pouvez donc facilement en estimer la qualité. A vous de définir des métriques adaptés à vos objectifs et de les suivre pour améliorer la satisfaction de vos clients.

Et maintetant ?

L’intégration de l’intelligence artificielle dans les systèmes de réalité augmentée ouvre des perspectives fascinantes. Est-ce que cela va transformer en profondeur nos interactions avec le monde numérique et physique ? J’en suis convaincu. Cela promet des applications plus intuitives et immersives mais cette fusion n’est pas exempte de défis.

J’insiste beaucoup dans cet article sur l’importance d’une montée en compétence dans les équipes de création des applications RA, quelque soit leur fonction et le secteur d’usage. Sans une formation adéquate, les entreprises risquent non seulement de ne pas exploiter pleinement le potentiel de l’IA, mais surtout de faire face à des problèmes graves en matière de sécurité des données et de fiabilité des systèmes.

Il me semble donc essentiel pour les entreprises de RA d’investir dans des programmes de formation continus convrant les aspects techniques, mais intégrant aussi des sensibilisation sur les implications éthiques et sécuritaires de ces technologies. Vivons-nous une révolution ? Je reste prudent sur ce terme que j’ai vu utilisé à tord et à travers ces 30 dernières années. Mais, clairement, nous ne travaillerons plus jamais comme avant, autant être pret 🙂

Intelligence artificielle et réalité augmentée, un couple fait pour durer !

L’IA « descriptive »

L’IA générative en « pré-calculé »

L’IA générative en « temps réel »

Et maintetant ?

Grégory MAUBON

Laisser un commentaire Annuler la réponse

L’IA « descriptive »

L’IA générative en « pré-calculé »

L’IA générative en « temps réel »

Et maintetant ?

Grégory MAUBON

Laisser un commentaire Annuler la réponse

Articles similaires