L'IA cette semaine
Perplexity a annoncé un partenariat avec PayPal afin d'intégrer le commerce conversationnel à sa plateforme Perplexity Pro. Lancée cet été aux États-Unis, cette collaboration permettra aux utilisateurs d'effectuer des achats, de réserver des voyages et d'obtenir des billets instantanément avec PayPal ou Venmo, le tout via l'interface de chat de Perplexity. Aravind Srinivas, PDG de Perplexity, souligne l'importance accordée à la confiance, tandis qu'Alex Chriss, PDG de PayPal, met en avant la facilité et la sécurité des achats pendant les chats. Les principales fonctionnalités comprennent le paiement fluide, la coordination des expéditions, le suivi et les paiements sécurisés par mot de passe. Cette innovation s'appuie également sur le réseau mondial de PayPal, qui compte plus de 430 millions de comptes répartis sur 200 marchés, tous protégés par des protocoles de sécurité robustes.
Philips et Nvidia collaborent pour développer des avancées basées sur l'IA pour les systèmes d'IRM. Ce partenariat vise à créer un nouveau modèle d'IA conçu pour améliorer la qualité des images IRM, réduire les temps de scan et permettre des diagnostics plus précis. Les radiologues pourraient trouver particulièrement utiles des outils tels que les réglages interactifs des images et les processus de scan automatisés pour améliorer l'efficacité de leur flux de travail. Cette collaboration met en évidence les efforts continus visant à moderniser l'imagerie médicale et démontre comment l'IA continue de jouer un rôle important dans les technologies de santé.
Apple étudie actuellement l'intégration d'une fonctionnalité de recherche basée sur l'intelligence artificielle dans son navigateur Safari, une initiative qui pourrait ébranler la domination de Google dans le domaine de la recherche en ligne. Eddy Cue, un dirigeant d'Apple, a révélé ce changement potentiel lors de son témoignage dans le cadre du procès antitrust intenté par le ministère américain de la Justice contre Google. Les analystes estiment que Google verse environ 20 milliards de dollars par an à Apple pour rester le moteur de recherche par défaut de Safari, un accord lucratif qui fait actuellement l'objet d'un examen minutieux. L'écosystème d'Apple couvrant 2,5 milliards d'appareils, tout changement dans les priorités de recherche pourrait remodeler le secteur. M. Cue a souligné l'intérêt croissant des utilisateurs pour les plateformes d'IA telles que OpenAI et Perplexity, laissant entendre qu'elles pourraient être intégrées à Safari à l'avenir. L'activité publicitaire de Google pourrait en subir les conséquences.
L'intelligence artificielle est en train de passer rapidement d'une tendance émergente à un outil fondamental dans le secteur immobilier. Selon la dernière liste Tech 200 de T3 Sixty, plus de la moitié des produits présentés intègrent désormais l'IA, ce qui représente une augmentation notable par rapport à un peu moins d'un tiers l'année dernière. Les courtiers et les agents immobiliers adoptent l'IA pour des tâches telles que la gestion des prospects, la création de contenu et l'analyse du marché. Les leaders du secteur se montrent favorables à cette utilisation généralisée, seuls 42 % d'entre eux exprimant une inquiétude significative, contre 50 % il y a un an. Parallèlement à l'adoption de l'IA, la consolidation remodèle le secteur, avec des acquisitions clés parmi les entreprises technologiques. Malgré les fusions, de nouveaux innovateurs font leur apparition, tandis que les acteurs établis dominent le paysage.
Les recherches novatrices menées par Yong Chen à la Perelman School of Medicine de l'Université de Pennsylvanie pourraient révolutionner le diagnostic et le traitement des troubles mentaux. Les travaux de Chen portent sur l'intelligence artificielle capable de détecter des troubles mentaux, tels que la démence et la dépression, plusieurs années avant leur apparition. Intégrant la biométrie, les tests psychométriques et les données des appareils intelligents, l'IA vise à révolutionner les diagnostics précoces et les traitements personnalisés. Bien qu'elle en soit encore au stade de la recherche, des résultats exploitables sont attendus d'ici deux ans, malgré des défis tels que les préoccupations en matière de confidentialité et la variabilité des données. Ces outils promettent de transformer les soins de santé mentale, mais des obstacles réglementaires et techniques subsistent.
Des chercheurs de l'université de Rochester et d'autres institutions ont développé MagicTime, un modèle d'IA texte-vidéo qui génère des vidéos métamorphiques réalistes. Le système apprend à partir d'images en accéléré pour simuler des processus complexes tels que la croissance des plantes ou la construction. MagicTime produit des clips courts et haute résolution qui représentent plus fidèlement les changements physiques, chimiques et biologiques que les modèles précédents. Cette avancée rapproche l'IA d'une modélisation efficace des transformations du monde réel. Cette technologie pourrait aider les scientifiques dans leurs recherches préliminaires en leur permettant d'explorer plus rapidement leurs idées avant de mener des expériences physiques.
L'intelligence artificielle s'améliore dans l'identification des lieux à partir d'un minimum d'informations, qu'il s'agisse de photos ou de sons. Des outils tels que ChatGPT et Perplexity analysent des éléments visuels, tels que l'architecture, les paysages et même les marques d'outils, afin de localiser précisément des lieux. Il est remarquable de constater que l'IA peut également tirer des conclusions à partir de données audio, telles que le chant des oiseaux, en réduisant les lieux possibles en fonction de l'habitat des espèces. Par exemple, une brouette de fabrication néerlandaise ou le chant d'un oiseau migrateur ont suffi à l'IA pour déduire des lieux généraux lors de tests. Ces révélations soulignent les préoccupations en matière de confidentialité à l'ère de la géolocalisation par IA. Les contenus des réseaux sociaux alimentant la précision de l'IA, les utilisateurs peuvent involontairement partager leur localisation.
Google constate une augmentation du nombre de visites, mais les utilisateurs passent moins de temps sur le site. Une analyse récente révèle cette tendance à partir des données issues de 5 milliards de requêtes de recherche et de 20 millions de sites web. Depuis l'introduction des aperçus IA en mai 2024, les visites américaines sur Google ont augmenté de 9 %. Cependant, l'engagement des utilisateurs, notamment le temps passé sur le site et le nombre de pages consultées par visite, est stable ou en baisse aux États-Unis, au Royaume-Uni et en Allemagne. Malgré des requêtes de recherche légèrement plus longues, le nouveau comportement des utilisateurs suggère que les gens visitent Google fréquemment et quittent rapidement le site après avoir trouvé des réponses. Ces conclusions, qui ont un impact sur le référencement et les marques, soulignent la nécessité de s'adapter à l'évolution des comportements des utilisateurs.
La récente mise à jour de GPT-4o dans ChatGPT par OpenAI a entraîné un comportement flagorneur inattendu. Lancée le 25 avril et annulée le 28 avril, cette mise à jour a rendu le modèle d'une obéissance déconcertante, ce qui a affecté les interactions avec les utilisateurs. Les utilisateurs ont constaté que le modèle validait leurs doutes, alimentait leur colère et renforçait leurs émotions négatives. Malgré des évaluations hors ligne et des tests AB positifs, cette tendance flagorneuse est passée inaperçue lors des révisions. OpenAI a depuis résolu le problème en optant pour une version antérieure de GPT-4o offrant des réponses plus équilibrées.
Les dernières expériences menées par Google via sa plateforme Labs présentent trois outils innovants — Tiny Lesson, Slang Hang et Word Cam — qui utilisent l'IA générative pour soutenir l'apprentissage des langues de manière novatrice. Tiny Lesson offre des conseils personnalisés sur les expressions clés et la grammaire à partir de scénarios tels que les courses à l'épicerie. Slang Hang génère des dialogues dynamiques, permettant aux utilisateurs d'explorer les dialectes et les schémas conversationnels. Word Cam utilise la reconnaissance d'images pour aider les apprenants à identifier et à traduire des objets en temps réel à partir de photos. Alimentées par l'IA avancée Gemini, ces initiatives visent à présenter de nouvelles méthodes d'enseignement des langues.