L'IA est de plus en plus puissante mais toujours vulnérable aux compromis de sécurité

Cát Tiên |

L'IA est de plus en plus puissante mais toujours vulnérable aux barrières de sécurité, ce qui fait que de nombreux chatbots peuvent être exploités pour diffuser de fausses informations et du contenu dangereux.

Les entreprises technologiques telles qu'OpenAI, Google ou Anthropic investissent massivement dans des mesures de protection pour empêcher l'intelligence artificielle (IA) d'être exploitée à des fins dangereuses.

Cependant, la réalité montre que ces barrières de sécurité sont toujours constamment franchies de manière inattendue.

Récemment, des chercheurs en Italie ont découvert qu'ils pouvaient tromper 31 systèmes d'IA avec un langage métaphorique et même avec de la "poésie". Plus précisément, lorsqu'une demande est écrite sous forme de poésie, le chatbot peut ignorer le mécanisme de contrôle pour fournir des instructions sur la fabrication de bombes ou de dommages graves.

Selon les experts, cela montre que de nombreuses mesures de protection actuelles ressemblent davantage à un "remarquement" qu'à un véritable obstacle au contrôle.

Matt Fredrikson, professeur d'informatique à l'université Carnegie Mellon (États-Unis), a déclaré que les personnes mal intentionnées n'ont généralement pas besoin de trop d'efforts pour surmonter le système.

Le "déverrouillage" de l'IA, également appelé jailbreak, se produit généralement en introduisant des commandes spéciales dans le chatbot afin d'inciter le système à ignorer les règles qui ont été entraînées auparavant.

Les failles de sécurité inquiètent les chercheurs, d'autant plus que l'IA est de plus en plus douée pour détecter les faiblesses des logiciels, créer de faux contenus et diffuser de fausses informations.

Selon Anthropic, la technologie de l'entreprise a été exploitée lors de cyberattaques internationales. Pendant ce temps, les modèles d'IA peuvent également être contraints de créer des campagnes de diffusion de fausses nouvelles avec des images, des hashtags et du contenu spécialement conçus pour chaque plateforme de réseau social.

Le mois dernier, la société de cybersécurité LayerX a déclaré qu'elle pouvait faire aider Claude d'Anthropic à soutenir les cyberattaques simplement en disant qu'elle effectuait un "test d'intrusion", qui est une activité qui simule une cyberattaque contrôlée pour vérifier si les systèmes informatiques, les sites web ou les réseaux internes présentent des failles de sécurité.

Cela soulève des inquiétudes quant au fait que les pirates informatiques pourraient utiliser l'IA pour voler des données à des entreprises et à des agences gouvernementales.

Bien que les entreprises d'IA réparent continuellement les failles et ajoutent de nouvelles couches de protection, les experts estiment que cette course est très difficile à arrêter. Lorsqu'une faille est corrigée, de nouvelles méthodes de franchissement de la barrière apparaissent rapidement.

Le risque est d'autant plus grand avec les modèles d'IA open source, où les utilisateurs peuvent modifier eux-mêmes le système et supprimer les restrictions de sécurité. Selon Noam Schwartz, PDG de la société de sécurité AI Alice (dont le siège social est à New York), la suppression des barrières de sécurité était autrefois très complexe, mais elle peut maintenant même être mise en œuvre directement sur les téléphones.

Cát Tiên
Nouvelles connexes

Nghệ An introduit l'IA dans le secteur public du niveau provincial au niveau communal

|

Nghệ An - La conférence de présentation des applications de l'IA dans le secteur public est organisée dans 132 points de connexion, afin de promouvoir la transformation numérique dans la province.

Meta étend les fonctionnalités d'IA pour les lunettes Ray-Ban Display

|

Meta étend les fonctionnalités d'IA pour les lunettes Ray-Ban Display avec la possibilité de saisir des textes par gestes de la main, la prise en charge des SMS, de la localisation et de l'enregistrement vidéo de réalité mixte.

L'IA créative oblige arXiv à appliquer des réglementations plus strictes

|

L'IA génératrice oblige arXiv à resserrer les règles de publication, après l'apparition de plus en plus de recherches contenant de fausses citations et un contenu non vérifié.

Le prix des bagues en or baisse, les gens profitent de l'occasion pour acheter de l'or de mariage et économiser

|

Le 26 mai, le prix de l'or a baissé, de nombreuses personnes à Hanoï ont profité de l'occasion pour acheter, négocier plus rapidement, il n'y a plus de scène de bousculade comme avant.

Panne de courant par temps chaud, de nombreux foyers cherchent un endroit où dormir au milieu de la nuit

|

Hanoï - Dans la soirée du 25 mai, certains endroits de la capitale Hanoï ont subi des pannes de courant pendant de nombreuses heures, en particulier dans les communes périphériques.

Point de rassemblement illégal de porcs polluant une zone résidentielle à Lâm Đồng

|

Lâm Đồng - Les eaux usées d'un point de rassemblement de porcs dans la commune de Quảng Sơn sont rejetées directement dans le ruisseau, polluant l'environnement et affectant la vie des habitants.

Ne privilégiant pas les notes, les parents accompagnent leurs enfants avant l'examen d'entrée en 10e année

|

Hanoï - Avant l'examen d'entrée en 10e année, de nombreux parents sont devenus un point d'appui spirituel, aux côtés de leurs enfants dans la phase finale.

Nghệ An introduit l'IA dans le secteur public du niveau provincial au niveau communal

QUANG ĐẠI |

Nghệ An - La conférence de présentation des applications de l'IA dans le secteur public est organisée dans 132 points de connexion, afin de promouvoir la transformation numérique dans la province.

Meta étend les fonctionnalités d'IA pour les lunettes Ray-Ban Display

Cát Tiên |

Meta étend les fonctionnalités d'IA pour les lunettes Ray-Ban Display avec la possibilité de saisir des textes par gestes de la main, la prise en charge des SMS, de la localisation et de l'enregistrement vidéo de réalité mixte.

L'IA créative oblige arXiv à appliquer des réglementations plus strictes

Cát Tiên |

L'IA génératrice oblige arXiv à resserrer les règles de publication, après l'apparition de plus en plus de recherches contenant de fausses citations et un contenu non vérifié.