| |||||
| Auteur | Sujet : Intelligence artificielle |
|---|---|
trueslash (╯°□°)╯︵ MMM | Reprise du message précédent :
|
Publicité | Posté le 26-06-2023 à 18:38:45 ![]() ![]() |
tarpan66 |
On a bien interdit les statistiques "ethniques" --------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
tarpan66 |
--------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
trueslash (╯°□°)╯︵ MMM |
|
the_fennec f3nn3cUs z3rd4 |
Message cité 1 fois Message édité par the_fennec le 26-06-2023 à 19:33:35 --------------- Faudra que je teste un jour :o |
trueslash (╯°□°)╯︵ MMM | Un autre exemple: https://news.mit.edu/2022/machine-l [...] -data-0221
|
Ababakar Octopuce qui foule de sa sandale les |
La question c'est : quel sens ça a de dire que le modèle est biaisé, quand pour une fois justement, on sait qu'il ne lest pas, que l'échantillon utilisé pour l'entrainement est tout à fait représentatif de la population générale ET que "un humain représentatif de la population générale", c'est précisément la question que l'on pose (demander une image d'un humain "nurse" typique). Evidemment qu'il y a des tas de cas dans lesquels ces questions sont épineuses et demandent filtrage des données d'entrainement et tuning, mais PAS dans les cas dont on discute ici. Si je demande à un générateur d'image de me générer "un humain typique français qui fait tel ou tel métier", et que l'IA me fait une réponse dans laquelle l'humain en question a une apparence physique (sexe, couleur de peau) en accord avec les stats officielles sur le sujet, on ne peut pas parler de "biais". La réponse de l'IA peut mettre en évidence un problème dans la réalité, dans la société, mais dans ce cas précis, ce n'est pas un biais du modèle. On discute d'un cas particulier ici, pas du cas général, et si on en discute en particulier, c'est justement parce qu'à mon avis, ce qui est vrai d'habitude ne l'est précisément plus ici. Message cité 2 fois Message édité par Ababakar Octopuce le 27-06-2023 à 12:05:20 |
donut78 Stop eating donuts |
--------------- Du calme, pose ce poireau et tout se passera bien. Ne m'oblige pas à faire une roulade arrière ... |
Ababakar Octopuce qui foule de sa sandale les |
Ben c'est de là que part la discussion : une IA qui montrait une femme 90 fois sur 100 quand on lui demandait "a nurse", ce qui correspond effectivement au taux de nurse femmes dans la population générale. Pour moi, là (dans ce cas particulier), l'IA n'est pas "biaisée" (à ce niveau là en tout cas). Si le résultat est "choquant", il ne traduit pas pour autant un problème au niveau du modèle, mais plutôt un problème au niveau de la réalité. Message cité 2 fois Message édité par Ababakar Octopuce le 27-06-2023 à 12:10:59 |
tarpan66 | Réponse de béotien : ces générateurs fonctionnent sur des statistiques et non des probabilités, donc la statistique restera la même à chaque tirage. --------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
Publicité | Posté le 27-06-2023 à 12:09:20 ![]() ![]() |
donut78 Stop eating donuts |
--------------- Du calme, pose ce poireau et tout se passera bien. Ne m'oblige pas à faire une roulade arrière ... |
the_fennec f3nn3cUs z3rd4 | J'ai retrouvé l'article, mais j'y ai pas accès:
--------------- Faudra que je teste un jour :o |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Zorglub2016 |
Message cité 1 fois Message édité par Zorglub2016 le 27-06-2023 à 13:30:26 --------------- "Le zigzag est le plus court chemin entre un bar et un autre: J'y ai vomi mon Cognac, j'ai vomi l'Homme, j'ai vomi sa bêtise, je vomis sa prétention." |
tarpan66 | Pour "Amérindien" , généré par Craiyon :
--------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
Ababakar Octopuce qui foule de sa sandale les |
Là, tout le souci est de valider ce que signifie "bien paramétrée" : on n'est pas dans le cas simple d'un critère bien défini, unique et binaire (homme/femme) dont on connait parfaitement la répartition dans la population générale considérée (les nurses, par exemple). Et justement, là, on rentre dans les cas où les biais vont être systématiques, car il sera très difficile de créer une base "objective" au sens "dont l'échantillon est réparti de façon similaire à la population générale du point de vue de chacun des paramètres (dont la plupart ne sont en plus même pas forcément identifiés/labelisés)". Mais imaginons quand même qu'on y arrive, et que là aussi "bien paramétrée" signifie "base d'apprentissage = échantillon représentatif de la population générale", à quoi je m'attendrais dans chacun des cas : Ongulata : déjà, ça va dépendre de quelle définition on admet. Ensuite, "bien paramétrée sur des stats", supposons que ça veuille dire que l'on dispose d'un comptage dont on sait qu'il n'a pas lui même de biais (aucun animal ne s'est caché ou n'a pas rempli sa fiche le jour du recensement Après, si on demande précisément un ongulé sauvage, toujours sans plus de précision que ça dans le prompt, bah je m'attends à ce que sa réponse suive également la répartition. Pour Carnivora, pareil, mais 90% de chiens ou chats domestique. Pareil, ça deviendrait probablement plus intéressant et varié si on précise "sauvage". Dans ces deux premiers cas, justement, le retour de l'IA permet peut être de prendre conscience qu'on avait nous même une vision faussée de la réalité si on s'attendait à ce que ça nous sorte un tapir ou un tigre du Bengale, et met en évidence, pour ceux pour qui se sera une surprise, à quel point l'homme a foutu le bordel là dedans. Ce qui d'un point de vue éducatif est pas mal, je trouve. Pet : je vois mal sur quelle source de donner s'appuyer pour savoir quel animal émet le plus de flatulence et essayer de rendre plus souvent cet animal là, et ce serait un peu compliqué de constituer la base d'exemple car nécessaire de prendre la photo sur le vif. Navire : un peu comme pour les ongulés, ça désigne un tas de bateaux différents. Mais il me semble (là j'ai pas les chiffres, je dis ça au doigt mouillé) que les plus nombreux sont les voiliers de plaisance (en nombre, j'imagine devant les bateaux de pêche et le transport maritime de produits), donc je m'attends à ce que ça me montre plus souvent ce genre de bateau. Message cité 1 fois Message édité par Ababakar Octopuce le 27-06-2023 à 14:13:55 |
tarpan66 |
--------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
Ababakar Octopuce qui foule de sa sandale les | Non mais là c'est pour répondre à la question posée, c'est à dire qu'on se place dans le cas hypothétique d'une IA qui aurait été entrainée avec une base d'apprentissage dont la répartition correspond à la répartition dans la population générale considérée. Donc évidemment PAS les IAs génératives que tu interroges, qui n'ont pas été entrainées comme ça, et qui correspondent plutôt à ce que les gens ont en tête, en accord avec leur représentation "erronée" de la proportion animaux d'élevages/animaux sauvages. Par contre, les étiquetage ne sont pas exclusifs (ce n'est pas parce qu'un chat est étiqueté "animal de compagnie" qu'il ne peut pas être aussi étiqueté "carnivore", "mammifère", "eucaryote"...), et surtout, un animal étiqueté "chat" est implicitement étiqueté "carnivora" puisque tous les chats sont des carnivores et que ce genre d'IA traite le langage donc possède cette "connaissance" implicitement. Message cité 1 fois Message édité par Ababakar Octopuce le 27-06-2023 à 14:43:51 |
tarpan66 |
La question était posée au présent, pas au conditionnel…
C'est la fréquence d'étiquetage qui doit jouer…
--------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
Ababakar Octopuce qui foule de sa sandale les |
La question était "Quelle image donne une IA bien paramétrée sur des stats aux questions (montrer image de) :". Une telle IA n'existe pas (une IA paramétrée par rapport aux stats de répartition des machins cités en question), mais ça n'empêche pas de se poser la question de ce à quoi on s'attend d'une telle hypothétique IA. Et puis ma réponse, dont tu quotes un extrait, commence par "Imaginons quand même qu'une telle IA existe :"
Je répète que : Message édité par Ababakar Octopuce le 27-06-2023 à 16:36:46 |
tarpan66 | Tu as mal compris mon propos. Evidement que plusieurs étiquettes sont associées à un item et ne sont pas exclusives. La preuve par l'exemple c'est que "chat" n'apparait pas dans la liste des 10 "félins" mais apparait en premier dans "félins doux". Message édité par tarpan66 le 27-06-2023 à 16:54:27 --------------- [TU] - Légumes Fermentés, choucroute, kimchi et autres lactos |
bulle_d'o Bonne soeur | Dommage de ne retenir que l'histoire des biais de l'ia dans les extraits quotés. --------------- |
trueslash (╯°□°)╯︵ MMM |
|
Zorglub2016 | Retenez les biais sans histoires.
Message édité par Zorglub2016 le 27-06-2023 à 20:50:15 --------------- "Le zigzag est le plus court chemin entre un bar et un autre: J'y ai vomi mon Cognac, j'ai vomi l'Homme, j'ai vomi sa bêtise, je vomis sa prétention." |
bulle_d'o Bonne soeur |
--------------- |
trueslash (╯°□°)╯︵ MMM |
|
bulle_d'o Bonne soeur | C'est peut-être ma déformation de juriste mais lire une phrase qui parle de biais avec un " : " accompagné de quote, ça laissait penser que tu te focalisais dessus --------------- |
the_fennec f3nn3cUs z3rd4 | Ça me fait directement penser à ça:
--------------- Faudra que je teste un jour :o |
bulle_d'o Bonne soeur | Les essperts apprécieront le mépris --------------- |
the_fennec f3nn3cUs z3rd4 | Toute la valeur d'une donnée vient de sa véracité. Déjà qu'en statistique tu peux facilement perdre en précision, alors si tes données sont "générées" ça va être la fête --------------- Faudra que je teste un jour :o |
trueslash (╯°□°)╯︵ MMM |
|
the_fennec f3nn3cUs z3rd4 | Je suis currieu, tu as des exemples ou c'est vraiment utile? Pour l'AI je pensais que faire du training sur des données générées donnait un modèle de (très) mauvaise qualité. --------------- Faudra que je teste un jour :o |
bulle_d'o Bonne soeur | Gros potentiel pour la santé, les données médicales sont très très protégées et les synthétiser pourra permettre de les exploiter et les protéger pour les recherches/transfert vers les USA/stockage sur un cloud tout en respectant la vie privée des patients. --------------- |
trueslash (╯°□°)╯︵ MMM | Par exemple oui, c'est aussi assez utile avec les données bancaires, pour les techniques de détection de fraude. |
the_fennec f3nn3cUs z3rd4 | (Pour info je fais des formations HIPAA et PCI chaque année, un plaisir a chaque fois --------------- Faudra que je teste un jour :o |
bulle_d'o Bonne soeur | Synthétiser des données ça ne reste que. une méthode d'anonymisation comme une autre. C'est donc un traitement de données en tant que tel qui doit être conforme à la réglementation du coin.
--------------- |
trueslash (╯°□°)╯︵ MMM |
|
bulle_d'o Bonne soeur |
--------------- |
the_fennec f3nn3cUs z3rd4 |
--------------- Faudra que je teste un jour :o |
Publicité | Posté le ![]() ![]() |

| Sujets relatifs | |
|---|---|
| Intelligence artificielle : conceptualisation et formulation | intelligence artificielle pour jeu puissance4 avec matlab |
| L'intelligence artificielle est-elle la bien venue parmis les hommes. | Intelligence artificielle....demain |
| robot et intelligence artificielle | INTELLIGENCE ARTIFICIELLE |
| Intelligence artificielle : vous y croyez ? | Intelligence artificielle |
| l'intelligence artificielle | L'intelligence artificielle ! |
| Plus de sujets relatifs à : Intelligence artificielle | |





