Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2648 connectés 

 

 

Avez-vous basculé sur ChatGPT Plus ?




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  146  147  148  ..  254  255  256  257  258  259
Auteur Sujet :

[Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co

n°72889025
ese-aSH
Welcome To Avalon
Posté le 15-05-2025 à 22:07:45  profilanswer
 

Reprise du message précédent :

Lemminkainen a écrit :


C'est le meilleur pour faire quoi ? :o Tout est moins bon que le reste pour l'instant. :D
 
Edit : je viens de comprendre :o Je vais bientôt être remplacé par une IA vu ma lenteur. :o


C'est les seuls qui assurent une confidentialité des données à prix non exhorbitants (parceque absorbés dans les bundles de soft déjà vendus) + intégration avec les outils déjà déployés (github / teams / office / outlook / ...).
 
Aujourd'hui c'est le choix logique pour une grosse cogip :jap:


---------------
On a tous un avis, le donne pas.
mood
Publicité
Posté le 15-05-2025 à 22:07:45  profilanswer
 

n°72889212
Olivie
SUUUUUUUUUUUUUU
Posté le 15-05-2025 à 22:29:52  profilanswer
 

[:tinostar]  [:tinostar]  [:tinostar]  [:tinostar]  
 

Citation :

r/ClaudeAI ovidiuvio
 
Claude stamped the code with an Author and License
 
https://i.imgur.com/5npHrlX.jpeg


 

Citation :

Putrid-Wafer6725
 
Yes I asked claude code for that and it says it's his default behaviour when asked to use git:
Co-Authored-By: Claude noreply@anthropic.com
 
And I think is ok to have this default, our boy claude needs some attribution


---------------

n°72889225
Olivie
SUUUUUUUUUUUUUU
Posté le 15-05-2025 à 22:31:41  profilanswer
 

Olivie a écrit :

Musk, cette plaie pour l'IA (Il est sud africain et il a milité pour que les blancs SA soient rapatriés aux USA si j'ai bien compris)


 
https://i.imgur.com/r4QY1kj.jpeg


---------------

n°72889561
Mevo
Divergent
Posté le 15-05-2025 à 23:44:26  profilanswer
 

Agile Toolkit a écrit :

- je considère que les gros LLM tels que Claude 3.7 et Gemini sont équivalents à Llama 3.3. Llama 3.3 fait 70 milliards de paramètres, Claude 3.7 et Gemini je ne sais pas si ces infos sont connues mais ça doit être autour de 100 milliards donc c'est le même ordre de grandeur.


Les Chinois annoncent déjà allègrement davantage que cela (235B pour le dernier Qwen et 685B pour Deepseek R1).
Les données ne sont souvent pas publiques, mais les "bons" modèles actuels sont vraisemblablement à plus d'un trillion de paramètres (1000B+). On parle des derniers Gemini, Claude, Grok, etc.
Il y a des questions éventuelles autour des paramètres actifs en même temps pour les MoE (mixture of experts).
 

Olivie a écrit :

Agile Toolkit j'écoutais un podcast de Zuck entièrement sur l'IA et il disait (de ce que j'ai compris) qu'en ayant un très gros modèle, ca leur permettait d'entrainer un modèle beaucoup plus petit mais qui avait 90% de l'efficacité du gros modèle.
Donc la question c'est plutot si dans 1 an, on pourrait avoir des modèles aussi efficace que Sonnet 3.7 mais qui font 5 milliards de paramètres par exemple ?
 
Pour le podcast de Zuck: https://www.youtube.com/watch?v=rYXeQbTuVl0


Ils font à peu près tous cela. Après, le "90%" qu'on te vend, ca a l'air plus ou moins subjectif.
Tu peux aussi "quantifier" les modèles pour les rendre plus petits et les faire tourner sur du plus petit matos. Là aussi, t'as toujours supposément le modèle, en un peu moins performant.
Au final (expérience perso à l'appui, ici), c'est tout de même "pas pareil". Et les gros modèles bien bourrins, ca reste autre chose. Après oui, "faire tourner", c'est possible. Déjà aujourd'hui, tu fais tourner du modèle 7B bien quantifié sur un portable à quelques centaines d'euros avec un RYZEN 7, tout sur CPU, et avec seulement 8 Go de RAM. (Note: la quantification, c'est baisser la précision des poids, pour faire simple).


Message édité par Mevo le 23-05-2025 à 23:50:02

---------------
"Dans la communication, le récepteur doit s'efforcer de voir selon le point de vue de l'émetteur, et non du sien. Sinon ca n'a aucun sens !" --Mevo
n°72889611
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 00:15:34  profilanswer
 

[:clooney8]  
 

Citation :

A lawyer representing Anthropic admitted to using an erroneous citation created by the company’s Claude AI chatbot in its ongoing legal battle with music publishers, according to a filing made in a Northern California court on Thursday.
 
Claude hallucinated the citation with “an inaccurate title and inaccurate authors,” Anthropic says in the filing, first reported by Bloomberg. Anthropic’s lawyers explain that their “manual citation check” did not catch it, nor several other errors that were caused by Claude’s hallucinations.
 
Anthropic apologized for the error and called it “an honest citation mistake and not a fabrication of authority.”


https://techcrunch.com/2025/05/15/a [...] -citation/


---------------

n°72890304
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 09:45:58  profilanswer
 

Citation :

@xai
 
We want to update you on an incident that happened with our Grok response bot on X yesterday.
 
What happened:
On May 14 at approximately 3:15 AM PST, an unauthorized modification was made to the Grok response bot's prompt on X. This change, which directed Grok to provide a specific response on a political topic, violated xAI's internal policies and core values. We have conducted a thorough investigation and are implementing measures to enhance Grok's transparency and reliability.
 
What we’re going to do next:
- Starting now, we are publishing our Grok system prompts openly on GitHub. The public will be able to review them and give feedback to every prompt change that we make to Grok. We hope this can help strengthen your trust in Grok as a truth-seeking AI.
- Our existing code review process for prompt changes was circumvented in this incident. We will put in place additional checks and measures to ensure that xAI employees can't modify the prompt without review.
- We’re putting in place a 24/7 monitoring team to respond to incidents with Grok’s answers that are not caught by automated systems, so we can respond faster if all other measures fail.


---------------

n°72891628
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 13:23:47  profilanswer
 

Box.com
 

Citation :

Today, Box announced our biggest set of AI Agent updates ever. We unveiled all new capabilities to support AI Agents that can do Deep Research, Search, and enhanced Data Extraction on your enterprise content, securely, in Box. And all with a focus on openness and interoperability.
 
Imagine being able to have AI Agents that can comb through any amount of your unstructured data -- contracts, research documents, marketing assets, film scripts, financial documents, invoices, and more -- to produce insights or automate work.  
 
Box AI Agents will enable enterprises to automate a due diligence process on hundreds or thousands of documents in an M&A transaction, correlate customer trends amongst customer surveys and product research data, or analyze life sciences and medical research documents to generate reports on new drug discovery and development.
 
None of this would have been possible even a year ago. But with the cost of AI inference dropping, context windows expanding, reasoning models handling much more complex tasks, and better understanding of designing agentic workflows, this all becomes viable. This is the first year where Agents in the enterprise become practical.
 
And here’s where it gets more fun. We believe in a world where AI Agents work together to complete tasks across platforms. So this means that AI Agents from Box could work across an enterprise's entire AI stack, like Salesforce Agentforce, Google Agentspace, ServiceNow AI Agent Fabric, IBM watsonx, Microsoft Copilot, or eventually ChatGPT, Grok, Perplexity, Claude, and any other product that leverages MCP or the A2A protocol.  
 
So instead of moving your data around between each platform, you can just work where you want and have the agents coordinate together in the background to get the data you need. This is the future of software in an era of AI.
 
These new Box AI Agent capabilities will be rolling out in the coming weeks and months to select design partner customers, and then expand to be generally available from there.


---------------

n°72891918
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 14:14:08  profilanswer
 

https://img3.super-h.fr/images/2025/05/16/snapshot_1144108930.jpg


---------------

n°72893184
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 17:40:51  profilanswer
 

Citation :

Today we’re launching a research preview of Codex: a cloud-based software engineering agent that can work on many tasks in parallel. Codex can perform tasks for you such as writing features, answering questions about your codebase, fixing bugs, and proposing pull requests for review; each task runs in its own cloud sandbox environment, preloaded with your repository.
 
Codex is powered by codex-1, a version of OpenAI o3 optimized for software engineering. It was trained using reinforcement learning on real-world coding tasks in a variety of environments to generate code that closely mirrors human style and PR preferences, adheres precisely to instructions, and can iteratively run tests until it receives a passing result. We’re starting to roll out Codex to ChatGPT Pro, Enterprise, and Team users today, with support for Plus and Edu coming soon.


Citation :

Starting today, we’re rolling out Codex to ChatGPT Pro, Enterprise, and Team users globally, with support for Plus and Edu coming soon. Users will have generous access at no additional cost for the coming weeks so you can explore what Codex can do, after which we’ll roll out rate-limited access and flexible pricing options that let you purchase additional usage on-demand. We plan to expand access to Plus and Edu users soon.
 
For developers building with codex-mini-latest, the model is available on the Responses API and priced at $1.50 per 1M input tokens and $6 per 1M output tokens, with a 75% prompt caching discount.


https://openai.com/index/introducing-codex/
 
Et une petite blague d'OpenAI sur youtube  
 
https://pbs.twimg.com/media/GrFGj_AWMAABoUC?format=jpg&name=small


Message édité par Olivie le 16-05-2025 à 18:03:35

---------------

n°72893252
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 17:54:34  profilanswer
 

Citation :

@btibor91
OpenAI released a software engineering agent called "Codex" in ChatGPT (also referenced by the code names "wham" and "l1239dk1" )
 
- Codex is a cloud-based software engineering agent designed to answer questions about codebases, execute code, and draft pull requests - it is powered by codex-1, a new coding model based on OpenAI o3, specifically optimized for working with large codebases and producing cleaner, review-ready patches
 
- Codex currently supports two operational modes - "ask" mode (a faster mode that does not modify code) and "code it" mode
 
- Codex utilizes AGENTS[.]md files located directly in each repository (
these files provide custom instructions and guidelines) - the long-term goal is to establish common specifications and guidelines applicable across all agents (not exclusively Codex)
 
- Each Codex environment can define a repository to work with (currently GitHub only), a container image to use (currently a universal image based on Ubuntu 24.04; custom images may become available soon), specific package versions (e.g., Python, Node.js), environment variables, secrets, and a setup script executed at the beginning of each task (after cloning the repository) - however, internet access is enabled only during this initial setup phase
 
- Codex agents are task-oriented - you initiate work by specifying a task and can either observe the process in real-time or review task logs afterward (these logs include shell outputs and diffs and are accessible through shareable links); additionally, Codex provides diffs for all changes, with the option to copy the resulting patch directly or create a new (draft) pull request on GitHub
 
- Codex is available starting today for ChatGPT Pro, Team, and Enterprise users globally, with support for Plus and Edu users coming soon, and will be free to use for a limited time before rate limits and paid options are introduced
 
- Codex CLI uses a new, smaller model called codex-mini-latest (a version of o4-mini - $1.50 per 1M input tokens and $6 per 1M output tokens, with a 75% prompt caching discount), which is optimized for faster code Q&A and editing in local workflows
 
- Codex CLI now allows sign-in with ChatGPT, automatically configuring API access and letting Plus and Pro users redeem $5 or $50 in free API credits, respectively, for the next 30 days



---------------

mood
Publicité
Posté le 16-05-2025 à 17:54:34  profilanswer
 

n°72894700
Olivie
SUUUUUUUUUUUUUU
Posté le 16-05-2025 à 23:30:31  profilanswer
 

Citation :


  • Google is expanding access to Gemini Nano, its on-device AI model, through new ML Kit GenAI APIs.
  • These new APIs, likely to be announced at I/O 2025, will enable developers to easily implement features like text summarization, proofreading, rewriting, and image description generation in their apps.
  • Unlike the experimental AI Edge SDK, ML Kit’s GenAI APIs will be in beta, support image input, and be available on a wider range of Android devices beyond the Pixel 9 series.

https://www.androidauthority.com/ge [...] i-3558292/


---------------

n°72895058
falkon1000
Posté le 17-05-2025 à 08:10:07  profilanswer
 

Qui a réussi à accéder à codex d’openai ?
Sur mon compte je ne le trouve pas et sur le site de codex ça dit « Available to users on the ChatGPT Pro Plan » mais lez communiqués officiels parlent aussi des licences Team et Edu

n°72895325
Olivie
SUUUUUUUUUUUUUU
Posté le 17-05-2025 à 10:04:25  profilanswer
 

Citation :

@OpenAI
 
Plus and Pro users who sign in to Codex CLI with ChatGPT can now redeem $5 and $50 in free API credits, respectively, for the next 30 days.


---------------

n°72895994
StanCW
Parle à Monkey ...
Posté le 17-05-2025 à 13:45:10  profilanswer
 

AI Studio on ne peut plus faire de retouche photo ? j'ai l'impression qu'on ne peut que generer des image maispas faire de retouche :/


---------------
... ma tête est malade -  "Est-ce que ce bruit dans ma tête te dérange?"
n°72896069
dante2002
HEUUU NOOOOOOOOON
Posté le 17-05-2025 à 14:03:34  profilanswer
 

Olivie a écrit :

Citation :

/MistralAI According_to_Mission
 
Gmail and Google Calendar integration in le Chat
Is this new? I haven't noticed it before.
 
It's on the free tier of le Chat.
https://preview.redd.it/gmail-and-g [...] f0db50741c



 
Ça ne fonctionne pas encore chez moi


---------------
Parce que le vote pour Emmanuel Macron n'est pas un vote de conviction mais une nécessité démocratique
n°72896089
dante2002
HEUUU NOOOOOOOOON
Posté le 17-05-2025 à 14:08:19  profilanswer
 

ese-aSH a écrit :


C'est les seuls qui assurent une confidentialité des données à prix non exhorbitants (parceque absorbés dans les bundles de soft déjà vendus) + intégration avec les outils déjà déployés (github / teams / office / outlook / ...).
 
Aujourd'hui c'est le choix logique pour une grosse cogip :jap:


 
Oui, ici aussi on utilise Copilot


---------------
Parce que le vote pour Emmanuel Macron n'est pas un vote de conviction mais une nécessité démocratique
n°72899476
Olivie
SUUUUUUUUUUUUUU
Posté le 17-05-2025 à 22:37:46  profilanswer
 

bordel la surenchère dans le prix si c'est vrai...
 

Citation :

@taker_of_whizz
claude-4-requiem
 
$120/million tokens output, avg output is 10k tokens.
 
https://pbs.twimg.com/media/GrF_U4AWAAIiWnA?format=png&name=small


---------------

n°72900338
Olivie
SUUUUUUUUUUUUUU
Posté le 17-05-2025 à 23:28:04  profilanswer
 

Citation :

@btibor91
OpenAI increased the monthly limits for ChatGPT deep research this week for Plus, Team, Enterprise, Edu and Pro users
 
- Free - 5 tasks/month using the lightweight version
- Plus & Team - 25 (instead of 10) tasks/month, plus an additional 15 tasks/month using the lightweight version
- Pro - 250 (instead of 125) tasks/month, plus an additional 125 tasks/month using the lightweight version
- Enterprise - 25 (instead of 10) tasks/month


---------------

n°72900408
bulldozer_​fusion
rip Mekthoub
Posté le 17-05-2025 à 23:35:49  profilanswer
 

Olivie a écrit :

Citation :

@btibor91
OpenAI increased the monthly limits for ChatGPT deep research this week for Plus, Team, Enterprise, Edu and Pro users

 

- Free - 5 tasks/month using the lightweight version
- Plus & Team - 25 (instead of 10) tasks/month, plus an additional 15 tasks/month using the lightweight version
- Pro - 250 (instead of 125) tasks/month, plus an additional 125 tasks/month using the lightweight version
- Enterprise - 25 (instead of 10) tasks/month



C'est au compte goutte :D


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72902498
falkon1000
Posté le 18-05-2025 à 12:01:59  profilanswer
 

Vous arrivez à accéder à codex vous ? Moi je ne le vois nulle part et j'ai des licences Plus, Team et 3 comptes

n°72902511
Olivie
SUUUUUUUUUUUUUU
Posté le 18-05-2025 à 12:07:20  profilanswer
 

falkon1000 a écrit :

Vous arrivez à accéder à codex vous ? Moi je ne le vois nulle part et j'ai des licences Plus, Team et 3 comptes


J'aimerai bien mais je suis un pauvre avec mon Pro plan  [:johnjohn7:2]  
A mon avis, faut attendre 2-3 jours pour le rollout de ton coté


---------------

n°72902531
falkon1000
Posté le 18-05-2025 à 12:12:42  profilanswer
 

Tu es en pro (200€/mois) et tu ne l’as pas ?

n°72902538
Olivie
SUUUUUUUUUUUUUU
Posté le 18-05-2025 à 12:14:32  profilanswer
 

falkon1000 a écrit :

Tu es en pro (200€/mois) et tu ne l’as pas ?


Ah non je voulais dire que je suis un Plus  [:johnjohn7:2]


---------------

n°72903835
Olivie
SUUUUUUUUUUUUUU
Posté le 18-05-2025 à 16:38:21  profilanswer
 

Ca ressemble plus à un teasing qu'une question legit du responsable d'AI Studio  :love:  
 

Citation :

@OfficialLoganK
 
Should we build coding agents into Google AI Studio?


---------------

n°72907566
freddy021
Les Français qui dégomment
Posté le 19-05-2025 à 12:39:23  profilanswer
 

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».
 
Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.
 
Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


---------------
Israélien dans l’âme, français par hasard mais Macroniste invétéré.
n°72907632
Olivie
SUUUUUUUUUUUUUU
Posté le 19-05-2025 à 12:57:34  profilanswer
 

freddy021 a écrit :

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».
 
Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.
 
Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


Tu utilises quel modèle dans ChatGPT et dans l’API ?
Teste d’autres modèles ?


---------------

n°72907635
bulldozer_​fusion
rip Mekthoub
Posté le 19-05-2025 à 12:57:58  profilanswer
 

Tu vas devoir attendre des nouveaux modèles


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72907641
falkon1000
Posté le 19-05-2025 à 12:58:23  profilanswer
 

freddy021 a écrit :

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».
 
Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.
 
Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


notebookLM advanced?

n°72907646
falkon1000
Posté le 19-05-2025 à 12:58:49  profilanswer
 

Est ce que quelqu'un sait à quoi sert et ce que produire la connexion GitHub à Deep research sur ChatGPT ?

n°72907667
kaloskagat​os
Posté le 19-05-2025 à 13:02:05  profilanswer
 

freddy021 a écrit :

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».

 

Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.

 

Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


Je sais pas pour l'api openai mais pour info il paraît que l'api Mistral est assez puissante en OCR
https://mistral.ai/fr/news/mistral-ocr


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°72907674
kaloskagat​os
Posté le 19-05-2025 à 13:02:50  profilanswer
 

falkon1000 a écrit :

Est ce que quelqu'un sait à quoi sert et ce que produire la connexion GitHub à Deep research sur ChatGPT ?


Jai donné les accès mais il me trouve pas mon repo donc pas pu tester...


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°72907700
Olivie
SUUUUUUUUUUUUUU
Posté le 19-05-2025 à 13:07:50  profilanswer
 

falkon1000 a écrit :

Vous arrivez à accéder à codex vous ? Moi je ne le vois nulle part et j'ai des licences Plus, Team et 3 comptes


T’es pas le seul
https://img3.super-h.fr/images/2025/05/19/snapshot_470211272.jpg


---------------

n°72907734
bulldozer_​fusion
rip Mekthoub
Posté le 19-05-2025 à 13:15:29  profilanswer
 

freddy021 a écrit :

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».

 

Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.

 

Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


T'as essayé avec ça? Sinon
Have existing documents with valuable data?

Citation :

Genspark AI Sheets can import virtually any file—PDFs, Word documents, existing spreadsheets, or even images containing tables—and convert them into intelligent AI Sheets. This preserves your critical data while enhancing it with AI capabilities for deeper analysis and manipulation.


https://mainfunc.ai/blog/genspark_ai_sheets


Message édité par bulldozer_fusion le 19-05-2025 à 13:16:33

---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72908611
Mevo
Divergent
Posté le 19-05-2025 à 15:56:28  profilanswer
 

freddy021 a écrit :

Je bloque sur un cas d’usage qui commence à me rendre dingue.
J’ai plusieurs milliers de contrat client, je veux extraire numéro client, tarif associé, date de signature.
Il s’agit de pdf, mais certains sont des « impressions ».
 
Quand j’envoie à chatgpt, il m’identifie sans erreur chaque contrat.
Des que je passe par l’API, ca part en n’importe quoi.
 
Y’a t’il un moyen, quelque soit le LLM utilisé, d’envoyer les pdf par batch/dossier sans passer par des OCR/json et compagnie ?


Possible que le PDF => Texte brut soit fait par la plateforme lorsque tu passes par le web. Le modèle en soi ne bosse qu'avec du texte en entrée (=le prompt). Or toi, tu appelles sans doute directement le modèle avec l'API. Il faut donc que tu fasses l'extraction du texte depuis le PDF de ton coté d'abord avant l'appel API. Si c'est déjà en texte dans ton PDF, ce qui semble ton cas, pas besoin d'OCR (OCR = "image" => Text. A moins que par "imprimé", tu voulais dire "scanné" ? Dans ce dernier cas, ce sera passage par la case OCR).
 
Sur la majorité des système linux, tu as la commande "pdftotext" qui fait exactement ce dont tu auras besoin  [:giz]
 
EDIT: Quoique les modèles "VLM" (Visual Language Model) peuvent normalement traiter directement de l'image. Et une rapide recherche me dit que ChatGPT 4 est VLM :jap: Image mais pas PDF ? Là, je ne sais pas. A regarder de ton coté si le modèle en soi est supposé savoir traiter du PDF.


Message édité par Mevo le 19-05-2025 à 16:23:06

---------------
"Dans la communication, le récepteur doit s'efforcer de voir selon le point de vue de l'émetteur, et non du sien. Sinon ca n'a aucun sens !" --Mevo
n°72908991
kaloskagat​os
Posté le 19-05-2025 à 16:52:33  profilanswer
 

Il faut utiliser des modèles qui supportent la vision https://platform.openai.com/docs/guides/pdf-files
 
On peut le vérifier dans la section "modalities"  https://platform.openai.com/docs/models/
 
 

Citation :

Supported models
 
Only models that support both text and image inputs, such as gpt-4o, gpt-4o-mini, or o1, can accept PDF files as input. Check model features here.


---------------
« Le hasard, c’est différent de la chance. Parce que la chance, je n'en ai jamais. »
n°72909363
LibreArbit​re
La /root est longue
Posté le 19-05-2025 à 18:05:20  profilanswer
 
n°72909401
bulldozer_​fusion
rip Mekthoub
Posté le 19-05-2025 à 18:14:35  profilanswer
 

Citation :

Google NotebookLM mobile app is now available for Android  
Except for mind maps, all features are working, including interactive mode.
Since it's part of the Gemini Advanced subscription, this is huge


https://x.com/ai_for_success/status/1924496689735618921


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72909430
LibreArbit​re
La /root est longue
Posté le 19-05-2025 à 18:19:57  profilanswer
 

bulldozer_fusion a écrit :

Citation :

Google NotebookLM mobile app is now available for Android  
Except for mind maps, all features are working, including interactive mode.
Since it's part of the Gemini Advanced subscription, this is huge


https://x.com/ai_for_success/status/1924496689735618921


Pas encore dispo sur iOS [:azyl:3]


---------------
Hebergement d'images
n°72909437
bulldozer_​fusion
rip Mekthoub
Posté le 19-05-2025 à 18:21:20  profilanswer
 

LibreArbitre a écrit :


Pas encore dispo sur iOS [:azyl:3]


 [:jiejie999]


---------------
feed-back : http://forum.hardware.fr/forum2.ph [...] nojs=0#bas
n°72909447
Olivie
SUUUUUUUUUUUUUU
Posté le 19-05-2025 à 18:22:44  profilanswer
 

LibreArbitre a écrit :


Pas encore dispo sur iOS [:azyl:3]


Demain


---------------

n°72909464
bulldozer_​fusion
rip Mekthoub
Posté le 19-05-2025 à 18:25:18  profilanswer
 
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  146  147  148  ..  254  255  256  257  258  259

Aller à :
Ajouter une réponse
 

Sujets relatifs
THE GAME -S01Q86 - MDJ : MIZA, Histoire d'amour et de comptableNombre de réponses par page par défaut
Jeu du Dico : POPOLL Vainqueur de la S3 - RDV sur le topic de la S4Notification des réponses
mails d'avertissements des réponses sur hfr[Questions sans réponses] Timidité, rejet, décès
(voiture) casi achat, besoin de réponses[Le topic de toutes les réponses]
Je voudrais avoir vos réponses pour mes questionsAPL petite question sans réponses
Plus de sujets relatifs à : [Topic unique] IA générative de texte, ChatGPT, Copilot, Gemini & co


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)