Bonjour,
Dans un besoin d'indexation de documents de type pdf ou autres dans mon Intranet de gestion de contenu (type CMS)
J'ai besoin de fonction ou d'un script permettant soit le parcourir le contenu d'un Pdf soir d'en prendre tous les mots afin de les mettre dans un champ de ma BD sous Mysql.
Il existe fpdf comme classe, mais celle-ci ne permet que de générer du pdf et pas d'en extraire du texte.
Sinon il y a l'utilitaire PDF2Txt mais celui-ci est payant.
Avez-vous une idée sur comment faire, j'ai essayé fopen de Php mais bien sur il m'extrait que des signes imcompréhensibles d'un pdf.
Merci pour votre aide.
Message édité par defjay le 16-02-2007 à 16:51:19