lundi 11 juin 2007

Convertir un fichier odt en texte

Horreur, il n'y a pas OpenOffice sur votre machine ! pas de panique perl est là :)

use Archive::Zip;
my ($file) = @ARGV;
my $zip = Archive::Zip->new();
unless ( $zip->read( $file ) == AZ_OK ) {
die 'read error';
}
my $content = $zip->contents('content.xml');
$content =~ s/<[^\<\>]*>/\n/g;
$content =~ s/\n+/\n/g;
print $content;

Et nous voici avec un texte certes sans mise en forme mais parfaitement lisible pour peut que votre console supporte l'utf-8.
On peut aussi remplacer content.xml par meta.xml qui vous donnera plein d'infos sur l'origine du fichier.

Aucun commentaire:

Enregistrer un commentaire