[ruby-fr:1361] Conversion de charset

View: New views
5 Messages — Rating Filter:   Alert me  

[ruby-fr:1361] Conversion de charset

by Yann Klis :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Salut à tous,

J'aimerais simplement savoir comment trouver le charset d'un fichier ou
d'une chaîne de caractère, de façon à éventuellement convertir le
fichier avec iconv vers le format UTF-8 si le fichier n'est pas au
format UTF-8.

++

yk


[ruby-fr:1362] Re: Conversion de charset

by Dave Null :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

> J'aimerais simplement savoir comment trouver le charset d'un fichier ou
> d'une chaîne de caractère, de façon à éventuellement convertir le
> fichier avec iconv vers le format UTF-8 si le fichier n'est pas au
> format UTF-8.

Tu as essayé charguess ?

--
Jaco


[ruby-fr:1363] Re: Conversion de charset

by Bertram Scharpf :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Salut,

Am Dienstag, 18. Jul 2006, 14:00:32 +0200 schrieb Yann Klis:
> J'aimerais simplement savoir comment trouver le charset d'un fichier ou
> d'une chaîne de caractère, de façon à éventuellement convertir le
> fichier avec iconv vers le format UTF-8 si le fichier n'est pas au
> format UTF-8.

Peut-être par convertir il vers latin1:

  i = Iconv.new "latin1", "utf-8"
  r = i.iconv a rescue a

et inversement

  j = Iconv.new "utf-8", "latin1"
  r = begin ; i.iconv a ; a ; rescue ; j.iconv a ; end

Bon courage,

Bertram


--
Bertram Scharpf
Stuttgart, Deutschland/Germany
http://www.bertram-scharpf.de


[ruby-fr:1364] Re: Conversion de charset

by Yann Klis :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Bertram Scharpf a écrit :

> Salut,
>
> Am Dienstag, 18. Jul 2006, 14:00:32 +0200 schrieb Yann Klis:
>  
>> J'aimerais simplement savoir comment trouver le charset d'un fichier ou
>> d'une chaîne de caractère, de façon à éventuellement convertir le
>> fichier avec iconv vers le format UTF-8 si le fichier n'est pas au
>> format UTF-8.
>>    
>
> Peut-être par convertir il vers latin1:
>
>   i = Iconv.new "latin1", "utf-8"
>   r = i.iconv a rescue a
>
> et inversement
>
>   j = Iconv.new "utf-8", "latin1"
>   r = begin ; i.iconv a ; a ; rescue ; j.iconv a ; end
>
> Bon courage,
>
> Bertram
>
>
>  
Je vais peut-être dire une grosse bêtise (ou alors je n'ai pas tout
compris), mais Iconv n'émet aucune exception au cas où le charset n'est
pas celui qu'on spécifie dans le 2ème caractère, ie Iconv fera toujours
une conversion sans se soucier du charset réel de la source.

++

yk



[ruby-fr:1365] Re: Conversion de charset

by Kaspar Schiess :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Salut,

> Je vais peut-ˆtre dire une grosse bˆtise (ou alors je n'ai pas tout
> compris), mais Iconv n'‚met aucune exception au cas o— le charset n'est
> pas celui qu'on sp‚cifie dans le 2Šme caractŠre, ie Iconv fera toujours
> une conversion sans se soucier du charset r‚el de la source.
Oui. En fait, il y a pas de moyen réel pour distinguer les charsets de
manière générale. Il faudrait commencer par dire lesquels tu veux
distinguer (les charsets possibles de ton fichier) et à la suite trouver
les différences entre ceux.

Example: 8bit latin1, utf-8. Il se peut que dans ton texte, les
dedoublements de utf-8 ont pas lieu du tout; tout charactère peut
s'exprimer avec les 8bits de utf-8. Comment faire la difference?

Generalement, ce qui se fait est de mémoriser le charset du fichier quelque
part.

Bonne chance,
kaspar

--
neotrivium.com - swiss ruby shop