iconv cp852 , cp1250, utf 8

View: New views
5 Messages — Rating Filter:   Alert me  

iconv cp852 , cp1250, utf 8

by Ferenc Szabó :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Üdv mindenkinek.

Belefutottam egy olyan problémába, hogy egy dosos rendszerből kell
adatokat importálnom, és ott az alap kódolás cp852. ezt át is tudom
konvertálni utf-8-ra.
Viszont a dosos rendszer is importált adatokat egy másik rendszerből,
ahol cp1250-es volt a kódolás és a dos nem konvertált rajta semmit. és
ezután, ha a dosos programmal beleírnak, akkor csak az a pár karakter
lesz cp852 amit utólag írtak bele.
magyarul az adatokban van sok olyan, hogy pár karakter cp852 aztán
néhány jön cp1250-nel , és így tovább.

hogy tudnám ellenőrizni, hogy miről kell konvertálnom?

üdv:
SzF
--
Weblabor hírlevél: http://weblabor.hu/hirlevel
--
wl-phplista (wl-phplista@...) levelezőlista
https://bors.hoszting.com/mailman/listinfo/wl-phplista
Keresheto archivum: http://weblabor.hu/kereses
--
etikett: http://weblabor.hu/levlistak/illemszabaly
offlista: https://weblabor.hu/levlistak

Re: iconv cp852 , cp1250, utf 8

by Pintér Tibor (tibyke)-2 :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

> Belefutottam egy olyan problémába, hogy egy dosos rendszerből kell
> adatokat importálnom, és ott az alap kódolás cp852. ezt át is tudom
> konvertálni utf-8-ra.
> Viszont a dosos rendszer is importált adatokat egy másik rendszerből,
> ahol cp1250-es volt a kódolás és a dos nem konvertált rajta semmit. és
> ezután, ha a dosos programmal beleírnak, akkor csak az a pár karakter
> lesz cp852 amit utólag írtak bele.
> magyarul az adatokban van sok olyan, hogy pár karakter cp852 aztán
> néhány jön cp1250-nel , és így tovább.
>
> hogy tudnám ellenőrizni, hogy miről kell konvertálnom?

esetleg:
http://hu2.php.net/manual/en/ref.mbstring.php

t

--
Weblabor hírlevél: http://weblabor.hu/hirlevel
--
wl-phplista (wl-phplista@...) levelezőlista
https://bors.hoszting.com/mailman/listinfo/wl-phplista
Keresheto archivum: http://weblabor.hu/kereses
--
etikett: http://weblabor.hu/levlistak/illemszabaly
offlista: https://weblabor.hu/levlistak

Re: iconv cp852 , cp1250, utf 8

by Ferenc Szabó :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

2009/7/24 Pintér Tibor <tibyke@...>:

>> Belefutottam egy olyan problémába, hogy egy dosos rendszerből kell
>> adatokat importálnom, és ott az alap kódolás cp852. ezt át is tudom
>> konvertálni utf-8-ra.
>> Viszont a dosos rendszer is importált adatokat egy másik rendszerből,
>> ahol cp1250-es volt a kódolás és a dos nem konvertált rajta semmit. és
>> ezután, ha a dosos programmal beleírnak, akkor csak az a pár karakter
>> lesz cp852 amit utólag írtak bele.
>> magyarul az adatokban van sok olyan, hogy pár karakter cp852 aztán
>> néhány jön cp1250-nel , és így tovább.
>>
>> hogy tudnám ellenőrizni, hogy miről kell konvertálnom?
>
> esetleg:
> http://hu2.php.net/manual/en/ref.mbstring.php
>
> t
>
> --
> Weblabor hírlevél: http://weblabor.hu/hirlevel
> --
> wl-phplista (wl-phplista@...) levelezőlista
> https://bors.hoszting.com/mailman/listinfo/wl-phplista
> Keresheto archivum: http://weblabor.hu/kereses
> --
> etikett: http://weblabor.hu/levlistak/illemszabaly
> offlista: https://weblabor.hu/levlistak
>


köszi, de:

http://us2.php.net/manual/en/mbstring.supported-encodings.php


se CP1250, se CP852.

nem támogatja.
mb_detect_encoding az egyszerű karakterekre ASCII-t ír, az ékezetekre semmit.
mb_check_encoding nem fogadja el a nem támogatott kódlapokat. warningot dob.

egyéb ötlet?
--
Weblabor hírlevél: http://weblabor.hu/hirlevel
--
wl-phplista (wl-phplista@...) levelezőlista
https://bors.hoszting.com/mailman/listinfo/wl-phplista
Keresheto archivum: http://weblabor.hu/kereses
--
etikett: http://weblabor.hu/levlistak/illemszabaly
offlista: https://weblabor.hu/levlistak

Re: iconv cp852 , cp1250, utf 8

by Csabay Károly :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

> magyarul az adatokban van sok olyan, hogy pár karakter
> cp852 aztán
> néhány jön cp1250-nel , és így tovább.
>
> hogy tudnám ellenőrizni, hogy miről kell konvertálnom?
>

Ha jól értelek, az a problémád, hogy jön mondjuk egy D6-os byte, és nem tudod, hogy Í betű-e (cp852) vagy Ö betű-e (1250). De honnan is tudhatnád? Legföljebb a szöveg értelméből (már, ha van neki). Ezt a katyvaszt először kézzel kellene rendbe tenni, aztán lehet konvertálni.

Üdv

K.


     

--
Weblabor hírlevél: http://weblabor.hu/hirlevel
--
wl-phplista (wl-phplista@...) levelezőlista
https://bors.hoszting.com/mailman/listinfo/wl-phplista
Keresheto archivum: http://weblabor.hu/kereses
--
etikett: http://weblabor.hu/levlistak/illemszabaly
offlista: https://weblabor.hu/levlistak

Re: iconv cp852 , cp1250, utf 8

by Ferenc Szabó :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Féltem, hogy ezt a választ fogom kapni.
Akkor nincs mit tenni.

Köszönöm a segítséget!

üdv.:
SzF

2009/7/24 Csabay Károly <csabay@...>:

>> magyarul az adatokban van sok olyan, hogy pár karakter
>> cp852 aztán
>> néhány jön cp1250-nel , és így tovább.
>>
>> hogy tudnám ellenőrizni, hogy miről kell konvertálnom?
>>
>
> Ha jól értelek, az a problémád, hogy jön mondjuk egy D6-os byte, és nem tudod, hogy Í betű-e (cp852) vagy Ö betű-e (1250). De honnan is tudhatnád? Legföljebb a szöveg értelméből (már, ha van neki). Ezt a katyvaszt először kézzel kellene rendbe tenni, aztán lehet konvertálni.
>
> Üdv
>
> K.
>
>
>
>
> --
> Weblabor hírlevél: http://weblabor.hu/hirlevel
> --
> wl-phplista (wl-phplista@...) levelezőlista
> https://bors.hoszting.com/mailman/listinfo/wl-phplista
> Keresheto archivum: http://weblabor.hu/kereses
> --
> etikett: http://weblabor.hu/levlistak/illemszabaly
> offlista: https://weblabor.hu/levlistak
>
--
Weblabor hírlevél: http://weblabor.hu/hirlevel
--
wl-phplista (wl-phplista@...) levelezőlista
https://bors.hoszting.com/mailman/listinfo/wl-phplista
Keresheto archivum: http://weblabor.hu/kereses
--
etikett: http://weblabor.hu/levlistak/illemszabaly
offlista: https://weblabor.hu/levlistak