kodowania opisów
Radoslaw Zielinski
radek at karnet.pl
Thu Dec 16 15:07:31 CET 2004
Jacek Konieczny <jajcus at bnet.pl> [16-12-2004 12:03]:
> On Thu, Dec 16, 2004 at 11:38:37AM +0100, Radoslaw Zielinski wrote:
>> Jacek Konieczny <jajcus at bnet.pl> [16-12-2004 11:08]:
>>> A najlepiej byłoby zrobić jakiś test i sprawdzić ile opisów z aktualnych
>>> pakietów może być zinterpretowanych jako prawidłowe UTF-8 (mimo, że jest
>>> ISO-8859-2).
[...]
>> Czyli 467. Testowane perlem: Encode::decode("utf-8", $opis,
>> Encode::FB_CROAK).
> 1. Czy perl dobrze sprawdza poprawność utf-8? Wiem że taki recode
> potrafił robić bzdury.
Nie wiem. W prostych przypadkach (ISO) powinien sobie radzić. W każdym
razie, Encode na pewno nie jest doskonały.
> 2. Czy w tych 467 plikach były jakieś polskie literki? I czy nie były
> w UTF-8?
Wygląda na to, że nie było (decode("us-ascii",...) przeszło).
--
Radosław Zieliński <radek at karnet.pl>
[ GPG key: http://radek.karnet.pl/ ]
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 189 bytes
Desc: not available
URL: </mailman/pipermail/pld-devel-pl/attachments/20041216/7d6031b0/attachment.sig>
More information about the pld-devel-pl
mailing list