kodowania opisów

Radoslaw Zielinski radek w karnet.pl
Czw, 16 Gru 2004, 15:07:31 CET


Jacek Konieczny <jajcus w bnet.pl> [16-12-2004 12:03]:
> On Thu, Dec 16, 2004 at 11:38:37AM +0100, Radoslaw Zielinski wrote:
>> Jacek Konieczny <jajcus w bnet.pl> [16-12-2004 11:08]:
>>> A najlepiej byłoby zrobić jakiś test i sprawdzić ile opisów z aktualnych
>>> pakietów może być zinterpretowanych jako prawidłowe UTF-8 (mimo, że jest
>>> ISO-8859-2).
[...]
>> Czyli 467.  Testowane perlem: Encode::decode("utf-8", $opis,
>> Encode::FB_CROAK).
> 1. Czy perl dobrze sprawdza poprawność utf-8? Wiem że taki recode
> potrafił robić bzdury.

Nie wiem.  W prostych przypadkach (ISO) powinien sobie radzić.  W każdym
razie, Encode na pewno nie jest doskonały.

> 2. Czy w tych 467 plikach były jakieś polskie literki? I czy nie były
> w UTF-8?

Wygląda na to, że nie było (decode("us-ascii",...) przeszło).

-- 
Radosław Zieliński <radek w karnet.pl>
[ GPG key: http://radek.karnet.pl/ ]
-------------- następna część ---------
Załącznik, który nie był tekstem został usunięty...
Name: nie znany
Type: application/pgp-signature
Size: 189 bytes
Desc: nie znany
Url : /mailman/pipermail/pld-devel-pl/attachments/20041216/7d6031b0/attachment.bin


Więcej informacji o liście dyskusyjnej pld-devel-pl