kodowania opisów
Radoslaw Zielinski
radek w karnet.pl
Czw, 16 Gru 2004, 15:07:31 CET
Jacek Konieczny <jajcus w bnet.pl> [16-12-2004 12:03]:
> On Thu, Dec 16, 2004 at 11:38:37AM +0100, Radoslaw Zielinski wrote:
>> Jacek Konieczny <jajcus w bnet.pl> [16-12-2004 11:08]:
>>> A najlepiej byłoby zrobić jakiś test i sprawdzić ile opisów z aktualnych
>>> pakietów może być zinterpretowanych jako prawidłowe UTF-8 (mimo, że jest
>>> ISO-8859-2).
[...]
>> Czyli 467. Testowane perlem: Encode::decode("utf-8", $opis,
>> Encode::FB_CROAK).
> 1. Czy perl dobrze sprawdza poprawność utf-8? Wiem że taki recode
> potrafił robić bzdury.
Nie wiem. W prostych przypadkach (ISO) powinien sobie radzić. W każdym
razie, Encode na pewno nie jest doskonały.
> 2. Czy w tych 467 plikach były jakieś polskie literki? I czy nie były
> w UTF-8?
Wygląda na to, że nie było (decode("us-ascii",...) przeszło).
--
Radosław Zieliński <radek w karnet.pl>
[ GPG key: http://radek.karnet.pl/ ]
-------------- następna część ---------
Załącznik, który nie był tekstem został usunięty...
Name: nie znany
Type: application/pgp-signature
Size: 189 bytes
Desc: nie znany
Url : /mailman/pipermail/pld-devel-pl/attachments/20041216/7d6031b0/attachment.bin
Więcej informacji o liście dyskusyjnej pld-devel-pl