kodowania opisów

Czw, 16 Gru 2004, 03:15:43 CET

Andrzej Krzysztofowicz <ankry w green.mif.pg.gda.pl> [16-12-2004 00:56]:
> =?iso-8859-2?Q?Pawe=B3?= Sakowski wrote:
>> On Wed, 2004-12-15 at 20:38 +0100, Andrzej Krzysztofowicz wrote:
>>> IMO wystarczyloby jakos sprawdzac, czy otrzymany przez rpm-a "ciag bajtow"
>>> jest poprawnym utf-em i, jesli nie, zrobic fallback do aktualnego
>>> zachowania.
>> Nie bardzo. Może istnieć ciąg bajtów w opisie pl prawidłowy jednocześnie
>> w ISO 8859-2 i UTF-8. Taki musiałby być interpretowany w ISO 8859-2 w
>> pakietach legacy i w UTF-8 w nowych.
> Mozna jeszcze sprawdzic czy da sie przekodowac UTF -> legacy
> Jesli tak to trudno. Ale to malo prawdopodobne.

> Masz lepszy pomysl?

1. O ile format RPM jest rozszerzalny, możnaby dodawać jakieś pole
   (utf8metadata).
2. Nauczyć rpm-a rozpoznawać kodowanie przy "-l foo_bar.enc" i dodawać
   do wszystkich zlokalizowanych Summary / %description ".utf-8".
3. Hack: zgadywanie na podstawie zawartości i w zależności od języka;
   przykładowo, jeśli w "-l pl" występują "\xc4\x99" czy \xc3\xb3",
   to jest to raczej utf-8.

-- 
Radosław Zieliński <radek w karnet.pl>
[ GPG key: http://radek.karnet.pl/ ]
-------------- następna część ---------
Załącznik, który nie był tekstem został usunięty...
Name: nie znany
Type: application/pgp-signature
Size: 189 bytes
Desc: nie znany
Url : /mailman/pipermail/pld-devel-pl/attachments/20041216/baefa53d/attachment.bin