kodowania opisów
Jacek Konieczny
jajcus w bnet.pl
Czw, 16 Gru 2004, 20:22:39 CET
On Thu, Dec 16, 2004 at 07:00:54PM +0100, Paweł Sakowski wrote:
> On Thu, 2004-12-16 at 11:08 +0100, Jacek Konieczny wrote:
> > W praktyce zdaża się to bardzo rzadko. IMHO można sobie pozwolić na
> > sporadyczne błędy w wyświetlaniu pakietów ze starym kodowaniem.
[...]
> Proponujesz zastąpić description jako ciąg bajtów bez semantyki ale ze
> spójną praktyką (ISO dla -l pl) przez ciąg bajtów bez semantyki ani
> spójnej praktyki? Dziękuję, postoję.
Nie.
>
> Zasadniczo porządne wyjścia są dwa:
>
> - przekodować wszystko na UTF-8, dorobić do `rpm -q` przekodowanie
> utf->locale i stwierdzić że pierdolimy kompatybilność z legacy rpms
to właśnie proponowałem. Znaki które się nie przekodują zostają bez
zmian.
> - oznakować w pakietach stringi, żeby jednoznacznie dało się stwierdzić
> ich kodowanie (przy braku odpowiedniego tagu default: legacy). Cytując,
> "O ile format RPM jest rozszerzalny" -- jest do niego jakaś dokumentacja
> czy trzeba się przegryzać przez źródła rpm-a?
Może po prostu BOM na początku każdego stringa UTF-8 (3 dodatkowe bajty)?
Albo tylko w jednym konkretnym polu (Summary lub %description --
trzebaby ustalić), co oznaczało by kodowanie dla całego pakietu.
Pozdrowienia,
Jacek
Więcej informacji o liście dyskusyjnej pld-devel-pl