kodowania opisów

Jacek Konieczny jajcus w bnet.pl
Czw, 16 Gru 2004, 20:22:39 CET


On Thu, Dec 16, 2004 at 07:00:54PM +0100, Paweł Sakowski wrote:
> On Thu, 2004-12-16 at 11:08 +0100, Jacek Konieczny wrote:
> > W praktyce zdaża się to bardzo rzadko. IMHO można sobie pozwolić na
> > sporadyczne błędy w wyświetlaniu pakietów ze starym kodowaniem.
[...] 
> Proponujesz zastąpić description jako ciąg bajtów bez semantyki ale ze
> spójną praktyką (ISO dla -l pl) przez ciąg bajtów bez semantyki ani
> spójnej praktyki? Dziękuję, postoję.

Nie.

> 
> Zasadniczo porządne wyjścia są dwa:
> 
> - przekodować wszystko na UTF-8, dorobić do `rpm -q` przekodowanie
> utf->locale i stwierdzić że pierdolimy kompatybilność z legacy rpms

to właśnie proponowałem. Znaki które się nie przekodują zostają bez
zmian.

> - oznakować w pakietach stringi, żeby jednoznacznie dało się stwierdzić
> ich kodowanie (przy braku odpowiedniego tagu default: legacy). Cytując,
> "O ile format RPM jest rozszerzalny" -- jest do niego jakaś dokumentacja
> czy trzeba się przegryzać przez źródła rpm-a?

Może po prostu BOM na początku każdego stringa UTF-8 (3 dodatkowe bajty)?
Albo tylko w jednym konkretnym polu (Summary lub %description --
trzebaby ustalić), co oznaczało by kodowanie dla całego pakietu.

Pozdrowienia,
	Jacek




Więcej informacji o liście dyskusyjnej pld-devel-pl