kodowania opisów

Paweł Sakowski saq w pld-linux.org
Czw, 16 Gru 2004, 20:01:10 CET


On Thu, 2004-12-16 at 19:50 +0100, Jakub Bogusz wrote:
> Hm, standard jest, tyle że przewidziany dla całych plików.

Owszem. Tylko, że dla przykładu:

> 0       string  \357\273\277            Unicode text, UTF-8

Daje w ISO 8859-2 prawidłowego stringa "ďťż"

> 0       string  \377\376                Unicode text, UTF-16, little-endian

A ten: "˙ţ"

Nie wnikając w to, czy te stringi mają praktyczne zastosowanie w jakimś
języku, BOMy nie dają jednoznacznej informacji o kodowaniu -- co
najwyżej pewną heurystykę. A heurystyka raczej nie ma tu zastosowania
skoro chcemy uzyskać właśnie jednoznaczność interpretacji opisów.

-- 
Paweł Sakowski <saq w pld-linux.org>
PLD Linux Distribution





Więcej informacji o liście dyskusyjnej pld-devel-pl