unikod

Jacek Konieczny jajcus w pld.org.pl
Śro, 31 Gru 2003, 09:48:43 CET


On Tue, Dec 30, 2003 at 09:40:57PM +0100, Andrzej Krzysztofowicz wrote:
> Jacek Konieczny wrote:
> > python -c "unicode(file('plik.txt'),'utf-8','strict')"
> > 
> > Wywali się, jezeli plik.txt będzie zawierał cokolwiek co nie jest
> > poprawnym UTF-8.
> 
> A da jakis sensowny komunikat odnosnie miejsca bledu ?
> Bo iconv-owy okreslajacy offset odnosnie poczatku danych jest kiepski.
> Zwlaszcza jak sie sprawdza megabajty w strumieniu.
> 
> A moze da sie cos zrobic, by kontynuowal po bledzie ?
> (w zasadzie chodzi mi o zlokalizowanie linii z bledami w strumieniu)

Zamiast 'strict' dać 'replace', a potem w stringu szukać 'Unicode
replacement character'. Ale śmierdzi mi to coś brudnym hackiem...

A wogóle, to powyższy jednolinijkowiec nie wypluwa kodu na którym się
wywalił?

Pozdrowienia,
        Jacek



Więcej informacji o liście dyskusyjnej pld-devel-pl