unikod
Jacek Konieczny
jajcus w pld.org.pl
Śro, 31 Gru 2003, 09:48:43 CET
On Tue, Dec 30, 2003 at 09:40:57PM +0100, Andrzej Krzysztofowicz wrote:
> Jacek Konieczny wrote:
> > python -c "unicode(file('plik.txt'),'utf-8','strict')"
> >
> > Wywali się, jezeli plik.txt będzie zawierał cokolwiek co nie jest
> > poprawnym UTF-8.
>
> A da jakis sensowny komunikat odnosnie miejsca bledu ?
> Bo iconv-owy okreslajacy offset odnosnie poczatku danych jest kiepski.
> Zwlaszcza jak sie sprawdza megabajty w strumieniu.
>
> A moze da sie cos zrobic, by kontynuowal po bledzie ?
> (w zasadzie chodzi mi o zlokalizowanie linii z bledami w strumieniu)
Zamiast 'strict' dać 'replace', a potem w stringu szukać 'Unicode
replacement character'. Ale śmierdzi mi to coś brudnym hackiem...
A wogóle, to powyższy jednolinijkowiec nie wypluwa kodu na którym się
wywalił?
Pozdrowienia,
Jacek
Więcej informacji o liście dyskusyjnej pld-devel-pl