Biuletyn PLD nr 4

Paweł Kołodziej pkollegu w ids.pl
Pią, 28 Sie 1998, 22:22:33 CEST


Dnia Fri, Aug 28, 1998 at 07:17:54PM +0200, Tomasz Kłoczko napisał(a):
> 
> Nie wiem czy dobrze to zasugerowałem ale jednym z powodów zgłoszenia
> zapotrzebowania na PePeSzą było przypuszczenie, że być może w związku z
> tym, że stopień koordynacji wymiany informacji miedzy tłumaczącymi był nie
> wystarczający, to same tłumaczenia zawierają różne nieścisłości lub nawet
> literówki. 
> 
> Powyższe zapewne wyszło przy okazji posortowania tablicy "en -> pl". Inne
> nieścisłości i niekonsekwencje wyjdą w momencie kiedy przeanalizuje się
> posortowane zestawienie "pl -> en".
To już da się zrobić. Baza generowana przez PePeSzę jest posortowana
po tekstach angielskich. Proponuję taki schemat działania:
touch baza.pepesza         -> bo plik z bazą _zawsze musi_ istnieć
ls -1 *.po | xargs -i pepesza -b baza.pepesza -a {} -o baza.pepesza
przeglądamy i poprawiamy baza.pepesza (może to być spory plik)
i woprwadzamy poprawki do wszystkich plików .po:
ls -1 *.po | xargs -i pepesza -b baza.pepesza -o jednolite/{} -t {}
(^_ chyba w xargs może tylko raz występować {} ale chodzi o sens)
i już mamy jednolite tłumaczenia.

Czy ktoś by mógł w ramach testu wykonać powyższe. Ja niestety nie bardzo
jestem w stanie (łącze się przez modem).

propozycja:
Jeśli naprawdę częste jest że teksty różnią się tylko tym, że w jednym
jest "can't" a w drugim "can not", to można to rozwiązać np. rozwijając
teksty przed porównaiem. Tzn. can't było by rozwijane na can not, i dopiero
potem teksty były by porównywane. To jest do zrobienia, pod warunkiem, że
ktoś stworzył by plik w którym na przemian występowały by formy skrócone i
pełne. Czyli np:
can't
can not
haven't
have not
itd. Jak ktoś by zrobił taki plik, to myślę że udało by mi się zrobić to
rozwijanie. Tylko czy jest to tak częsty przypadek że warto to
automatyzować, czy może wystarczy ręczna poprawka w bazie do PePeSzy. 

> 
> kloczek
> -----------------------------------------------------------
> *Ludzie nie mają problemów, tylko sobie sami je stwarzają*
> -----------------------------------------------------------
> Tomasz Kłoczko, sys adm @zie.pg.gda.pl|*e-mail: kloczek w rudy.mif.pg.gda.pl*
> 
ps. w najbliższej przyszłości zrobie sortowanie po polskich napisach, może
wezmę się za automat do speców (jeśli szkoła nia zaskoczy mnie masą roboty).

-- 
Paweł Kołodziej
pkollegu w ids.pl



Więcej informacji o liście dyskusyjnej pld-devel-pl