Ispell i autodetekcja języka.

Tomasz Kłoczko kloczek w rudy.mif.pg.gda.pl
Nie, 21 Lis 1999, 10:54:24 CET


On Fri, 19 Nov 1999, Paweł Wilk wrote:

> + ----- ---  --   -      -      -
> | MSG:   <Pine.LNX.4.10.9911190722110.21873-100000 w rudy.mif.pg.gda.pl> [2,7KB]
> | Autor: Tomasz Kłoczko z Polski (kloczek)
> | Temat: Re: Ispell i autodetekcja języka.
> | Czas:  piątek, 19 listopad 1999 - 07:39:22 (+0100)
> 
> > Nie ma co wymyślać młotka. Paweł .. wszystkie regóły doboru słownika można
> > wręcz żywcem ściągnąć z LOCALE co oznacza, że jeżeli np. jest pl to już
> > nie ma szukania w drugą strę do pl_PL tylko od razu C/POSIX .. finito.
> 
> Spoko, mniej roboty, właśnie nad tym myślałem. :-)
> 
> > Ustawienai LOACE też można wykorzystać do tego żeby dowiedzieć się co jest
> > word separatorem a co jeszcze znakiem wchodzacym w skład znaku i tu bez
> > prawidłowo ustawionego LOCALE nie pójdzie to czyli przy pl nie ma co sie
> > wysilać tylko tzreba od razu zalecać pl_PL gdyż tylko przy tych
> > ustawieniach zostaną odnalezione odpwiednie pliki LC_*.
> 
> Okidoki, ale word separatory i inne często są zależne od wydawcy
> słownika, jak on to sobie zdefiniuje w [język].aff Jest owszem taka
> możliwość, żeby to robić zależnie od LOCALE, lecz będzie to
> przesłanianiem ustawień wprowadzonych przez zdefiniowany dla danego
> języka aff. Na przykład chłopaki od ispella, z którymi wymieniam słówka
> (i od których jest u nas baza dla języka polskiego) mają trochę inny
> polish.aff niż nasz, a to ze względu na słownik PLDP (dawna nazwa SUX) z
> repo, w którym są pozbierane wszelkie słówka zawierające _ czy -.

Z word delimiter charcs to wydaje mi się że sprawa jest do rozwiązania. Po
pierwsze trzebaby zadbać o to żeby w aff były one dokładnie takie same jak
te wynikające z LOCALE i wtedy programy sprawdzające pisownię na podstawie
słownika mogłyby wyciągać te informacje z bazy LOCALE. Nie wiedże powou
dla którego te informacje w bazie LOCALE i opisie słownika miały by byś
inne. Podrugie w zmodyfikowanym ispellu o którym tu mówimy możnaby wogóle
pozbyć sie definiowania word delimiter charcs po to żeby podczas
generowania słownika zaciągać te informacje z LOCALE.

Jeżeli teraz mielibyśmy rozmawiać o tym o czym mamy za kawałek robić czyli
o zmienianiu narzędzi do obsługi słowników (bazując na bardzo starych juz
źródłach ispella i ewentualnie aspella) to takie szeczególy jak pobieranie
informacji z bazy LOCALE o ile nie są one zdefiniowane w aff to chyba
dobry kierunek zmian.

[..]
> Aha, nasunęło mi się coś jeszcze na myśl. Ispell domyślnie tworzy słownik
> osobisty w domowym katalogu użytkownika, z którym ma do czynienia, gdy
> ten chce dodawać słówka. To też trzeba będzie jakoś zmienić, żeby nie
> było konfliktów słówek jak mamy do czynienia z poliglotą. :) Proponuję
> podkatalog ~/.ispell i wewnątrz słowniki osobiste.. ?

Co do tworzenia słowników lokalnych to zawartość ~/.ispell mogłaby być
odbiciem <localedir>/<lang>/LC_DICT. W ten sposób możnaby pogodzić pracę
ze słownikami w róznych językach.

Wogóle co do ispella to nie wiem na jakiej jest on licencji ale jeżeli
byłoby to możliwe to albo wartoby spróbować przejąć ten projekt albo
zacząć tworzyć własny.

kloczek
-- 
-----------------------------------------------------------
*Ludzie nie mają problemów, tylko sobie sami je stwarzają*
-----------------------------------------------------------
Tomasz Kłoczko, sys adm @zie.pg.gda.pl|*e-mail: kloczek w rudy.mif.pg.gda.pl*



Więcej informacji o liście dyskusyjnej pld-devel-pl