tag:blogger.com,1999:blog-28555040.post7601067361713404805..comments2023-12-20T02:38:58.401+01:00Comments on Morfologik: morfologik-stemming 1.4.0Marcin Miłkowskihttp://www.blogger.com/profile/11617540925216664775noreply@blogger.comBlogger5125tag:blogger.com,1999:blog-28555040.post-41120203553697297772010-08-12T12:54:22.481+02:002010-08-12T12:54:22.481+02:00Mam pytanie, jak wygląda sprawa wielowątkowości w ...Mam pytanie, jak wygląda sprawa wielowątkowości w wersji 1.4.0 ? Mamy problemy przy korzystaniu z wielu wątków, gdzie WordData jest przyczyną powstawiana wielu wyjątków.Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-28555040.post-30887469092620443782010-08-03T23:16:21.355+02:002010-08-03T23:16:21.355+02:00witam , mam pytanie czy program Morfologik da się ...witam , mam pytanie czy program Morfologik da się ręcznie zainstalować w systemie linux?Unknownhttps://www.blogger.com/profile/01931947866204134415noreply@blogger.comtag:blogger.com,1999:blog-28555040.post-63132577603196881152010-08-03T23:14:59.891+02:002010-08-03T23:14:59.891+02:00Ten komentarz został usunięty przez autora.Unknownhttps://www.blogger.com/profile/01931947866204134415noreply@blogger.comtag:blogger.com,1999:blog-28555040.post-36817820359566220862010-05-13T22:51:16.199+02:002010-05-13T22:51:16.199+02:001. To nie jest błąd, tak to powinno działać, bo w ...1. To nie jest błąd, tak to powinno działać, bo w wielu językach jest zasadnicza różnica między wielkimi i małymi literami (np. po niemiecku).<br /><br />2. Błąd, musimy poprawić.<br /><br />3. Proponuję użyć LanguageTool.jar w opcji --taggeronly. Tam jest trochę bardziej wyrafinowana analiza i tokenizacja, a jako gratis ciut dezambiguacji.<br /><br />4. Nie.Marcin Miłkowskihttps://www.blogger.com/profile/11617540925216664775noreply@blogger.comtag:blogger.com,1999:blog-28555040.post-61581766884766174382010-05-13T17:50:05.168+02:002010-05-13T17:50:05.168+02:00$ java --version
java version "1.5.0"
gi...$ java --version<br />java version "1.5.0"<br />gij (GNU libgcj) version 4.4.1<br /><br />1. Co z wielkimi literami? Ponizej tylko Kot zadzialal:<br />$ java -jar morfologik-stemming-1.4.0.jar plstem -i file.in<br /><br />Input encoding: UTF-8<br />Output encoding: UTF-8<br />Przybyli - -<br />Na - -<br />Miejscu - -<br />Akcji - -<br />ala - -<br />ma mieć verb:fin:sg:ter:imperf<br />ma mój adj:sg:nom.voc:f:pos<br />Kota Kot subst:sg:acc.gen:m1<br />Oraz - -<br />psa pies subst:sg:acc.gen:m2<br /><br />2. Pomoc mowi, ze moge stdin podac na wejscie. Nie wyszlo mi:<br />$ echo "ala ma kota oraz psa" | java -jar morfologik-stemming-1.4.0.jar plstem<br /><br />usage: morfologik.tools.PolishStemmingTool [-i ] [-ie ]<br /> [-o ] [-oe ]<br /> -i,--input Input file. If missing, standard input<br /> is used.<br /><br />3. Problem ze slashem. "Ala ma / kota oraz psa" - fragment po slashu<br />(ale nie do konca pliku) zostaje obciety. Jakie jeszcze zasadzki? ;)<br /><br />4. Jest jakas dokumentacja oprocz api? Moze sprawy wielkich liter i slasha sa gdzie<br />opisane?mimoohhttps://www.blogger.com/profile/01197007300381958366noreply@blogger.com