Date: prev next · Thread: first prev next last
2011 Archives by date, by thread · List index


中本です。

(2011/12/22 19:17), AWASHIRO Ikuya wrote:
i18npool/source/breakiterator/data/ja.dic
というのがあるんですね。
http://cgit.freedesktop.org/libreoffice/core/tree/i18npool/source/breakiterator/data/ja.dic
ものとしてはずいぶん古いようです。

これがどういうものなのかはよくわからないのですが、これをいい感じに変更
すると日本語でいい感じの恩恵が受けられたりするんでしょうか?

OOoのときにToraさんから話を聞いたことがありますが、これは単語境界を見つ
け出すための辞書です。Writerとかで、Ctrl + → とかとすると、単語ごとに
カーソルが移動するのですが、そういったときに使われます。未だにこの方式で
やっているかどうかは定かではないですが、多分、上記の辞書をまだ使っている
と思います。

昔あれこれと考えていた時には、辞書を更新するよりも、そもそも形態素解析か
なにかを導入してもうちょっと賢く単語区切りできないものかというのは考えて
いたことがあります。形態素解析を導入しようと思って、何年か前にこのあたり
のコードを調べた記憶があります。
http://cgit.freedesktop.org/libreoffice/core/tree/i18npool/source/breakiterator/

ただ、当時は成果を残せていないので、あんまり記録がないかもしれません。大
した情報が残っていませんが、
http://www.freeml.com/openoffice/1910
http://openoffice.org/projects/ja/lists/qa/archive/2009-07/message/56
あたりの議論を参照してください。

どなたかハックしてみてはいかがでしょう?

期待しています!(他人任せ...)

中本崇志


-- 
Unsubscribe instructions: E-mail to discuss+help@ja.libreoffice.org
Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette
List archive: http://listarchives.libreoffice.org/ja/discuss/
All messages sent to this list will be publicly archived and cannot be deleted

Context


Privacy Policy | Impressum (Legal Info) | Copyright information: Unless otherwise specified, all text and images on this website are licensed under the Creative Commons Attribution-Share Alike 3.0 License. This does not include the source code of LibreOffice, which is licensed under the Mozilla Public License (MPLv2). "LibreOffice" and "The Document Foundation" are registered trademarks of their corresponding registered owners or are in actual use as trademarks in one or more countries. Their respective logos and icons are also subject to international copyright laws. Use thereof is explained in our trademark policy.