抽象的なウィキペディア/更新情報/2021年06月24日
◀ | 抽象的なウィキペディアの更新情報 | ▶ |
要約: Grammatical Frameworkコミュニティは、ウィキメディアンをGFサマースクール2021に無料で招待しています。ウィキメディアンの参加は、Digital Grammars社が後援します。
"Grammatical Framework" (GF) は、多言語の自然言語生成と自然言語入力の解析を目的とした、オープンソースの関数型プログラミング言語およびツール群です。 GFは、1998年にXerox Researchで、多言語文書作成を支援するために最初に作成されました。 GFは、意味に対応する非言語依存表現を処理し、複数の言語でテキストを同時に解析および生成できます。 GFには活発でにぎやかなコミュニティがあり、40以上の言語を提供しています。
ここでGFがどのように作動するかの例を示します(構文はHaskell風構文から関数構文に変更していることに注意)。 次のような抽象表現が与えられます。:
mkUtt(mkS(mkCl(mkNP(aPl_Det, horse_N), mkNP(aPl_Det, animal_N))))
少しわかりやすくするために、省略されていない用語を次に示します。:
make Utterance (make Sentence (make Clause (make Noun Phrase (a Plural Determiner, horse Noun), make Noun Phrase (a Plural Determiner, animal Noun))))
この構造は、単純な構造を持つ関数呼出しの背後に抽象化できることに注意してください。
subsumes(horse_N, animal_N)
その抽象表現をいくつかの言語で線形化することができます。 ここで、GFのクラウドベースの実装によって作成された結果を示します。(これは2012年時点のものですが、現在ではGFはさらに数十の言語に対応しています):
- ブルガリア語: коне са животни
- 中国語: 些 马 是 些 动 物
- オランダ語: paarden zijn dieren
- 英語: horses are animals
- スペイン語: caballos son animales
- スウェーデン語: hästar är djur
抽象表現に2つの小さな変更を加えてみましょう: 文に否定極性を追加し(negativePol
)、horse_N
をtree_N
に変更すると、次の表現が得られます。
mkUtt(mkS(negativePol, mkCl(mkNP(aPl_Det, tree_N), mkNP(aPl_Det, animal_N))))
上記のように、これは関数呼出しの背後に隠すことができます:
subsumesNot(tree_N, animal_N)
これにより、次の線形化が行われます:
- ブルガリア語: дърва не са животни
- 中国語: 些 树 不 是 些 动 物
- オランダ語: bomen zijn niet dieren
- 英語: trees aren't animals
- スペイン語: árboles no son animales
- スウェーデン語: träd är inte djur
抽象ウィキペディアのアイデア構想中、GFは重要なインスピレーションを与えてくれました。 これはAceWikiの一部であり、MediaWikiの拡張機能であり、いくつかの言語でテキストを作成し、またテキストの形式的セマンティクスを捕捉するために、GFとAttempto Controlled English (ACE)と緊密に統合したものです。 AceWikiの主要な目標の一つは、全ての文章を形式論理言語(この場合はOWL)でも表現することでしたが、私たちは抽象的なコンテンツの形式的なセマンティクスにはあまり興味がありません(実際、これが抽象ウィキペディアと多くの先行プロジェクトとの大きな違いの一つです)。 それ以外にも、GFやAceWikiが抽象ウィキペディアの開発に影響を与えていることがわかります。
抽象ウィキペディアの発表以来、GFの開発者とコミュニティは抽象ウィキペディアの開発者に働きかけ、計画やアイデアについて議論してきました。 コミュニティの関係を深め、経験やアイデアをやりとりするために、抽象ウィキペディアのコミュニティを招待いただきうれしく思います。:今年のGrammatical Frameworkサマースクールは、全てのウィキメディアンに開かれ、無料で行われます。
この段階で、抽象ウィキペディアの自然言語生成に向けた唯一のアプローチとしてGFの使用を約束するのは時期尚早です。 代替案はあり、ウィキファンクションズは異なるアプローチに十分順応します。 代替案の一例がHPSG(Head-driven phrase structure grammar)であり、サマースクールの第2週目に紹介されます。 しかし、GFの何十年にもわたる研究、作業と、何百人年をかけた開発から学ぶことを計画しており、また、GFの一部であるソフトウェアや総合的文法ライブラリの一部を再利用できないか調査する予定です。 このような再利用を促進するためには、それぞれの知識と理解を深めることが不可欠です。
GFサマースクール2021は、7月26日から8月6日までシンガポールで開催され、オンラインで出席できるようになります。 登録が必要になります。ウィキメディアンとして登録するためには、inaridigitalgrammars.com
にメールを送り、ウィキメディアアカウントと名前、居住国、読み書きする言語、1週間または2週間の参加を希望するかを記載してください。 このステップは、参加費を避けるために必要です。―自分でサインアップする場合は、費用を支払う必要があります。 私達はウィキメディアンの費用をカバーしてくれたDigital Grammars社に大変感謝しています。
私たちはこのコラボレーションにとてもワクワクしており、2つのコミュニティが協力し、互いの目標、経験、スキルから相互に利益を得ることを楽しみにしています。
また、今週は初めてのオフィスアワーがありました。 私達はたくさんの質問にお答えしました。ログで追うことができます。 次回のオフィスアワーは4~6週間のうちに計画しており、その日程はまたこのニュースレターでお知らせします。