추상 위키백과/업데이트/2021-06-24
◀ | 추상 위키백과 업데이트 | ▶ |
요약: 문법 프레임워크 커뮤니티는 위키미디어인들을 GF 여름 학교 2021에 무료로 참여하도록 초대하고 있습니다. 위키미디어인 참여는 디지털 그래머스(Digital Grammars)가 후원합니다.
"문법적 프레임워크"(Grammatical Framework, GF)는 다국어 자연어 생성 및 자연어 입력 구문 분석을 목표로 하는 오픈 소스 함수형 프로그래밍 언어 및 도구 모음입니다. GF는 다국어 문서 작성을 지원하기 위해 1998년 제록스 연구소(Xerox Research)에서 처음 만들어졌습니다. GF는 여러 언어로 된 텍스트를 동시에 구문 분석하고 생성하는 동시에 언어 독립적인 의미 표현으로 작업 할 수 있습니다. GF는 활발하고 활발한 커뮤니티를 가지고 있으며 40개 이상의 언어를 제공합니다.
다음은 GF가 작동하는 방식의 예입니다(구문이 하스켈(Haskell)과 유사한 구문에서 기능적 구문으로 변경되었습니다). 다음과 같은 추상 표현이 주어집니다:
mkUtt(mkS(mkCl(mkNP(aPl_Det, horse_N), mkNP(aPl_Det, animal_N))))
좀 더 쉽게 이해할 수 있도록 축약되지 않은 용어는 다음과 같습니다:
make Utterance (make Sentence (make Clause (make Noun Phrase (a Plural Determiner, horse Noun), make Noun Phrase (a Plural Determiner, animal Noun))))
이 구조는 더 간단한 구조로 함수 호출 뒤에 추상화 될 수도 있습니다:
subsumes(horse_N, animal_N)
추상 표현을 여러 언어로 선형화 할 수 있습니다. 다음은 GF의 클라우드 기반 구현에 의해 생성 된 결과입니다(2012년 기준 - 현재 GF는 수십 개 이상의 언어에 대한 지원을 추가했습니다).
- 불가리아어: коне са животни
- 중국어: 些 马 是 些 动 物
- 네덜란드어: paarden zijn dieren
- 영어: horses are animals
- 스페인어: caballos son animales
- 스웨덴어: hästar är djur
추상 표현에 대해 두 가지 작은 변경 사항을 적용 해 보겠습니다: 문장(negativePol
)에 부정적인 극성을 추가하고 tree_N
로 horse_N
를 전환하면 다음과 같은 표현이 나타납니다:
mkUtt(mkS(negativePol, mkCl(mkNP(aPl_Det, tree_N), mkNP(aPl_Det, animal_N))))
위와 같이 함수 호출 뒤에 숨길 수 있습니다:
subsumesNot(tree_N, animal_N)
이로 인해 다음과 같은 선형화가 발생합니다:
- 불가리아어: дърва не са животни
- 중국어: 些 树 不 是 些 动 物
- 네덜란드어: bomen zijn niet dieren
- 영어: trees aren't animals
- 스페인어: árboles no son animales
- 스웨덴어: träd är inte djur
추상 위키백과에 대한 아이디어가 개발되는 동안 GF는 중요한 영감을 받았습니다. 여러 언어로 텍스트를 작성하고 텍스트의 형식적 의미를 포착하기 위해 GF 및 Attempto Controlled English(ACE)와 긴밀하게 통합된 미디어위키의 확장인 에이스위키(AceWiki)의 일부였습니다. 에이스위키(AceWiki)에서 주요 목표 중 하나는 모든 문장을 형식적인 논리 언어(이 경우 OWL)로 표현하는 것이었지만, 우리는 추상적인 내용의 형식적인 의미론에는 관심이 덜합니다(사실 이것은 추상 위키백과와 많은 이전 프로젝트의 주요 차이점 중 하나입니다). 그 외에 GF와 AceWiki가 추상 위키백과의 개발에 어떻게 영향을 미쳤는지 볼 수 있습니다.
추상 위키백과 발표 이후 GF 개발자와 커뮤니티는 추상 위키백과 개발자에게 연락을 취했고 우리는 우리의 계획과 아이디어를 논의하고 있습니다. 커뮤니티 간의 관계를 강화하고 커뮤니티 간의 경험과 아이디어를 전달하기 위해 추상 위키백과 커뮤니티에 초대를 확대하게되어 매우 기쁩니다. 올해의 문법적 프레임워크 여름 학교는 모든 위키미디어인들에게 개방되고 무료입니다.
이 단계에서 추상 위키백과에서 자연어 생성에 대한 유일한 접근 방식으로 GF를 사용하기로 결정하기에는 너무 이릅니다. 대안이 있으며 위키함수는 다양한 접근 방식을 지원할 수 있을만큼 충분히 유연합니다. 그러한 대안의 한 예는 여름 학교의 두 번째 주에 발표 될 핵중심구구조문법(HPSG, Head-driven phrase structure grammar)입니다. 그러나 우리는 GF에 대한 수십 년의 연구와 연구와 그 개발에 들어간 수백 명의 인년을 통해 배울 계획이며, 또한 GF의 일부인 포괄적인 문법 라이브러리의 일부 또는 소프트웨어 중 일부를 재사용 할 수 있는지 여부를 탐색할 계획입니다. 이러한 재사용을 촉진하기 위해서는 서로에 대한 더 많은 지식과 더 나은 상호 이해가 중요합니다.
GF 여름 학교 2021은 7월 26일부터 8월 6일까지 싱가포르에서 개최되며 온라인으로 참석할 수 있습니다. 등록이 필요합니다. 위키미디어인으로 등록하려면 inaridigitalgrammars.com
로 이메일을 보내고 위키미디어 계정과 이름, 거주 국가, 읽고 쓰는 언어, 1주 또는 2주 동안 참여할지 여부를 알려주세요. 이 단계는 참가비를 피하기 위해 필요합니다. 직접 가입하는 경우 수수료를 지불해야합니다. 위키미디어인들의 비용을 충당 해준 디지털 그래머스(Digital Grammars)에 매우 감사를 드립니다.
우리는 이 협력에 대해 매우 기쁘게 생각하며 두 커뮤니티가 함께 협력하고 서로의 목표와 경험 및 기술로부터 상호 이익을 얻을 수 있기를 기대합니다.
이번 주에는 첫 근무 시간도 보였습니다. 우리는 많은 질문에 답했으며 로그를 따라 잡을 수 있습니다. 다음 근무 시간은 4~ 6주로 계획하고 있으며이 뉴스 레터에서도 날짜를 발표 할 것입니다.