위키미디어 재단 연간 계획/2017-2018년/최종/구조화된 데이터

This page is a translated version of the page Wikimedia Foundation Annual Plan/2017-2018/Final/Structured Data and the translation is 100% complete.

공용의 구조화된 데이터

: 읽기, 커뮤니티 프로그램, 기술 협업, 연구, 위키데이터(WMDE), 미디어위키 핵심, 클라우드 서비스, 검색/검색, 기술 운영, 성능

전략적 우선 순위:

  • 지식 - 이 프로젝트는 멀티미디어 및 관련 데이터를 수집하기 위한 작업 흐름과 기여 장소를 단순화합니다. 현재 프로젝트에서는 미디어에 대한 가장 귀중한 정보 중 일부가 손실되고 있으며, 이 프로젝트를 통해 수정이 가능해졌습니다.
  • 커뮤니티 - 이 프로젝트는 다국어 카테고리 및 향상된 검색과 같은 기능에 대한 커뮤니티의 오랜 요청에 직접적으로 응답하여 다양한 커뮤니티 작업 흐름을 강화합니다.
  • 도달 범위 - 프로젝트는 공유지의 검색 및 재사용을 개선하는 데 필요한 인프라 구축에 중점을 둡니다.

기간: 2.5년 이상

설명 회계연도 17-18년 계획
구조화된 데이터 구조화된 데이터 비용에 대한 설명
직원 충원 비용 1,365 10.23 기술, 제품 부문 FTE
비직원 충원 비용 -
데이터 센터 비용 16 다중 콘텐츠 개정 스키마 변경을 위한 테스트 상자 4개
보조금 -
기금 기부 -
기부 처리 수수료 -
외부 계약 서비스 -
법률 비용 -
여행 및 컨퍼런스 35 커뮤니티 컨퍼런스 및 기타 팀 여행으로의 여행
기타 비용(위키데이터, 개인 재산세) 259 구조화된 데이터 프로그램을 지원하는 WMDE 직원의 위키데이터 인건비 "인건비"에 포함되지 않은 추가 급여 비용 및 인건비 관련 비용
프로그램 비용 합계 1,675


요약

우리는 구조화된 데이터의 사용과 다른 콘텐츠 소스의 메타데이터 통합을 허용하기 위해 위키미디어 공용위키베이스(위키데이터의 기술적 기반)와 통합하고 있습니다. 이는 부분적으로 공용 미디어에 대한 더 나은 검색, 다국어 설명 및 분류를 포함하되 이에 국한되지 않는 위키미디어 커뮤니티의 여러 요청에 대한 응답입니다. 이는 콘텐츠를 더 쉽게 통합하고 재사용할 수 있으며, 교육 미디어를 통해 학습자와 독자로 구성된 더 넓은 커뮤니티에 다가갈 수 있도록, 위키미디어 공용 커뮤니티와 더 넓은 GLAM 네트워크 및 기타 위키미디어 프로젝트 재사용자와 더 깊은 관계를 개발함으로써 도달 범위, 지식 및 커뮤니티에 영향을 미칩니다.

참고: 더 자세한 정보는 공용:구조화된 데이터/슬론 보조금에서 이 작업과 이 슬라이드 데크를 강화하기 위해 확보된 보조금에 대한 배경 정보를 참조하세요.

목표

사람들이 공용에 저장된 무료 미디어를 더 쉽게 발견하고, 학습하고, 관리할 수 있도록 하여 더 높은 기여율을 장려함으로써 공용의 잠재력을 활용하세요.

  • 단기 성과(회계연도 2017-18년말): 다중 콘텐츠 개정(MCR) 및 위키베이스 연합을 포함하여 구조화된 데이터를 공용으로 통합하기 위한 핵심 인프라를 활성화합니다. 기능 개발 및 기타 공용 개선을 계획할 수 있도록 공용의 주요 이해관계자를 위한 초기 설계 연구를 완료합니다.
  • 중기 성과(2020년 3월 1일 슬론 보조금 종료): 위키미디어 공용 및 GLAM 커뮤니티가 구조화된 데이터를 공용의 최소 500만 개 미디어 항목에 통합할 수 있도록 지원하는 인프라와 도구를 제공합니다.
  • 장기 성과: 위키미디어 공용 커뮤니티와 파트너는 대부분의 위키미디어 공용 콘텐츠에 대해 강력하고 구조화된 데이터를 제공할 수 있습니다. 데이터는 공용 기여자, 개인 방문자 및 파트너를 위한 공용의 미디어 검색, 발견 및 관리 개선을 위해 활용됩니다.

부분 1: 데이터베이스 통합

리드 팀: 미디어위키 핵심 및 WMDE

성과

  • 성과 1: 위키 페이지, 특히 공용의 미디어 파일 페이지에 구조화된 데이터를 저장할 수 있습니다. 우리는 위키 페이지 내의 구조화된 데이터 요소를 올바르게 저장하고 처리하기 위해 미디어위키 저장 계층을 활성화할 것입니다.
    • 이를 통해 다양한 입력 인터페이스를 사용하는 편집자가 미디어에 대한 콘텐츠를 추가하기 위한 표준 데이터 입력 형식을 사용할 수 있게 됩니다. 오늘날 파일에 대한 구조화된 데이터를 입력하는 것은 어려운 일이며 데이터 입력, 메타데이터 검색 및 사용자 경험에 불일치와 오류가 발생합니다.
    • 1분기~4분기
  • 성과 2: 위키에 저장된 혼합 미디어의 유연한 입력, 표시, 소비 및 재사용을 가능하게 하기 위한 전제 조건인 다중 콘텐츠 개정(MCR)을 도입합니다. 현재 이러한 목적 중 많은 부분을 달성하려면 매우 복잡한 기술이 필요하며 일부 유용한 기능은 실용적이지 않습니다.
    • 1분기~4분기

목표

  • 목표 1: 콘텐츠 메타데이터에 대한 최고 수준의 지원을 위해 미디어위키 저장 계층을 확장합니다. 개정 검색, 차이점, 페이지 업데이트 내부가 이 확장된 데이터베이스 계층을 준수하도록 미디어위키 애플리케이션 코드 백엔드를 업데이트하세요.
  • 목표 2: 새 백엔드를 사용하기 위해 구성 요소 저장을 활성화합니다. 페이지에 있는 하나 이상의 콘텐츠 유형에 대한 변경 사항이 데이터베이스 및 관련 시스템에서 안전하게 커밋되도록 트랜잭션 관리 기능을 업데이트합니다.
  • 목표 3: 새로운 내부 기능을 사용하도록 페이지 렌더링, 차이점 보기, 브라우저 기반 및 API 기반 콘텐츠 검색 및 편집을 업데이트합니다. 또한 위키미디어에서 사용하는 확장 코드와 잠재적으로 널리 사용되는 제3자 확장 프로그램을 업그레이드합니다. 그렇지 않으면 데이터 계층 액세스 및 내부에 대한 오래된 가정에 의존할 수 있습니다.
  • 목표 4: 위키베이스 연합은 하나의 위키베이스 저장소(예: 위키데이터)에 정의된 개체(항목속성)를 다른 위키베이스 저장소(예: 위키미디어 공용)에서 사용할 수 있는 기능을 지원합니다.

이정표/목표

  • 이정표 1: 확장된 데이터베이스 계층과 미디어위키 애플리케이션 내부는 사전 통지를 통해 프로덕션에 배포되어 데이터베이스 복제본이 있는 도구 관리자가 준비되고 기존 콘텐츠 소비 및 편집 작업 흐름을 원활하게 지원합니다. 정확성을 입증하는 강력한 테스트 모음 외에도 사용자 트래픽 및 피드백을 관찰하면 이것이 정상이라면 부정적인 영향이 나타나지 않아야 합니다.
  • 이정표 2: 진정한 다중 콘텐츠 편집 내용을 성공적으로 저장하고, 액세스하고, 내보내고, 비교할 수 있습니다. 정확성을 입증하는 강력한 테스트 모음 외에도 얼리 어답터 위키 사용자 및 봇 운영자 피드백을 관찰하면 무엇이 작동하고 무엇이 개선이 필요한지 밝혀야 합니다.
  • 이정표 3: 사용자가 인식한 속도를 읽고 편집하는 데 부정적인 영향을 미치지 않으며 서버 리소스가 크게 소모되지도 않습니다. 이는 기존 성능 계측을 통해 관찰할 수 있습니다.
  • 이정표 4: 위키미디어 공용은 미디어 파일을 설명하는 위키베이스 개체를 저장하는 위키베이스 저장소가 되었습니다. 위키데이터에 정의된 속성과 개념(항목)을 사용하여 미디어 파일을 설명합니다(예: "라이센스: CC-BY-SA-4.0" 또는 "사람 표시: 월트 디즈니").

부분 2: 검색 통합 및 노출

리드 팀: 발견/검색

성과

  • 성과 1: 독자, 편집자, 콘텐츠 재사용자는 정확한 쿼리를 사용하여 미디어를 찾을 수 있습니다. 이는 카테고리에 대한 암묵적인 지식과 파일에 대한 철저한 정리가 필요한 경우가 많은 현재 상황을 바로잡습니다.
    • 2분기~3분기
  • 성과 2: 독자, 편집자, 콘텐츠 재사용자는 자신이 선택한 언어로 된 미디어를 더 쉽게 찾을 수 있습니다. 현재 사용자는 검색을 위해 모국어로 된 이름을 알고 있는 미디어를 찾기 위해 번역 서비스를 거쳐야 할 수도 있고, 심지어 미디어가 실제로 사용 가능하더라도 전혀 찾을 수 없는 경우도 있습니다.
    • 2분기~3분기

목표

  • 목표 1: 공용 검색은 CirrusSearch, Elasticsearch 및 위키데이터 쿼리 서비스를 통해 확장되어 미디어를 설명하는 구조화된 데이터 요소를 기반으로 한 검색을 지원합니다.
  • 목표 2: 고급 검색 기능(예: 위키데이터 쿼리 서비스, SPARQL 쿼리)은 보다 구체적인 미디어 검색 필터와 해당 필터가 나타내는 주제와의 관계를 지원하도록 업데이트됩니다.

이정표/목표

  • 이정표 1: 공용 커뮤니티 회원들은 웹 검색 내에서 쉽게 사용할 수 있는 가장 중요한 검색 기준 세트를 확인했습니다.
  • 이정표 2: 사용자는 주제, 권리 보유자, 라이선스 유형, 미디어 품질(예: 이미지 해상도)과 같은 검색 기준과 상위 검색 필터를 기준으로 공용 검색을 수행할 때 더 만족스러운 것으로 관찰됩니다. 공용 커뮤니티 회원이 추천합니다. 또한 시각적 편집기와 같은 통합 환경 내에서 문서 배치의 일부로 미디어 검색을 더욱 정교하게 만들 수 있습니다.

부분 3: 데이터 입력 및 마이그레이션

리드팀: 읽기:멀티미디어

성과

  • 성과 1:
    • 공용 기여자, 미디어 기여 파트너, 개별 업로더 및 미디어에 대한 구조화된 데이터 분류에 관심이 있는 기타 사람들은 더욱 원활하고 예측 가능하며 버그 없는 사용자 경험을 누릴 수 있습니다. 현재 업로드 및 미디어 분류 환경(업로드 마법사, 파일 페이지)은 메타데이터를 광범위하고 안정적으로 쉽게 입력, 표시 및 활용하는 기능이 부족하여 제한됩니다. 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.
  • 성과 2:
    • 수백만 개의 미디어 파일에는 구조화된 데이터가 첨부되어 있어 더 나은 공용 검색 기능을 제공하고 미디어를 소비하는 사용자에게 더 유용하고 일관된 표시를 제공합니다.
    • 이는 다년간의 노력이며 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.

목표

  • 목표 1:
    • 다중 콘텐츠 개정 인식 API 및 공용의 위키베이스를 사용하여 구성 가능한 구조화된 데이터의 데이터 입력 및 가져오기를 지원하도록 위키 업로드 작업 흐름을 업그레이드합니다.
    • 이는 다년간의 노력으로 진행되지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.
  • 목표 2:
    • 다중 콘텐츠 개정 인식 API와 공용의 위키베이스를 사용하여 구조화된 데이터, 특히 라이센스 정보의 표시를 보다 일관되게 지원하도록 미디어 뷰어 및 파일 페이지를 업그레이드합니다.
    • 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.
  • 목표 3:
    • 기여 또는 재사용 워크플로우를 지원하려는 커뮤니티 및 파트너 도구 빌더에게 기술 지원 및 지침을 제공합니다. 이는 문서화 및 전자 포럼 토론(아마도 주로 위키 기반)의 형태를 취할 것입니다.
    • 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.

이정표/목표

  • 이정표 1: 기존 사용자 연구와 공용 피드백을 종합하고 사용자 경험 향상 프로토타입을 미리 봅니다. 우리는 긍정적인 커뮤니티 참여와 사용자 연구 결과를 바탕으로 올바른 방향으로 나아가고 있음을 알게 될 것입니다.
    • 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.
  • 이정표 2: 프로토타입이 구축되고 핵심 커뮤니티 이해관계자와 함께 검토됩니다. 우리는 사용자 연구를 통해 관찰된 현장 사용자를 포함하여 얼리 어답터의 향상된 기능 향상에 대한 커뮤니티 피드백을 기반으로 제대로 진행되고 있음을 알게 될 것입니다.
    • 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.
  • 이정표 3: 최소 두 명의 주요 도구 개발자 또는 재사용자가 소프트웨어 업데이트를 시작하거나 구조화된 데이터의 데이터 입력 또는 공용 미디어용 구조화된 데이터의 사용자 경험에 대한 수집을 지원하는 새로운 도구를 작성합니다.
    • 이는 다년간의 노력이며 작업이 완료될 예정이지만 회계연도 2017-18년에는 완료되지 않을 것입니다. 명확성을 위해 이 문서에 포함되어 있습니다.

부분 4: 프로그램

리드 팀: 프로그램

성과

  • 성과 1: 기관 전반에 걸쳐 GLAM 데이터를 연결하려는 광범위한 노력의 일환으로 우리는 구조화된 공용 및 위키데이터의 이해관계자이자 재사용자가 될 GLAM 연합과의 관계를 발전시킬 것입니다. 이를 통해 기술 팀은 새로운 기능을 개발하면서 기관과 함께 아이디어와 실제 요구 사항을 테스트할 수 있습니다.
    • 1분기~4분기
  • 성과 2: 우리는 미디어 업로드, 다양한 프로그래밍 응용 프로그램에 대한 위키데이터 사용, 위키미디어 생태계를 넘어서는 위키데이터의 광범위한 파트너십 응용 프로그램을 포함하되 이에 국한되지 않는 구조적 공유지에 대한 기존 요구에 대한 더 나은 이해를 발전시킬 것입니다. WMDE와 협력하여 더 나은 사례 연구, 문서화 및 지원을 통해 더 광범위하고 장기적인 영향을 미칠 수 있습니다.
    • 1분기~4분기

목표

  • 목표 1: 이 이해관계자 그룹의 요구 사항과 우선순위를 식별할 수 있는 움직임과 GLAM 네트워크 이벤트에 참석합니다. 이는 디자인 연구와 협력하여 이루어질 것입니다.
  • 목표 2: 위키미디어 커뮤니티 간의 프로젝트 개발을 허용하고 기존 도구의 격차를 식별할 수 있도록 하는 공용 및 위키데이터 프로젝트에 대한 사례 연구 및 문서를 작성합니다.

이정표/목표

  • 이정표 1: 테스트 준비가 된 최소 10개 주요 GLAM 기관 또는 GLAM 네트워크(DPLA, Europeana, ICOM, IFLA 등)의 대표 그룹을 개발하고 커먼즈의 구조화된 데이터에 대한 피드백과 조언을 제공합니다. 이러한 파트너와 지역 또는 지방의 GLAM 자원봉사자 또는 코디네이터와 협력하여 위키미디어 콘텐츠의 구조화된 데이터로의 장기적인 전환을 지원하기 위한 전략 개발.
  • 이정표 2: 위키미디어 커뮤니티의 구조화된 데이터를 사용하여 기존 커뮤니티 구성원과 GLAM 파트너의 기술을 향상시키는 데 사용할 수 있는 최소 2개의 워크숍 또는 교육 자료 세트를 개발합니다.

부분 5: 커뮤니티 연락

리드 팀: 기술 협력

성과

  • 결과 1: 위키미디어 커뮤니티, GLAM 파트너 및 개발자는 구조화된 데이터 프로젝트에 전적으로 참여하고 있습니다. 이들은 계획 및 개발의 다양한 단계에 참여하고 새로운 기능을 채택합니다.

목표

  • 목표 1: 구조화된 데이터 팀과 협력하여 프로젝트 시작부터 새로운 기능의 개발 및 출시까지 커뮤니티 협업 활동을 계획하고 구현합니다.
  • 목표 2: 진행 중인 작업과 효과적으로 참여하고 자신의 프로젝트에 결과를 재사용할 수 있는 방법에 대한 기여자의 인식을 높입니다. 여기에는 갤러리, 도서관, 기록 보관소 및 박물관("GLAM") 및 개발자와 같은 파트너가 포함됩니다.
  • 목표 3: 새로운 프로세스와 도구의 사용을 채택하고 더 넓은 커뮤니티에 확산시키도록 커뮤니티 리더를 지원합니다.
  • 목표 4: 자원봉사자의 도움을 받아 소프트웨어 제품에 관한 새로운 문제에 대해 공용/위키데이터를 모니터링합니다.

이정표/목표

  • 이정표 1: 다음을 포함하여 커뮤니티가 작업의 투명성을 유지하기 위한 적절한 문서입니다:
    • 제품 관리자와 함께 유지 관리되는 높은 수준의 프로젝트 설명 및 로드맵은 진행 상황과 향후 이정표를 반영하고 기술 및 비기술 자원봉사자에게 피드백과 기여가 환영되는 목표 또는 작업을 가리킵니다.
    • 제품 관리자와 함께 유지 관리되는 프로젝트에 대한 선택된 업데이트의 안정적인 흐름은 주로 공용 및 위키데이터 커뮤니티, GLAM 파트너 및 개발자를 대상으로 하며 적어도 한 달에 한 번 업데이트되고 모든 상담, 기타 조치 요청 및 프로젝트 결정.
    • 자원 봉사 테스터가 위키 또는 파브리케이터에 참여하고 유용한 피드백을 제공하기 위한 지침입니다.
    • 설명이 포함된 스크린샷 및 스크린캐스트와 함께 베타 및 안정 단계에 진입하는 새로운 기능을 다루는 신규 문서 또는 기존 문서 업데이트 중 신규 사용자를 위한 사용자 도움말 문서입니다.
    • * 모든 내용은 간결해야 하며, 일반 영어를 사용하고, 번역이 가능해야 합니다.
  • 이정표 2:
    • 구조화된 데이터 프로젝트에 대한 프리젠테이션과 워크숍은 주요 위키미디어 이벤트에 제출되며 온라인으로 제공됩니다.
    • 매우 활동적인 기여자와 기타 커뮤니티 리더는 새로운 기능에 대해 알아보고 필요한 경우 지원을 받을 수 있도록 개인적인 초대를 받으며 피드백을 공개적으로 공유하거나 팀에 공유하도록 권장됩니다.
  • 이정표 3:
    • 프로젝트 페이지 또는 주요 장소에서 커뮤니티가 보고한 관련 기술 또는 사회적 문제는 파브리케이터에 제출되거나 제품 관리자에게 에스컬레이션됩니다.
    • 커뮤니티와의 예상치 못한 충돌은 전혀 없습니다. CL은 개발팀이 잠재적이고 새로운 갈등 지점을 인식하도록 보장합니다.