IP Editing: Privacy Enhancement and Abuse Mitigation/Research and tools/vi
Dữ liệu từ Wikipedia tiếng Bồ Đào Nha vô hiệu quyền sửa đổi IP
Số liệu của Wikipedia tiếng Bồ Đào Nha sau hạn chế
Cập nhật ngày 30 tháng 8 năm 2021
Xin chào. Đây là một cập nhật ngắn về số liệu của Wikipedia tiếng Bồ Đào Nha sau khi yêu cầu phải đăng ký để có thể sửa đổi. Chúng tôi có một báo cáo quan trọng trong trang Báo cáo hệ quả. Báo cáo này cho những số liệu thu thập được qua dữ liệu cũng như là một khảo sát được diễn ra đối với các thành viên Wikipedia tiếng Bồ Đào Nha đang hoạt động.
Tất cả là, báo cáo này đưa ra sự thay đổi trong một cách khá tốt đẹp. Chúng tôi đã không thấy được một sự gia tăng trong phá hoại trong giai đoạn các số liệu này được thu thập. Trong quá trình đó, chúng tôi cũng đang được khuyến khích để có thể thực hiện thí nghiệm này ở hai dự án khác để xem là có được hiệu quả như trên không. Mỗi dự án đều có sự giống nhau theo cách riêng và những thứ gì đúng cho Wikipedia tiếng Bồ Đào Nha có thể sẽ không đúng cho dự án khác. Chúng tôi muốn chạy một cuộc thử nghiệm cho hai dự án khác mà để có thể cung cấp đủ dữ liệu cho sự thay đổi trên. Sau thời gian này, chúng tôi sẽ quay trở lại việc không cần đăng ký nữa để có thể sửa đổi khi chúng tôi đánh giá dữ liệu. Khi dữ liệu này đã được công bố, cộng đồng có thể tự quyết định được là liệu có muốn tiếp tục hạn chế sửa đổi không đăng ký trong dự án trên.
Chúng tôi đang gọi nó là Thí nghiệm Yêu cầu Đăng nhập. Chúng tôi sẽ tìm được thêm dữ liệu nữa cũng như là dòng thời gian trong trang trên. Hãy sử dụng trang này và trang thảo luận để có thể thảo luận sâu hơn.
Hạn chế sửa đổi IP của Wikipedia tiếng Bồ Đào Nha
Wikipedia tiếng Bồ Đào Nha đã cấm thành viên chưa đăng nhập thực hiện sửa đổi cho dự án này năm ngoái. Trong vài tháng gần đây, chúng tôi cũng đã thu thập những dữ liệu về hệ quả của sự thay đổi này đối với sức khoẻ chung của dự án. Chúng tôi cũng đã nói với rất nhiều những thành viên cộng đồng khác nhau về trải nghiệm của mình. Chúng tôi cũng đã bắt đầu thực hiện về những lượt cuối để có thể thu thập thêm được dữ liệu mà nó có thể thu được một bức tranh toàn cảnh về trạng thái dự án. Hy vọng là chúng tôi có được một cập nhật chung về nó trong tương lai.
Công cụ
Phát triển công cụ
Như bạn đã từng biết, chúng tôi đang xây dựng những công cụ mới, một phần để có thể giảm thiểu những hệ quả của việc ẩn địa chỉ IP, cũng là để có thể xây dựng công cụ chống phá hoại tốt hơn cho mọi người. Đó không phải là một bí mật mà các công cụ bảo quản ở dự án này không đưa cho các cộng đồng công cụ mà họ cần. Có rất nhiều không gian cho sự cải thiện. Chúng tôi muốn xây dựng những công cụ mà có thể giúp đỡ những người chống phá hoại làm việc hiệu quả hơn. Chúng tôi cũng muốn giảm hàng rào để có thể thực hiện những quyền này cho những thành viên phi kỹ thuật.
Chúng tôi cũng đã thảo luận trước đó về ý tưởng cho công cụ này rồi và tôi sẽ cho một cập nhật ngắn gọn về nó sắp tới. Chú ý rằng quá trình cho những công cụ này cũng đang tương đối chậm trong vài tháng khi đội của chúng tôi đang thực hiện cải thiện SecurePoll để chuẩn bị cho cuộc bầu cử Hội đồng Quản trị sắp tới.
Tính năng thông tin IP
Chúng tôi đang xây dựng một công cụ mà sẽ hiển thị thông tin quan trọng về một địa chỉ IP mà thường xuyên được tìm thấy trong các cuộc điều tra. Thông thường, tuần tra viên, bảo quản viên và kiểm định viên phụ thuộc vào các trang web này để có thể đưa được thông tin. Chúng tôi hy vọng sẽ khiến quá trình này dễ dàng hơn với họ khi bao hàm những thông tin từ các trung tâm IP đáng tin cậy cho website của chúng tôi. Chúng tôi vừa mới xây một nguyên mẫu và mới đưa ra thử nghiệm người dùng để có thể chứng nhận cách thức này. Chúng tôi thấy được đa số biên tập viên trong cuộc phỏng vấn thấy được công cụ này có ích và muốn sử dụng nó trong tương lai. Có một trang cập nhật dự án mà bạn có thể quan tâm ở đây. Một số câu hỏi trọng tâm mà chúng tôi muốn nhìn thấy phản hồi của bạn trong trang thảo luận dự án:
- Khi bạn điều tra địa chỉ IP, thông tin nào bạn muốn thấy? Trang nào khiến cho bạn phụ thuộc nào khi tra các loại thông tin trên?
- Loại thông tin IP nào mà bạn thấy có ích nhất?
- Loại thông tin IP nào, khi được chia sẻ, bạn nghĩ là sẽ khiến cho thành viên vô danh gặp rủi ro?
Tính năng nối hai thành viên
Dự án này cũng đã được mô tả là "Biên tập viên gần đây" và "Xác định con rối" trong những cuộc trò chuyện gần đây. Chúng tôi đang cố gắng tìm một tên thích hợp hơn cho nó mà có thể dễ hiểu kể cả những người không hiểu về khái niệm tài khoản con rối.
Chúng tôi đang trong giai đoạn sớm nhất của dự án này. Nhóm Nghiên cứu của Quỹ Wikimedia có một dự án mà có thể giúp đỡ trong việc phát hiện xem hai biên tập viên có thói quen sửa đổi giống nhau không. Nó sẽ giúp kết nối các biên tập viên chưa đăng ký khác nhau khi họ sửa đổi bằng các tài khoản tạo tự động khác nhau. Chúng tôi đã có rất nhiều những đồng thuận cho dự án này khi chúng tôi nói về nó từ một năm trước. Chúng tôi đã từng được nghe về rủi ro khi phát triển những tính năng trên. Chúng tôi cũng đang có kế hoạch xây dựng một nguyên mẫu trong tương lai gần và chia sẻ với cộng đồng. Chúng tôi có một trang dự án chưa hoàn thiện về nó. Hy vọng là chúng tôi có thể có được một cập nhật cho nó sớm nhất. Những suy nghĩ về dự án này được mời ở trang thảo luận dự án.
Như đã được nói ở trước đó, mục tiêu đầu tiên là để cho phổ biến những công cụ chống phá hoại tốt nhất cho cộng đồng của chúng tôi mà nó sẽ đưa ra những trải nghiệm quản lý tốt hơn cho thành viên chống phá hoại, mà cũng sẽ khiến cho địa chỉ IP không còn ý nghĩa với họ nữa. Một lý do khác để thực hiện việc này là địa chỉ IP rất khó hiểu và có thể được hiểu với các thành viên công nghệ cao. Việc này tạo ra một rào cản cho thành viên mới mà ít có công nghệ cao để tiến vào các quyền kiểm định do có một yêu cầu cao hơn về công nghệ để có thể làm việc với địa chỉ IP. Chúng tôi hy vọng sẽ tiến tới một phía mà các công cụ kiểm duyệt có thể được sử dụng bởi bất kỳ ai mà không cần có nhiều kiến thức kỹ thuật.
Thứ đầu tiên mà chúng tôi tập trung vào chính là đảm bảo công cụ CheckUser hiệu quả, linh động và dễ sử dụng hơn. Nó là một công cụ quan trọng mà đưa ra nhu cầu để có thể xác định và cấm các thành viên phá hoại lâu năm trong các dự án của chúng tôi. Công cụ CheckUser không được bảo đảm nhiều trong nhiều năm qua và kết quả là nó trở nên lỗi thời và thiếu nhiều tính năng quan trọng.
Chúng tôi cũng sẽ dự kiến được một sự gia tăng số lượng thành viên chấp nhận trở thành các Kiểm định viên của dự án chúng tôi sau khi việc ẩn IP trở nên bắt đầu được thực thi. Nó tạo ra một yêu cầu về một công cụ CheckUser tốt hơn và dễ sử dụng hơn cho những thành viên. Như vậy, đội Chống Lăng mạ đã dành năm ngoái để có thể cải thiện công cụ CheckUser - khiến cho nó trở nên hiệu quả và thân thiện với người dùng. Công việc này cũng đã tính vào những yêu cầu tính năng mới nhất từ cộng đồng. Chúng tôi cũng đã thường xuyên thảo luận với CheckUser và các tiếp viên về dự án này và cũng cố gắng hết sức để có thể thực hiện được kỳ vọng của họ. Tính năng mới này được dự đoán sẽ đưa vào tất cả các dự án vào tháng 10 năm 2020.
Một tính năng khác mà chúng tôi đang thực hiện chính là Thông tin IP. Chúng tôi quyết định về dự án này sau một vòng chất vấn từ 6 wiki khác nhau mà cũng đã giúp họ thu hẹp về việc sử dụng cho địa chỉ IP của dự án của tôi. Nó cũng đã được phát hiện rằng cũng có rất nhiều thông tin quan trong mà địa chỉ IP đưa cho mà vẫn cần phải được xem bởi các tuần tra viên để có thể làm việc hiệu quả hơn. Mục tiêu cho Thông tin IP, chính là việc nhanh chóng và dễ dàng đưa nhận thông tin về một địa chỉ IP. Địa chỉ IP đưa ra những thông tin quan trọng về địa điểm, tổ chức, khả năng nó là node Tor/VPN, rDNS, dải thuộc về, lấy ví dụ như vậy. Bằng cách hiển thị chúng nhanh chóng và dễ dàng mà không phụ thuộc vào các công cụ ngoài mà không phải ai cũng có thể sử dụng, chúng tôi hy vọng sẽ khiến cho tuần tra viên làm việc của mình dễ dàng hơn. Thông tin này sẽ đủ cấp độ cao để chúng tôi có thể hiển thị mà không vi phạm quyền của người vô danh. Cùng lúc đó, nó cũng đủ để các tuần tra viên có thể tạo ra những đánh giá chất lượng về một địa chỉ.
Sau Thông tin IP, chúng tôi cũng sẽ tập trung vào tính năng tìm biên tập viên giống nhau. Chúng tôi sẽ sử dụng một mô hình học máy, xây dựng dựa trên sự hợp tác với các Kiểm định viên và luyện tập dựa trên dữ liệu CheckUser cũ để so sánh biểu hiện thành viên và lá cờ khi hai hoặc nhiều thành viên biểu hiện gần giống nhau. Mô hình sẽ tính về trang họ hoạt động, cách viết của họ, thời gian sửa đổi ... để tạo ra dự đoán là hai thành viên giống thế nào. Chúng tôi đang cố gắng để đảm bảo mô hình này chính xác nhất có thể.
Khi nó đã được hoàn thiện, có rất nhiều vùng khác nhau liên quan đến mô hình này có thể thực hiện được điều gì. Ở bước đầu tiên, chúng tôi sẽ đưa nó để giúp các kiểm định viên xác định rối nhanh chóng mà không phải điều tra phức tạp. Trong tương lai, chúng tôi có thể suy nghĩ về cách sử dụng công cụ này và áp dụng nó để xác định vòng dây rối nguy hiểm và những chiến dịch sai lệch thông tin.
Bạn có thể đọc thêm và để lại bình luận trong trang dự án về công cụ này.
Nghiên cứu
Báo cáo về ảnh hưởng của ẩn IP
Địa chỉ IP có giá trị to lớn như là một công cụ xác định bán phần, khi khó có thể sửa đổi được bởi một người nhất định. Tuỳ thuộc vào bên đưa và tuỳ chọn thiết bị, thông tin IP có vẻ không được chính xác cho lắm, và những kiến thức kỹ thuật sâu hơn cần thiết đề có thể hiểu sâu được thông tin IP, nhưng bảo quản viên lại không cần chúng để có được quyền truy cập. Những thông tin kỹ thuật này lại cần để có thê cung cấp thông tin sâu hơn (được coi là "kiến thức biểu hiện") khi có thể, mà thông tin lấy được từ địa chỉ IP sẽ ảnh hưởng sâu rộng đến hoạt động bảo quản được thực hiện.
Về mặt xã hội, vấn đề về việc có nên cho phép thành viên chưa đăng ký sửa đổi không đang là một vấn đề tranh cãi rất lớn. Hiện nay, nó đang nghiêng về phía cho phép thành viên chưa đăng ký sửa đổi. Những tranh cãi này đang thường được nghiêng về phía chống phá hoại, với việc bảo vệ khả năng cho việc sửa đổi vô danh và giảm yêu cầu để có thể sửa đổi. Có một thiên kiến nhận định chống lại thành viên chưa đăng ký bởi vì những liên hệ với phá hoại, cũng được xuất hiện như một thiên kiến thuật toán trong công cụ như ORES. Tương tự, có một số vấn đề liên quan đến kết nối khi nói chuyện đến thành viên ẩn danh, do vấn đề về liên lạc, và không ai chắc chắn chính người đó sẽ đọc tin nhắn gửi cho trang thảo luận IP.
Về những ảnh hưởng sâu rộng của việc ẩn địa chỉ IP, nó cũng sẽ ảnh hưởng khá nặng đến quá trình làm việc của bảo quản viên và gia tăng công việc cho các kiểm định viên trong ngắn hạn. Khi địa chỉ IP bị ẩn, khả năng quản lý phá hoại của các BQV sẽ được dự đoán là suy yếu đi nhiều. Nó có thể được thay thế bằng cách đưa ra những công cụ với khả năng thực hiện bằng hoặc tương đương, nhưng chúng ta vẫn cần một giai đoạn chuyển tiếp được nhắc đến việc suy giảm khả năng hoạt động. Để đảm bảo cho hỗ trợ hoạt động công cụ của các BQV, chúng ta sẽ cần phải cẩn thận hơn và đưa ra những cách khác cho những tính năng được có bởi thông tin IP:
- Hiệu quả cấm và ước tính hệ quả ngoài
- Một số cách để đưa ra sự giống nhau hay quy luật trong thành viên chưa đăng ký, ví dụ như sự giống về mặt địa lý, hay là tổ chức (vd: sửa đổi đến từ trường cấp ba hoặc đại học)
- Khả năng để nhắm đến một số nhóm thành viên chưa đăng ký, ví dụ như kẻ phá hoại nhảy IP trong một dải
- Địa chỉ hay hoạt động của một nhóm tổ chức (không cần nhất thiết phải cấm); ví dụ, khả năng xác định sửa đổi này được thực hiện bởi một proxy mở, hay địa chỉ công cộng như trường học hay thư viện.
Tuỳ thuộc vào cách mà chúng ta quản lý tài khoản tạm thời hay là danh tính cho thành viên chưa đăng ký, chúng ta sẽ có thể cải thiện được liên lạc tới thành viên chưa đăng ký này. Những cuộc thảo luận và vấn đề liên quan đến thành viên chưa đăng ký, phá hoại ẩn danh, hay thiên kiến chống lại thành viên chưa đăng ký vẫn khó thay đổi nếu ẩn IP đi, khi ta vẫn cho phép họ sửa đổi khi đăng xuất.
Hoạt động CheckUser
Chúng tôi cũng đã phỏng vấn các kiểm định viên của nhiều dự án thông qua quá trình thiết kế trang Đặc biệt:Kiểm tra người dùng mới. Thông qua phỏng vấn và xem xét các trường hợp thực tế, chúng tôi tách công cụ kiểm định viên thành năm giai đoạn:
- Phân loại: đánh giá một vụ về khả năng và độ phức tạp.
- Hồ sơ: tạo một quy luật biểu hiện mà sẽ xác định người dùng qua nhiều tài khoản.
- Kiểm tra: đánh giá IP và người dùng thông qua công cụ CheckUser.
- Đánh giá: ghép những thông tin kỹ thuật này với những thông tin biểu hiện xuất hiện ở mục Hồ sơ, để có thể quyết định chính xác về hoạt động quản trị nào cần được thực hiện.
- Đóng: báo cáo kết quả cuộc điều tra trong các nền tảng công khai hoặc riêng tư khi cần thiết, và lưu trữ chúng một cách hợp lý để có thể sử dụng trong tương lai.
Chúng tôi cũng đã làm việc với những nhân viên trong đội Giám sát an toàn để có một cách nhìn nhận về công cụ CheckUser đã hoạt động thế nào trong các cuộc điều tra của Quỹ Wikimedia và các vụ mà biến động nhiều trên T&S.
Những bất lợi lớn của công cụ lại xuất hiện từ cách công cụ CheckUser thể hiện thông tin thiếu ý nghĩa, và việc phải mở tất cả các liên kết trong một thẻ mới. Nó có thể gây ra sự rối loạn khi số lượng thẻ phải mở tăng lên quá nhanh. Để khiến mọi việc trở nên tồi tệ, thông tin mà công cụ CheckUser đưa ra đòi hỏi tính kỹ thuật cao và khó hiểu khi mới nhìn vào, khiến cho các thẻ trở nên khó theo dõi. Tất cả những người được phỏng vấn cho rằng họ sử dụng các phần mềm khác nhau hoặc giấy bút để theo dõi thông tin.
Chúng tôi cũng đã bắt đầu tham gia nghiên cứu về trang điều tra tài khoản con rối của Wikipedia tiếng Anh để có thêm được dữ liệu về bao nhiêu vụ họ xử lý, bao nhiêu vụ bị từ chối và bao nhiêu rối một báo cáo chứa.
Sử dụng địa chỉ IP của tuần tra viên
Những nghiên cứu trước đó về tuần tra trong các dự án của chúng tôi đang tập trung về công việc và cách làm việc của tuần tra viên. Trong thời gian gần đây, nghiên cứu về tuần tra trên Wikipedia đã tập trung vào cách hoạt động của tuần tra viên và những rủi ro đến cách thức hoạt động chống phá hoại hiện nay. Những nghiên cứu cũ hơn, ví dụ như Khảo sát tuần tra trang mới hay Khảo sát công việc tuần tra viên, tập trung vào Wikipedia tiếng Anh. Họ cũng đã nhìn lại vào công việc tuần tra viên, và nhìn chung vào những công cụ tuần tra viên robot ảnh hưởng đến công việc của họ thế nào.
Nghiên cứu của chúng tôi cố để xem xét năm wiki mục tiêu, đó là
- Wikipedia tiếng Nhật
- Wikipedia tiếng Hà Lan
- Wikipedia tiếng Đức
- Wikipedia tiếng Trung Quốc
- Wikiquote tiếng Anh
Họ được chọn thông qua thái độ đối với sửa đổi IP, phần trăm của các sửa đổi hàng tháng tạo bởi IP, và những khó khăn và tình thế riêng phải chịu bởi các biên tập viên IP (vd, sử dụng tính năng Thay đổi đang chờ hoặc sử dụng nhiều proxy). Các thành viên tham gia được mời bằng lời mời ở trang thảo luận cộng đồng tương ứng. Nếu có thể, chúng tôi cũng đăng ở trang Đại sứ quán Wiki. Tuy nhiên, trong khi chúng tôi có dịch thuật trong buổi phỏng vấn, chúng tôi lại không dịch các trang tin nhắn, khiến cho tỷ lệ phản hồi nó trở nên thấp. Tất cả các cuộc phỏng vấn được diễn ra sử dụng Zoom, với một người viết ghi chú.
Đồng ý với những phát hiện từ nghiên cứu trước đó, chúng tôi chưa tìm thấy được một phương thức có hệ thống sử dụng thông tin IP. Thêm vào nữa, thông tin này chỉ được tra sau khi một vấn đề nghi ngại được xuất hiện. Những việc điều tra thêm về hoạt động nghi ngờ bắt đầu từ thông tin trên wiki công khai, như là kiểm tra sửa đổi địa phương hoặc toàn cục, và tìm kiếm những lệnh cấm chỉ trước đó.
Sự chính xác và nhất quán không phải là bản chất quan trọng nhất cho thông tin IP: khi phát hiện ra là một trang web thông tin IP trả ra ba kết quả khác nhau về địa điểm địa lý của cùng một địa chỉ IP, một trong những người phỏng vấn đã nói là tính chính xác trong địa điểm không quan trọng bằng sự nhất quán. Tuy nhiên, khi mà địa chỉ IP được nhát quán là thuộc về cùng một quốc gia, nó sẽ không quan trọng khi nó là đúng và chính xác không. Nó phù hợp với cách mà thông tin IP được sử dụng: là một thông tin gần duy nhất gán với một người hoặc thiết bị, mà rất khó phát hiện ra với người bình thường. Sự chính xác của thông tin thu được đối với người dùng không quan trọng bằng thứ mà nó được gán vào và khó thay đổi.
Những tìm kiếm của chúng tôi nhấn mạnh một số yếu tố thiết kế cho công cụ thông tin IP:
- Đưa ra một dữ liệu thoáng qua qua các dữ liệu thô
- Đưa ra những thông tin chính về IP:
- Định vị địa lý (đến thành phố hoặc quận huyện nếu có)
- Tổ chức đăng ký
- Loại kết nối (lưu lượng cao, như là mạng di động hay cơ sở dữ liệu, với lưu lượng thấp, như băng thông gia đình)
- Trạng thái proxy (có hoặc không)
Về mặt đạo đức, nó cũng sẽ rất quan trọng để có thể hiểu được những kết luận trên được đạt đến như thế nào, và sự thiếu chính xác được phân luận trong việc lấy thông tin IP. Khi nó không được coi là một nỗi lo đối với các tuần tra viên, nếu chúng ta muốn tạo một công cụ mà sẽ được sử dụng để đưa ra những giải thích cho hoạt động quản trị, chúng ta sẽ cần phải cẩn thận để giải thích những hạn chế của công cụ của chúng tôi.
––
Best regards,
Trust and Safety Product
Please use the project talk page for discussions on the matter. For any issues concerning this release, please don't hesitate to leave a message on the project talk page or contact Szymon Grabarczuk.