Tin tức

Nỗ lực chống phá hoại bản đồ trong dữ liệu OpenStreetMap

19/07/2021 GeoLink Thu Giang 0 Nhận xét

(English below)
Dữ liệu mở và bản đồ đã cho phép một số lượng lớn người đóng góp bằng cách sử dụng các kỹ thuật nguồn lực cộng đồng. Các khu vực rộng và nhiều chi tiết đã trở nên dễ dàng hơn để lập bản đồ, trong khi dữ liệu có thể đáp ứng cho các mục đích khác nhau cho người dùng. Tuy nhiên, bằng cách tạo dữ liệu bản đồ mở và khả năng lập bản đồ của người dùng, ứng dụng cũng dễ bị phá hoại bản đồ và gián đoạn chung do ý định xấu của người dùng.

Phá hoại bản đồ là gì?
Phá hoại bản đồ là việc cố ý thay đổi hoặc cập nhật dữ liệu bản đồ, chẳng hạn như thêm tên không chính xác cho đường phố hoặc địa điểm. Open Street Map (OSM), dự án dữ liệu bản đồ mở được biết đến rộng rãi nhất, có khả năng bị phá hoại bản đồ.

Thông thường, dữ liệu được giám sát thông qua một đường dẫn liên quan đến một bản chỉnh sửa hoặc đệ trình bản đồ. Ví dụ: Mapbox sẽ thực hiện kiểm tra đường ống tự động kết hợp kiểm tra hành vi phá hoại và thường ít nhất một người kiểm tra là con người cũng xem xét dữ liệu. Tuy nhiên, ngay cả khi đó, các hành vi phá hoại bản đồ vẫn được thông qua và có thể được đăng lên, chẳng hạn như một sự kiện nổi tiếng được biết đến từ vài năm trước. [1]
Trong khi các tổ chức đã chọn OSM làm nền tảng bản đồ mở phổ biến nhất vì sức hấp dẫn rộng rãi và sự đóng góp của người dùng, thì các tổ chức này cũng nhận thức rõ về khả năng phá hoại. Sử dụng các mô hình phân tích và kỹ thuật học máy, các tổ chức như Facebook đang cố gắng phát hiện các hành vi phá hoại và gắn cờ các hành vi này để chỉnh sửa. [2]

OSM đã tạo ra chính sách rõ ràng để ngăn chặn hành vi phá hoại và đưa ra các ví dụ, chẳng hạn như một thị trấn giả được tạo ra với các đường phố giả để chứng minh các hành vi phá hoại. Trên thực tế, OSM đã tạo ra chính sách sao cho các hành động phá hoại đơn giản có thể nhanh chóng được hoàn nguyên về cài đặt bản đồ trước đó và sau đó được chỉnh sửa nếu cần. Mục đích xấu hơn có thể dẫn đến lệnh cấm vĩnh viễn đối với những người dùng tạo ra hành vi phá hoại. [3]

Mức độ phổ biến của Phá hoại bản đồ?
Trong một nghiên cứu tương đối gần đây khi xem xét OSM trong trò chơi Pokemon GO (PGO) nổi tiếng, người ta thấy rằng hành vi phá hoại có thể phổ biến, nhưng hầu hết được khắc phục nhanh chóng. Trên thực tế, một lợi ích của các nền tảng như OSM là một cộng đồng lớn có nghĩa là hành vi phá hoại thường được phát hiện nhanh chóng.

Thông thường, các hành vi phá hoại được khắc phục trong vòng vài phút hoặc vài giờ, và thường chỉ gây rối một cách lẻ tẻ. Người ta thấy rằng chỉ có 16,5% hành vi phá hoại kéo dài đến một tuần. Các bản sửa lỗi chủ yếu được theo đuổi bởi một nhóm tương đối nhỏ hơn nhưng tận tâm, những người coi việc phá hoại một cách nghiêm túc.
Nhiều hành động phá hoại có tính chất bản địa hóa, nơi những kẻ phá hoại nằm trong quốc gia nơi xảy ra hành vi phá hoại hoặc thậm chí trong một bán kính giới hạn xung quanh thị trấn mà chúng có thể đến. Điều này ngụ ý rằng những kẻ phá hoại có thể được theo dõi và theo dõi tốt nhất hoạt động của chúng, nơi những cá nhân như vậy, nếu chúng phá hoại một lần nữa, có khả năng làm điều đó trong khu vực địa phương của họ.

Việc giám sát cộng đồng và ứng phó với hành vi phá hoại cũng có vẻ hiệu quả hơn nếu họ nhận thức được rằng hành vi phá hoại đang gia tăng, nơi người dùng được phát hiện chú ý nhiều hơn đến chi tiết bản đồ khi có nhận thức cao hơn về hành vi phá hoại. [4]

Lập chiến lược để khắc phục và ngăn chặn hành vi phá hoại bản đồ
Một nghiên cứu gần đây cho thấy rằng việc đào tạo các phương pháp tiếp cận máy học về phá hoại khu vực cục bộ, đó là các khu vực mà dữ liệu đào tạo máy học được thu thập, hoạt động tốt nhất ở các khu vực địa phương. Nói cách khác, vì hành vi phá hoại cục bộ có khả năng xảy ra từ cùng một nhóm người dùng, nên các mô hình của các hành vi phá hoại này có xu hướng giống nhau theo thời gian trong cùng một khu vực.

Các phương pháp như kỹ thuật rừng ngẫu nhiên hoạt động tốt trong việc phát hiện các hành vi phá hoại cục bộ trên bản đồ, nhưng khi dữ liệu đào tạo sau đó được sử dụng cho các vùng xa hơn thì việc phát hiện các hành vi phá hoại lại khó khăn hơn. Nói cách khác, để ngăn chặn các hành vi phá hoại bản đồ, có thể cần sử dụng nhiều loại dữ liệu được đào tạo cục bộ với các mô hình được đào tạo sau đó áp dụng cho các vùng địa lý hạn chế. [5]
Phá hoại bản đồ chắc chắn là một vấn đề. Các biện pháp kiểm tra để ngăn chặn nó hiện diện và các nhà nghiên cứu đã tạo ra các kỹ thuật tự động để phát hiện nó đồng thời lưu ý cách các nhóm người dùng phản ứng với các hành vi phá hoại giúp ngăn chặn các cuộc tấn công trong tương lai. Tuy nhiên, với việc dữ liệu mở ngày càng phổ biến, chúng ta có thể cho rằng việc phá hoại bản đồ sẽ là một vấn đề dai dẳng.

Các nhà nghiên cứu hiện đang cố gắng tạo ra những cách tốt hơn để tìm ra hành vi phá hoại. Cho rằng có nhiều cá nhân tham gia vào việc phá hoại, điều này có thể không phải lúc nào cũng thành công. Tuy nhiên, hình thức cảnh giác tốt nhất dường như là cộng đồng những người sử dụng bản đồ trên các nền tảng như OSM. Có nhiều cá nhân bị thay đổi để có hành vi phá hoại thường dường như là cách tốt nhất để ngăn chặn hoặc nhanh chóng chỉnh sửa các hành vi phá hoại bản đồ.

----

Efforts to Combat Map Vandalism in OpenStreetMap Data
Open data and mapping have enabled a large number of people to contribute using crowdsourcing techniques. Wide areas and a lot of detail have become much easier to map, while the data are amenable to different purposes for users. However, by creating open map data and user possibilities for mapping, application are also susceptible to map vandalism and general disruption by maliciously user intentions.

What is Map Vandalism?
Map vandalism is the deliberate wrong change or update to map data, such as adding an incorrect name for a street or place. Open Street Map (OSM), the most widely known open map data project, is potentially vulnerable to map vandalism.

Typically, data are monitored through a pipeline related to an edit or map submissions. For instance, Mapbox will perform automated pipeline checks that incorporate checks for vandalism and usually at least one human checker also looks over the data. However, even then, acts of map vandalism get through and can be posted, such as a well known event known from a few years ago.[1] 
While organizations have chosen OSM as the most common open map platform because of its wide appeal and user contributions, these same organizations are also well aware of potential vandalism. Using analytical models and machine learning techniques, organizations such as Facebook are attempting to detect acts of vandalism and flag these for edits.[2] 

OSM has created clear policy to also discourage vandalism and has provided examples, such as a fake town created with fake streets to demonstrate acts of vandalism. In fact, OSM has created policy such that simple acts of vandalism can be quickly reverted to a previous map setting and then edited if needed. More malicious intent may lead to a permanent ban for the users creating the vandalism.[3]

How Prevalent is Map Vandalism?
In relatively recent research that looked at OSM in the popular Pokemon GO (PGO) game, it was found that vandalism can be common, but mostly fixed quickly. In fact, one benefit of platforms like OSM is that a large community means that vandalism is often spotted quickly.

Usually, acts of vandalism are fixed within minutes or hours, and are generally only disruptive sporadically. It was found that only 16.5% acts of vandalism persisted up to a week. Fixes are mostly pursued by a relatively smaller but dedicated group who take vandalism seriously.  
Many acts of vandalism are somewhat localized, where vandals are located within the country where the vandalism occurs or even within a limited radius around the town they may come from. This implies that vandals might be best traced and monitored for their activity, where such individuals, if they vandalise again, are likely to do it in their local area.

The community monitoring and responding to vandalism also appears to be more efficient if they become aware that vandalism is on the increase, where users were found to pay closer attention to map details when there was greater awareness of vandalism.[4] 

Strategizes to Fix and Prevent Map Vandalism
One recent study showed that training machine learning approaches on local area vandalism, that is areas where the machine learning training data are gathered from, best work in local areas. In other words, as local vandalism is likely to occur from the same group of users, then the patterns of these vandalism acts tend to be similar across time in the same area.

Methods such as random forest techniques work well at detecting local acts of vandalism on maps, but when the training data are then used for more distant regions the detection of vandalism proved harder. In other words, to prevent acts of map vandalism, it might be necessary to use a variety of locally trained data with the trained models then applied for limited geographic regions.[5]
Map vandalism is certainly a problem. Checks to prevent it are present and researchers have created automated techniques to detect it while also noticing how user groups respond to acts of vandalism that help prevent future attacks. Nevertheless, with open data becoming more common, we can expect map vandalism to be a persistent problem.

Researchers are now attempting to create better ways to find vandalism. Given that there are many individuals involved in vandalism, this may not be always successful. Nevertheless, the best form of vigilance appears to be the community of map users on platforms such as OSM. Having many individuals altered to the presence of vandalism often seems to be the best way to prevent or quickly edit acts of map vandalism.

Geolink tổng hợp từ Gislounge

Bình luận

VIẾT BÌNH LUẬN CỦA BẠN:

popup

Số lượng:

Tổng tiền: