Cơ hội

Khóa học chuyên gia về ngôn ngữ lập trình Python cho GIS và khoa học địa lý - Chương trình Tiến sĩ đại học Ghent, Bỉ

18/03/2021 GeoLink Thu Giang 0 Nhận xét

(English Below)

Một khía cạnh quan trọng của công việc hàng ngày trong khoa học thông tin địa lý và khoa học trái đất là xử lý một lượng lớn dữ liệu tiềm năng. Đọc dữ liệu không gian, khám phá dữ liệu, tạo hình ảnh trực quan và chuẩn bị dữ liệu để phân tích sâu hơn có thể trở thành những công việc tẻ nhạt. Do đó, việc tăng hiệu quả và khả năng tái tạo trong quá trình này mà không cần giao diện GUI có lợi cho nhiều nhà khoa học. Việc sử dụng các ngôn ngữ lập trình cao cấp như R và Python ngày càng phổ biến cho các tác vụ này nhờ vào sự phát triển của các gói định hướng GIS.

Khóa học này đào tạo sinh viên sử dụng Python một cách hiệu quả để thực hiện những công việc này, tập trung vào dữ liệu không gian địa lý (GIS). Nó bao gồm cả dữ liệu vectơ và raster. Khóa học tập trung vào việc giới thiệu các gói Python chính để xử lý dữ liệu đó (GeoPandas, Numpy và Rasterio, Xarray) và cách sử dụng các gói đó để nhập, khai thác, trực quan hóa và thao tác dữ liệu không gian địa lý. Mục đích là cung cấp cho sinh viên sự hiểu biết về cấu trúc dữ liệu được sử dụng trong Python để biểu diễn dữ liệu không gian địa lý (khung dữ liệu không gian địa lý, mảng (đa chiều) và tập dữ liệu đa chiều giống netCDF tổng hợp), đồng thời cung cấp các con trỏ đến hệ sinh thái rộng lớn hơn của các gói Python cho GIS và khoa học địa lý.

Khóa học đã được phát triển như một khóa học chuyên biệt cho các trường Tiến sĩ của Đại học Ghent, nhưng có thể được giảng dạy cho những người khác theo yêu cầu.

Thông tin khóa học
Mục tiêu & phạm vi
Khóa học này nhắm mục tiêu đến các nhà nghiên cứu muốn nâng cao kỹ năng phân tích và thao tác dữ liệu chung của họ bằng Python đặc biệt để xử lý dữ liệu không gian địa lý.

Khóa học không nhằm cung cấp một khóa học về phân tích và thống kê không gian cụ thể, bản đồ, viễn thám, dịch vụ web OGC,… hoặc Quản lý thông tin địa lý (GIS) nói chung. Nó nhằm mục đích cung cấp cho các nhà nghiên cứu phương tiện để giải quyết hiệu quả các nhiệm vụ xử lý dữ liệu không gian thường gặp nhằm tăng hiệu quả tổng thể của nghiên cứu. Khóa học không giải quyết các phần mở rộng GIS Python trên máy tính để bàn như arcpy hoặc pyqgis.

Chương trình
Khóa học được tổ chức trong ba ngày với chương trình sau:

Ngày 1 - Thiết lập môi trường lập trình với các gói bắt buộc bằng trình quản lý gói conda, tóm tắt các khái niệm Python và giới thiệu về GeoPandas và các gói liên quan để làm việc với dữ liệu vectơ không gian địa lý.
Ngày 2 - Giới thiệu về numpy và rasterio để làm việc với dữ liệu raster. Các tính năng nâng cao hơn của GeoPandas cho phép nối và lớp phủ không gian. Kết hợp dữ liệu raster và vector và vẽ biểu đồ nâng cao hơn. Các kỹ năng có được sẽ ngay lập tức được đưa vào thực tế để xử lý các tập dữ liệu trong thế giới thực.
Ngày 3 - Giới thiệu về xarray cho các tập dữ liệu giống netCDF đa chiều. Các nghiên cứu tình huống sâu hơn để áp dụng các kỹ năng đã học của hội thảo đầy đủ. Ngày sẽ kết thúc với tổng quan về các gói khác đang được sử dụng trong hệ sinh thái không gian địa lý của Python (để mở rộng thành các bộ dữ liệu lớn hơn, các khung hình ảnh hóa khác, các gói chuyên dụng).

Bắt đầu
Khóa học sử dụng Python 3, các gói phân tích dữ liệu như Pandas, Numpy và Matplotlib và các gói không gian địa lý như GeoPandas, Rasterio và Xarray. Để cài đặt các thư viện bắt buộc, chúng tôi thực sự khuyên bạn nên dùng Anaconda hoặc miniconda (https://www.anaconda.com/download/) hoặc một bản phân phối Python khác bao gồm các thư viện khoa học (khuyến nghị này áp dụng cho tất cả các nền tảng, vì vậy cho cả Window, Linux và Máy Mac).

Để biết hướng dẫn chi tiết để bắt đầu trên máy cục bộ của bạn, hãy xem hướng dẫn thiết lập.

Trong trường hợp bạn không muốn cài đặt mọi thứ và chỉ muốn dùng thử tài liệu của khóa học, hãy sử dụng thiết lập môi trường bằng Binder Binder và mở sổ ghi chép ngay lập tức.

Slides
Đối với các slide của khóa học, hãy nhấp vào đây.

Đóng góp
Tìm thấy bất kỳ lỗi đánh máy nào hoặc có một đề xuất, hãy xem cách đóng góp.

Meta
Tác giả: Joris Van den Bossche, Stijn Van Hoey

------

Python for GIS and Geoscience

Introduction

An important aspect of daily work in geographic information science and earth sciences is the handling of potentially large amounts of data. Reading in spatial data, exploring the data, creating visualisations and preparing the data for further analysis may become tedious tasks. Hence, increasing efficiency and reproducibility in this process without the need of a GUI interface is beneficial for many scientists. The usage of high-level scripting languages such as R and Python are increasingly popular for these tasks thanks to the development of GIS oriented packages.

This course trains students to use Python effectively to do these tasks, with a focus on geospatial data. It covers both vector and raster data. The course focuses on introducing the main Python packages for handling such data (GeoPandas, Numpy and Rasterio, Xarray) and how to use those packages for importing, exploring, visualizing and manipulating geospatial data. It is the aim to give the students an understanding of the data structures used in Python to represent geospatial data (geospatial dataframes, (multi-dimensional) arrays and composite netCDF-like multi-dimensional datasets), while also providing pointers to the broader ecosystem of Python packages for GIS and geosciences.

The course has been developed as a specialist course for the Doctoral schools of Ghent University, but can be taught to others upon request.

Course info

Aim & scope

This course targets researchers that want to enhance their general data manipulation and analysis skills in Python specifically for handling geospatial data.

The course does not aim to provide a course in specific spatial analysis and statistics, cartography, remote sensing, OGC web services, … or general Geographical Information Management (GIS). It aims to provide researchers the means to effectively tackle commonly encountered spatial data handling tasks in order to increase the overall efficiency of the research. The course does not tackle desktop GIS Python extensions such as arcpy or pyqgis.

Program

The course is organized as a three day course with following program:

  • Day 1 - Setting up the programming environment with the required packages using the conda package manager, a recap of Python concepts and introduction to GeoPandas and related packages to work with geospatial vector data.

  • Day 2 - An introduction to numpy and rasterio for working with raster data. More advanced features of GeoPandas for spatial joins and overlays. Combining raster and vector data and more advanced plotting. The acquired skills will immediately be brought into practice to handle real-world data sets.

  • Day 3 - An introduction to xarray for multi-dimensional netCDF-like datasets. Further case studies to apply the learned skills of the full workshop. The day will end with an overview of other packages that are being used in the geospatial Python ecosystem (to scale to bigger datasets, other visualization frameworks, specialized packages).

Getting started

The course uses Python 3, data analysis packages such as Pandas, Numpy and Matplotlib and geospatial packages such as GeoPandas, Rasterio and Xarray. To install the required libraries, we highly recommend Anaconda or miniconda (https://www.anaconda.com/download/) or another Python distribution that includes the scientific libraries (this recommendation applies to all platforms, so for both Window, Linux and Mac).

For detailed instructions to get started on your local machine , see the setup instructions.

In case you do not want to install everything and just want to try out the course material, use the environment setup by Binder  and open de notebooks rightaway.

Slides

For the course slides, click here.

Contributing

Found any typo or have a suggestion, see how to contribute.

Meta

Authors: Joris Van den Bossche, Stijn Van Hoey

popup

Số lượng:

Tổng tiền: